یکی از مدل‌های هوش مصنوعی Gemini گوگل که اخیراً منتشر شده است، در زمینه ایمنی امتیاز بدتری کسب کرده است

خبر

زمان مطالعه: 3 دقیقه

علیرضا رحیمی
26 اردیبهشت 1404
17:50

یکی از مدل‌های هوش مصنوعی Gemini گوگل که اخیراً منتشر شده است، در زمینه ایمنی امتیاز بدتری کسب کرده است

خبر

یکی از مدل‌های هوش مصنوعی Gemini گوگل که اخیراً منتشر شده است، در زمینه ایمنی امتیاز بدتری کسب کرده است

زمان مطالعه: 3 دقیقه

علیرضا رحیمی
26 اردیبهشت 1404
17:50

گوگل در یک گزارش فنی که این هفته منتشر شد، فاش می‌کند که مدل Gemini 2.5 Flash آن نسبت به Gemini 2.0 Flash احتمال بیشتری دارد که متنی تولید کند که دستورالعمل‌های ایمنی آن را نقض می‌کند. در دو معیار “ایمنی متن به متن” و “ایمنی تصویر به متن”، Gemini 2.5 Flash به ترتیب ۴.۱٪ و ۹.۶٪ پسرفت داشته است.

ایمنی متن به متن میزان دفعاتی را اندازه‌گیری می‌کند که یک مدل با توجه به یک دستور، دستورالعمل‌های گوگل را نقض می‌کند، در حالی که ایمنی تصویر به متن ارزیابی می‌کند که مدل هنگام دریافت دستور با استفاده از یک تصویر، چقدر به این مرزها پایبند است. هر دو تست خودکار هستند و توسط انسان نظارت نمی‌شوند.

سخنگوی گوگل در بیانیه‌ای که از طریق ایمیل ارسال شد، تأیید کرد که Gemini 2.5 Flash “در ایمنی متن به متن و تصویر به متن عملکرد بدتری دارد.”

این نتایج شگفت‌انگیز محک‌زنی در حالی منتشر می‌شود که شرکت‌های هوش مصنوعی در حال حرکت به سمت مجازتر کردن مدل‌های خود هستند – به عبارت دیگر، احتمال کمتری دارد که از پاسخ دادن به موضوعات بحث‌برانگیز یا حساس خودداری کنند. متا برای آخرین مجموعه مدل‌های Llama خود اعلام کرد که مدل‌ها را طوری تنظیم کرده است که “دیدگاه‌های خاصی را بر دیدگاه‌های دیگر تأیید نکنند” و به دستورات سیاسی “مورد بحث” بیشتری پاسخ دهند. OpenAI در اوایل سال جاری اعلام کرد که مدل‌های آینده را طوری تنظیم می‌کند که موضعی تحریری اتخاذ نکنند و دیدگاه‌های متعددی را در مورد موضوعات بحث‌برانگیز ارائه دهند.

گاهی اوقات، این تلاش‌های مجازگرایانه نتیجه معکوس داده است. TechCrunch روز دوشنبه گزارش داد که مدل پیش‌فرض ChatGPT OpenAI به افراد زیر سن قانونی اجازه می‌دهد مکالمات شهوانی تولید کنند. OpenAI این رفتار را ناشی از یک “باگ” دانست.

طبق گزارش فنی گوگل، Gemini 2.5 Flash، که هنوز در مرحله پیش‌نمایش است، دستورالعمل‌ها را وفادارانه‌تر از Gemini 2.0 Flash دنبال می‌کند، از جمله دستورالعمل‌هایی که از خطوط مشکل‌ساز عبور می‌کنند. این شرکت ادعا می‌کند که این پسرفت‌ها تا حدی به مثبت کاذب نسبت داده می‌شود، اما همچنین اعتراف می‌کند که Gemini 2.5 Flash گاهی اوقات هنگام درخواست صریح، “محتوای ناقض” تولید می‌کند.

در این گزارش آمده است: “طبیعتاً، بین [پیروی از دستورالعمل] در موضوعات حساس و نقض سیاست‌های ایمنی، تنشی وجود دارد که در سراسر ارزیابی‌های ما منعکس شده است.”

نمرات SpeechMap، یک محک‌زنی که نحوه پاسخگویی مدل‌ها به دستورات حساس و بحث‌برانگیز را بررسی می‌کند، همچنین نشان می‌دهد که Gemini 2.5 Flash در مقایسه با Gemini 2.0 Flash احتمال بسیار کمتری دارد که از پاسخ دادن به سؤالات بحث‌برانگیز خودداری کند. آزمایش TechCrunch از این مدل از طریق پلتفرم هوش مصنوعی OpenRouter نشان داد که این مدل بدون هیچ اعتراضی مقالاتی در حمایت از جایگزینی قضات انسانی با هوش مصنوعی، تضعیف حمایت‌های دادرسی عادلانه در ایالات متحده و اجرای برنامه‌های نظارت دولتی گسترده بدون حکم می‌نویسد.

توماس وودساید، یکی از بنیانگذاران پروژه Secure AI، گفت که جزئیات محدود ارائه شده توسط گوگل در گزارش فنی آن، نیاز به شفافیت بیشتر در آزمایش مدل را نشان می‌دهد.

وودساید به TechCrunch گفت: “بین پیروی از دستورالعمل و پیروی از سیاست یک بده‌بستان وجود دارد، زیرا برخی از کاربران ممکن است محتوایی را درخواست کنند که سیاست‌ها را نقض کند. در این مورد، آخرین مدل Flash گوگل بیشتر از دستورالعمل‌ها پیروی می‌کند در حالی که سیاست‌ها را نیز بیشتر نقض می‌کند. گوگل جزئیات زیادی در مورد موارد خاص نقض سیاست‌ها ارائه نمی‌دهد، اگرچه می‌گوید که شدید نیستند. بدون دانستن بیشتر، برای تحلیلگران مستقل دشوار است که بدانند آیا مشکلی وجود دارد یا خیر.”

گوگل قبلاً نیز به دلیل شیوه‌های گزارش‌دهی ایمنی مدل خود مورد انتقاد قرار گرفته است.

هفته‌ها طول کشید تا این شرکت گزارش فنی مربوط به توانمندترین مدل خود، Gemini 2.5 Pro، را منتشر کند. هنگامی که این گزارش در نهایت منتشر شد، در ابتدا جزئیات کلیدی آزمایش ایمنی را حذف کرده بود.

روز دوشنبه، گوگل گزارش مفصل‌تری با اطلاعات ایمنی بیشتر منتشر کرد.

منبع: تک‌کرانچ

Gemini، اخبار مدل‌ها، امنیت هوش مصنوعی، جمینای، گوگل جمینی، مدل‌های Gemini گوگل

اشتراک گذاری:

آخرین مقالات پیشنهادی

انواع یادگیری در شبکه‌های عصبی ژرف

مقدمه‌ای بر زندگی مصنوعی برای دوست‌داران هوش‌مصنوعی

قسمت دوم: چگونه کار می‌کنند؟ (فناوری‌های زیربنایی ماشین‌های خودران)

قسمت اول: ماشین‌های خودران، سفری به آینده‌ای بدون راننده

علیرضا رحیمی

دانشجوی دکتری کامپیوتر - هوش مصنوعی هستم. تخصص من در توسعه مدل‌های یادگیری ماشین و بهینه‌سازی جریان‌های کاری داده‌ها برای استخراج بینش‌های ارزشمند از داده‌های پیچیده است. علاقه‌مند به استفاده از هوش مصنوعی و مهندسی داده برای ایجاد راه‌حل‌های مقیاس‌پذیر جهت بهبود هوش تجاری و تصمیم‌گیری هستم.

مشاهده کلیه مقالات

دیدگاه‌ها

اشتراک در

0 Comments

قدیمی‌ترین

تازه‌ترین بیشترین رأی

بازخورد (Feedback) های اینلاین

مشاهده همه دیدگاه ها

دیتانید تو مراحل مختلف تحلیل داده می‌تونه به شما کمک کنه:

امکان‌سنجی خواسته‌ها و تطبیق نیازمندی‌ها
استخراج و تمیز کردن دادگان
طراحی مدل‌های مناسب
آموزش مدل براساس داده‌های به‌دست آمده
استقرار مدل

آخرین اخبار

اخبار مشابه

Cursor یک اپلیکیشن وب برای مدیریت عوامل کدنویسی هوش مصنوعی راه‌اندازی می‌کند

شرکت سازنده Cursor، ویرایشگر کدنویسی هوش مصنوعی پرطرفدار، روز دوشنبه یک اپلیکیشن وب راه‌اندازی کرد که به کاربران امکان می‌دهد شبکه‌ای از عوامل کدنویسی

cursor ai، اخبار مدل‌ها، برنامه نویسی با هوش مصنوعی، دستیار کدنویسی، دستیار کدنویسی هوش مصنوعی، کدنویسی، کدنویسی هوش مصنوعی، هوش مصنوعی

علیرضا رحیمی

۱۰ تیر ۱۴۰۴

گوگل از Gemini CLI، یک ابزار هوش مصنوعی متن‌باز برای ترمینال‌ها رونمایی کرد

گوگل در حال راه‌اندازی یک ابزار هوش مصنوعی عاملی جدید است که مدل‌های هوش مصنوعی Gemini آن را به محل کدنویسی توسعه‌دهندگان نزدیک‌تر می‌کند...

ابزار هوش مصنوعی گوگل، اخبار مدل‌ها، جمینای، گوگل جمینی، مدل متن‌باز، مدل هوش مصنوعی متن باز، مدل‌های Gemini گوگل، هوش مصنوعی، هوش مصنوعی گوگل

علیرضا رحیمی

۱۰ تیر ۱۴۰۴

Midjourney اولین مدل تولید ویدیوی هوش مصنوعی خود، V1 را راه‌اندازی کرد

Midjourney، یکی از محبوب‌ترین استارت‌آپ‌های تولید تصویر هوش مصنوعی، روز چهارشنبه راه‌اندازی مدل تولید ویدیوی هوش مصنوعی مورد انتظار خود، V1 را اعلام ک

Midjourney، اخبار مدل‌ها، تولید ویدیو با هوش مصنوعی، میدجرنی، هوش مصنوعی

علیرضا رحیمی

۱۰ تیر ۱۴۰۴

تحلیل‌هاتو به ما بسپار |‌ ارائه‌ی راهکارهای جامع مبتنی بر داده

دسترسی سریع

شبکه‌های اجتماعی

تمامی حقوق مادی و معنوی این وبسایت متعلق به مجموعه دیتانید است. (نسخه 2)

اشتراک گذاری:

انواع یادگیری در شبکه‌های عصبی ژرف

مقدمه‌ای بر زندگی مصنوعی برای دوست‌داران هوش‌مصنوعی

قسمت دوم: چگونه کار می‌کنند؟ (فناوری‌های زیربنایی ماشین‌های خودران)

قسمت اول: ماشین‌های خودران، سفری به آینده‌ای بدون راننده

علیرضا رحیمی

Cursor یک اپلیکیشن وب برای مدیریت عوامل کدنویسی هوش مصنوعی راه‌اندازی می‌کند

گوگل Doppl را راه‌اندازی کرد، یک اپلیکیشن جدید که به شما امکان می‌دهد تصور کنید یک لباس چگونه بر تنتان به نظر می‌رسد

گوگل از Gemini CLI، یک ابزار هوش مصنوعی متن‌باز برای ترمینال‌ها رونمایی کرد

Midjourney اولین مدل تولید ویدیوی هوش مصنوعی خود، V1 را راه‌اندازی کرد

مدل‌های هوش مصنوعی ارتقاءیافته اپل در زمینه عملکرد، ناامیدکننده ظاهر شدند

ادعای محقق سابق OpenAI: چت‌جی‌پی‌تی در سناریوهای تهدیدکننده زندگی از خاموش شدن جلوگیری می‌کند

دسترسی سریع

شبکه‌های اجتماعی