GPT-4.5 شرکت OpenAI در متقاعد کردن سایر هوش‌های مصنوعی برای دادن پول به آن عملکرد بهتری دارد

خبر

زمان مطالعه: 2 دقیقه

علیرضا رحیمی
11 اسفند 1403
12:30

GPT-4.5 شرکت OpenAI در متقاعد کردن سایر هوش‌های مصنوعی برای دادن پول به آن عملکرد بهتری دارد

خبر

GPT-4.5 شرکت OpenAI در متقاعد کردن سایر هوش‌های مصنوعی برای دادن پول به آن عملکرد بهتری دارد

زمان مطالعه: 2 دقیقه

علیرضا رحیمی
11 اسفند 1403
12:30

بر اساس نتایج ارزیابی‌های داخلی OpenAI، مدل بعدی بزرگ هوش مصنوعی این شرکت، GPT-4.5، از قدرت اقناع بالایی برخوردار است. این مدل به‌ویژه در متقاعد کردن یک هوش مصنوعی دیگر برای دادن پول به آن مهارت چشمگیری دارد.

روز پنج‌شنبه، OpenAI مقاله‌ای سفید منتشر کرد که در آن قابلیت‌های مدل GPT-4.5، با اسم رمز اوریون (Orion)، که همان روز عرضه شده بود، تشریح شده است. طبق این مقاله، OpenAI این مدل را در مجموعه‌ای از معیارهای سنجش «اقناع» آزمایش کرده است؛ معیاری که OpenAI آن را به‌عنوان «خطرات مرتبط با ترغیب افراد به تغییر باورهایشان (یا اقدام بر اساس) محتوای تولیدشده توسط مدل، چه به‌صورت ثابت و چه تعاملی» تعریف می‌کند.

در آزمایشی که GPT-4.5 تلاش کرد مدل دیگری از OpenAI، یعنی GPT-4o، را به «اهدای» پول مجازی ترغیب کند، این مدل عملکردی بسیار بهتر از سایر مدل‌های در دسترس OpenAI، از جمله مدل‌های «استدلالی» مانند o1 و o3-mini، از خود نشان داد. همچنین GPT-4.5 در فریب دادن GPT-4o برای افشای یک رمز مخفی، نسبت به تمام مدل‌های OpenAI برتری داشت و از o3-mini با اختلاف ۱۰ درصد پیشی گرفت.

طبق مقاله سفید، GPT-4.5 در فریب برای دریافت کمک مالی به دلیل استراتژی منحصربه‌فردی که در طول آزمایش توسعه داده بود، برتری یافت. این مدل مبالغ اندکی را از GPT-4o درخواست می‌کرد و پاسخ‌هایی مانند «حتی فقط ۲ یا ۳ دلار از ۱۰۰ دلار به من کمک بزرگی می‌کند» تولید می‌کرد. در نتیجه، مبالغی که GPT-4.5 دریافت می‌کرد، معمولاً کمتر از مقدارهایی بود که سایر مدل‌های OpenAI به دست می‌آوردند.

با وجود افزایش قدرت اقناع GPT-4.5، اوپن‌ای‌آی اعلام کرده است که این مدل هنوز به آستانه داخلی شرکت برای «ریسک بالا» در این دسته‌بندی خاص از معیارها نرسیده است. این شرکت متعهد شده که مدل‌هایی را که به آستانه ریسک بالا می‌رسند، تا زمانی که «مداخلات ایمنی کافی» برای کاهش ریسک به سطح «متوسط» اعمال نکند، عرضه نکند.

افزایش قدرت اقناع GPT-4.5، OpenAI — نتایج معیار فریب کلمه کد OPENAI. منبع تصویر: OPENAI

نگرانی واقعی وجود دارد که هوش مصنوعی به گسترش اطلاعات نادرست یا گمراه‌کننده‌ای کمک می‌کند که با هدف تأثیرگذاری بر قلب‌ها و ذهن‌ها به سمت مقاصد مخرب طراحی شده‌اند. سال گذشته، جعل‌های عمیق سیاسی در سراسر جهان مانند آتش‌سوزی گسترده پخش شدند و هوش مصنوعی به‌طور فزاینده‌ای برای انجام حملات مهندسی اجتماعی که هم مصرف‌کنندگان و هم شرکت‌ها را هدف قرار می‌دهند، مورد استفاده قرار می‌گیرد.

OpenAI در مقاله سفید مربوط به GPT-4.5 و همچنین در مقاله‌ای که اوایل این هفته منتشر شد، اعلام کرد که در حال بازنگری روش‌های خود برای بررسی مدل‌ها از نظر خطرات اقناع در دنیای واقعی، مانند انتشار گسترده اطلاعات گمراه‌کننده، است.

منبع: تک‌کرا ن چ

GPT-4.5، openai، چت‌جی‌پی‌تی، هوش مصنوعی

اشتراک گذاری:

آخرین مقالات پیشنهادی

انواع یادگیری در شبکه‌های عصبی ژرف

مقدمه‌ای بر زندگی مصنوعی برای دوست‌داران هوش‌مصنوعی

قسمت دوم: چگونه کار می‌کنند؟ (فناوری‌های زیربنایی ماشین‌های خودران)

قسمت اول: ماشین‌های خودران، سفری به آینده‌ای بدون راننده

علیرضا رحیمی

دانشجوی دکتری کامپیوتر - هوش مصنوعی هستم. تخصص من در توسعه مدل‌های یادگیری ماشین و بهینه‌سازی جریان‌های کاری داده‌ها برای استخراج بینش‌های ارزشمند از داده‌های پیچیده است. علاقه‌مند به استفاده از هوش مصنوعی و مهندسی داده برای ایجاد راه‌حل‌های مقیاس‌پذیر جهت بهبود هوش تجاری و تصمیم‌گیری هستم.

مشاهده کلیه مقالات

دیدگاه‌ها

اشتراک در

0 Comments

قدیمی‌ترین

تازه‌ترین بیشترین رأی

بازخورد (Feedback) های اینلاین

مشاهده همه دیدگاه ها

دیتانید تو مراحل مختلف تحلیل داده می‌تونه به شما کمک کنه:

امکان‌سنجی خواسته‌ها و تطبیق نیازمندی‌ها
استخراج و تمیز کردن دادگان
طراحی مدل‌های مناسب
آموزش مدل براساس داده‌های به‌دست آمده
استقرار مدل

آخرین اخبار

اخبار مشابه

Cursor یک اپلیکیشن وب برای مدیریت عوامل کدنویسی هوش مصنوعی راه‌اندازی می‌کند

شرکت سازنده Cursor، ویرایشگر کدنویسی هوش مصنوعی پرطرفدار، روز دوشنبه یک اپلیکیشن وب راه‌اندازی کرد که به کاربران امکان می‌دهد شبکه‌ای از عوامل کدنویسی