افراد اکنون از سوپر ماریو برای ارزیابی و سنجش هوش مصنوعی استفاده می‌نمایند

خبر

زمان مطالعه: 2 دقیقه

علیرضا رحیمی
16 اسفند 1403
09:18

افراد اکنون از سوپر ماریو برای ارزیابی و سنجش هوش مصنوعی استفاده می‌نمایند

خبر

افراد اکنون از سوپر ماریو برای ارزیابی و سنجش هوش مصنوعی استفاده می‌نمایند

زمان مطالعه: 2 دقیقه

علیرضا رحیمی
16 اسفند 1403
09:18

فکر می‌کردید پوکمون معیار دشواری برای هوش مصنوعی باشد؟ گروهی از پژوهشگران معتقدند که سوپر ماریو بروس حتی چالش‌برانگیزتر است.

آزمایشگاه هوش مصنوعی هائو، یک سازمان پژوهشی در دانشگاه کالیفرنیا سن‌دیگو، روز جمعه هوش مصنوعی را در بازی‌های زنده سوپر ماریو بروس به کار گرفت. مدل Claude 3.7 از شرکت Anthropic بهترین عملکرد را نشان داد و پس از آن Claude 3.5 قرار گرفت. مدل‌های Gemini 1.5 Pro از گوگل و GPT-4o از OpenAI با دشواری‌هایی مواجه شدند.

البته باید روشن شود که این نسخه دقیقاً همان سوپر ماریو بروس اصلی منتشرشده در سال ۱۹۸۵ نبود. بازی در یک شبیه‌ساز اجرا شد و با چارچوبی به نام GamingAgent ادغام گردید تا هوش مصنوعی بتواند کنترل ماریو را در دست بگیرد.

بازی سوپر ماریو — منبع تصویر: آزمایشگاه هائو

GamingAgent، که توسط آزمایشگاه هائو به‌صورت داخلی توسعه یافته است، دستورالعمل‌های ساده‌ای مانند «اگر مانع یا دشمنی نزدیک باشد، برای جاخالی دادن به چپ حرکت کن یا بپر» و همچنین تصاویر درون‌بازی را به هوش مصنوعی ارائه می‌داد. سپس هوش مصنوعی ورودی‌هایی به‌صورت کد پایتون تولید می‌کرد تا ماریو را کنترل کند.

با این حال، هائو می‌گوید که این بازی هر مدل را مجبور کرد تا «یاد بگیرد» چگونه مانورهای پیچیده را برنامه‌ریزی کند و استراتژی‌های بازی را توسعه دهد. جالب آنکه، آزمایشگاه دریافت مدل‌های استدلالی مانند o1 از OpenAI، که مسائل را گام‌به‌گام «فکر» می‌کنند تا به راه‌حل برسند، در مقایسه با مدل‌های «غیراستدلالی» عملکرد ضعیف‌تری داشتند، با وجود آنکه معمولاً در اکثر معیارها قوی‌تر هستند.

یکی از دلایل اصلی مشکل مدل‌های استدلالی در بازی‌های بلادرنگ مانند این، به گفته پژوهشگران، این است که تصمیم‌گیری برای اقدامات در آن‌ها زمان‌بر است — معمولاً چند ثانیه —. در سوپر ماریو بروس، زمان‌بندی همه‌چیز است. یک ثانیه می‌تواند تفاوت بین پرشی ایمن و سقوط به مرگ را رقم بزند.

بازی‌ها دهه‌هاست که برای سنجش هوش مصنوعی به کار می‌روند. اما برخی کارشناسان درباره عاقلانه بودن برقراری ارتباط بین مهارت‌های بازی هوش مصنوعی و پیشرفت تکنولوژیک تردید دارند. برخلاف دنیای واقعی، بازی‌ها معمولاً انتزاعی و نسبتاً ساده هستند و حجم داده‌ای نامحدود برای آموزش هوش مصنوعی فراهم می‌کنند.

معیارهای نمایشی اخیر در بازی‌ها به آنچه آندری کارپاتی، دانشمند پژوهشی و یکی از بنیان‌گذاران OpenAI، «بحران ارزیابی» نامیده اشاره دارد.

او در پستی در X نوشت: «واقعاً نمی‌دانم الان باید به کدام معیارهای [هوش مصنوعی] نگاه کنم. به‌طور خلاصه، واکنش من این است که واقعاً نمی‌دانم این مدل‌ها الان چقدر خوب هستند.»

حداقل می‌توانیم تماشا کنیم که هوش مصنوعی چگونه ماریو را بازی می‌کند.

منبع: تک‌ک را ن چ

سوپر ماریو، هوش مصنوعی، هوش مصنوعی Claude 3.7 Sonnet

اشتراک گذاری:

آخرین مقالات پیشنهادی

انواع یادگیری در شبکه‌های عصبی ژرف

مقدمه‌ای بر زندگی مصنوعی برای دوست‌داران هوش‌مصنوعی

قسمت دوم: چگونه کار می‌کنند؟ (فناوری‌های زیربنایی ماشین‌های خودران)

قسمت اول: ماشین‌های خودران، سفری به آینده‌ای بدون راننده

علیرضا رحیمی

دانشجوی دکتری کامپیوتر - هوش مصنوعی هستم. تخصص من در توسعه مدل‌های یادگیری ماشین و بهینه‌سازی جریان‌های کاری داده‌ها برای استخراج بینش‌های ارزشمند از داده‌های پیچیده است. علاقه‌مند به استفاده از هوش مصنوعی و مهندسی داده برای ایجاد راه‌حل‌های مقیاس‌پذیر جهت بهبود هوش تجاری و تصمیم‌گیری هستم.

مشاهده کلیه مقالات

دیدگاه‌ها

اشتراک در

0 Comments

قدیمی‌ترین

تازه‌ترین بیشترین رأی

بازخورد (Feedback) های اینلاین

مشاهده همه دیدگاه ها

دیتانید تو مراحل مختلف تحلیل داده می‌تونه به شما کمک کنه:

امکان‌سنجی خواسته‌ها و تطبیق نیازمندی‌ها
استخراج و تمیز کردن دادگان
طراحی مدل‌های مناسب
آموزش مدل براساس داده‌های به‌دست آمده
استقرار مدل

آخرین اخبار

اخبار مشابه

Cursor یک اپلیکیشن وب برای مدیریت عوامل کدنویسی هوش مصنوعی راه‌اندازی می‌کند

شرکت سازنده Cursor، ویرایشگر کدنویسی هوش مصنوعی پرطرفدار، روز دوشنبه یک اپلیکیشن وب راه‌اندازی کرد که به کاربران امکان می‌دهد شبکه‌ای از عوامل کدنویسی