خبر
افراد اکنون از سوپر ماریو برای ارزیابی و سنجش هوش مصنوعی استفاده می‌نمایند
زمان مطالعه: 2 دقیقه
افراد اکنون از سوپر ماریو برای ارزیابی و سنجش هوش مصنوعی استفاده می‌نمایند
افراد اکنون از سوپر ماریو برای ارزیابی و سنجش هوش مصنوعی استفاده می‌نمایند
خبر
افراد اکنون از سوپر ماریو برای ارزیابی و سنجش هوش مصنوعی استفاده می‌نمایند
زمان مطالعه: 2 دقیقه

فکر می‌کردید پوکمون معیار دشواری برای هوش مصنوعی باشد؟ گروهی از پژوهشگران معتقدند که سوپر ماریو بروس حتی چالش‌برانگیزتر است.

آزمایشگاه هوش مصنوعی هائو، یک سازمان پژوهشی در دانشگاه کالیفرنیا سن‌دیگو، روز جمعه هوش مصنوعی را در بازی‌های زنده سوپر ماریو بروس به کار گرفت. مدل Claude 3.7 از شرکت Anthropic بهترین عملکرد را نشان داد و پس از آن Claude 3.5 قرار گرفت. مدل‌های Gemini 1.5 Pro از گوگل و GPT-4o از OpenAI با دشواری‌هایی مواجه شدند.

البته باید روشن شود که این نسخه دقیقاً همان سوپر ماریو بروس اصلی منتشرشده در سال ۱۹۸۵ نبود. بازی در یک شبیه‌ساز اجرا شد و با چارچوبی به نام GamingAgent ادغام گردید تا هوش مصنوعی بتواند کنترل ماریو را در دست بگیرد.

بازی  سوپر ماریو
منبع تصویر: آزمایشگاه هائو

GamingAgent، که توسط آزمایشگاه هائو به‌صورت داخلی توسعه یافته است، دستورالعمل‌های ساده‌ای مانند «اگر مانع یا دشمنی نزدیک باشد، برای جاخالی دادن به چپ حرکت کن یا بپر» و همچنین تصاویر درون‌بازی را به هوش مصنوعی ارائه می‌داد. سپس هوش مصنوعی ورودی‌هایی به‌صورت کد پایتون تولید می‌کرد تا ماریو را کنترل کند.

با این حال، هائو می‌گوید که این بازی هر مدل را مجبور کرد تا «یاد بگیرد» چگونه مانورهای پیچیده را برنامه‌ریزی کند و استراتژی‌های بازی را توسعه دهد. جالب آنکه، آزمایشگاه دریافت مدل‌های استدلالی مانند o1 از OpenAI، که مسائل را گام‌به‌گام «فکر» می‌کنند تا به راه‌حل برسند، در مقایسه با مدل‌های «غیراستدلالی» عملکرد ضعیف‌تری داشتند، با وجود آنکه معمولاً در اکثر معیارها قوی‌تر هستند.

یکی از دلایل اصلی مشکل مدل‌های استدلالی در بازی‌های بلادرنگ مانند این، به گفته پژوهشگران، این است که تصمیم‌گیری برای اقدامات در آن‌ها زمان‌بر است — معمولاً چند ثانیه —. در سوپر ماریو بروس، زمان‌بندی همه‌چیز است. یک ثانیه می‌تواند تفاوت بین پرشی ایمن و سقوط به مرگ را رقم بزند.

بازی‌ها دهه‌هاست که برای سنجش هوش مصنوعی به کار می‌روند. اما برخی کارشناسان درباره عاقلانه بودن برقراری ارتباط بین مهارت‌های بازی هوش مصنوعی و پیشرفت تکنولوژیک تردید دارند. برخلاف دنیای واقعی، بازی‌ها معمولاً انتزاعی و نسبتاً ساده هستند و حجم داده‌ای نامحدود برای آموزش هوش مصنوعی فراهم می‌کنند.

معیارهای نمایشی اخیر در بازی‌ها به آنچه آندری کارپاتی، دانشمند پژوهشی و یکی از بنیان‌گذاران OpenAI، «بحران ارزیابی» نامیده اشاره دارد.

او در پستی در X نوشت: «واقعاً نمی‌دانم الان باید به کدام معیارهای [هوش مصنوعی] نگاه کنم. به‌طور خلاصه، واکنش من این است که واقعاً نمی‌دانم این مدل‌ها الان چقدر خوب هستند.»

حداقل می‌توانیم تماشا کنیم که هوش مصنوعی چگونه ماریو را بازی می‌کند.

منبع: تک‌کرانچ

اشتراک گذاری:

آخرین مقالات پیشنهادی

دیدگاه‌ها

اشتراک در
اطلاع از
guest
0 Comments
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دیتانید تو مراحل مختلف تحلیل داده می‌تونه به شما کمک کنه:
  1. امکان‌سنجی خواسته‌ها و تطبیق نیازمندی‌ها
  2. استخراج و تمیز کردن دادگان
  3. طراحی مدل‌های مناسب
  4. آموزش مدل براساس داده‌های به‌دست آمده
  5. استقرار مدل

آخرین اخبار

اخبار مشابه

روش جدید قابلیت اطمینان گزارش‌های تشخیصی رادیولوژیست‌ها را ارزیابی و بهبود می‌بخشد
به دلیل ابهام ذاتی در تصاویر پزشکی مانند اشعه ایکس، رادیولوژیست‌ها اغلب هنگام توصیف وجود یک آسیب‌شناسی خاص، مانند ذات‌الریه، از کلماتی مانند "ممکن ..
فناوری Web3 به ایجاد اطمینان و اعتماد در هوش مصنوعی کمک می‌کند
وعده هوش مصنوعی این است که زندگی همه ما را آسان‌تر خواهد کرد. و با این سهولت بزرگ، پتانسیل سود جدی نیز به همراه می‌آید. سازمان ملل متحد تخمین ...
نینا شیک(نویسنده): تأثیر هوش مصنوعی مولد بر تجارت، سیاست و جامعه
نینا شیک، سخنران و کارشناس برجسته در زمینه هوش مصنوعی مولد است که به دلیل کار پیشگامانه‌اش در تقاطع فناوری، جامعه و ژئوپلیتیک مشهور است...