خبر
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
زمان مطالعه: 2 دقیقه
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
خبر
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
زمان مطالعه: 2 دقیقه

جمینی ۲.۵ توسط گوگل دیپ‌مایند به عنوان “هوشمندترین مدل هوش مصنوعی” آن تا به امروز مورد تحسین قرار گرفته است.

اولین مدل از این نسل جدید، نسخه آزمایشی جمینی ۲.۵ پرو است که دیپ‌مایند می‌گوید در طیف گسترده‌ای از معیارها به نتایج پیشرفته‌ای دست یافته است.

به گفته کورای کاووکچواوغلو، مدیر ارشد فناوری گوگل دیپ‌مایند، مدل‌های جمینی ۲.۵ “مدل‌های تفکر” هستند. این نشان‌دهنده توانایی آن‌ها در استدلال از طریق افکارشان قبل از تولید پاسخ است که منجر به عملکرد بهتر و دقت بهبود یافته می‌شود.

کاووکچواوغلو توضیح می‌دهد که ظرفیت “استدلال” فراتر از طبقه‌بندی و پیش‌بینی صرف است. این شامل توانایی سیستم در تجزیه و تحلیل اطلاعات، استنتاج نتایج منطقی، گنجاندن زمینه و ظرافت، و در نهایت، تصمیم‌گیری آگاهانه است.

دیپ‌مایند مدتی است که روش‌هایی را برای افزایش هوش و توانایی‌های استدلال هوش مصنوعی با استفاده از تکنیک‌هایی مانند یادگیری تقویتی و درخواست زنجیره تفکر بررسی می‌کند. این کار زمینه‌ساز معرفی اخیر اولین مدل تفکر آن‌ها، جمینی ۲.۰ فلش تفکر شد.

کاووکچواوغلو می‌گوید: “اکنون، با جمینی ۲.۵، با ترکیب یک مدل پایه به طور قابل توجهی بهبود یافته با آموزش پس از آن بهبود یافته، به سطح جدیدی از عملکرد دست یافته‌ایم.”

گوگل قصد دارد این قابلیت‌های تفکر را مستقیماً در تمام مدل‌های آینده خود ادغام کند – و آن‌ها را قادر می‌سازد تا مسائل پیچیده‌تر را حل کنند و از عوامل توانمندتر و آگاه به زمینه پشتیبانی کنند.

جمینی ۲.۵ پرو جایگاه اول جدول رده‌بندی LMArena را به دست می‌آورد

جمینی ۲.۵ پرو آزمایشی به عنوان پیشرفته‌ترین مدل دیپ‌مایند برای مدیریت وظایف پیچیده قرار گرفته است. در زمان نوشتن، با اختلاف قابل توجهی جایگاه اول جدول رده‌بندی LMArena – معیار کلیدی برای ارزیابی ترجیحات انسانی – را به دست آورده است، که نشان‌دهنده یک مدل بسیار توانمند با سبک با کیفیت بالا است:

جمینی 2.5 پرو جایگاه اول جدول رده‌بندی LMArena را به دست می‌آورد.

جمینی ۲.۵ در ریاضیات، علوم، کدنویسی و استدلال “حرفه‌ای” است

جمینی ۲.۵ پرو در معیارهای مختلفی که نیازمند استدلال پیشرفته هستند، عملکردی پیشرفته از خود نشان داده است.

به طور قابل توجهی، در معیارهای ریاضی و علوم – مانند GPQA و AIME 2025 – بدون تکیه بر تکنیک‌های زمان آزمایش که هزینه‌ها را افزایش می‌دهند، مانند رأی‌گیری اکثریت، پیشتاز است. همچنین در Humanity’s Last Exam، مجموعه‌ای داده که توسط متخصصان موضوعی برای ارزیابی مرز دانش و استدلال انسانی طراحی شده، امتیاز پیشرفته ۱۸.۸٪ را کسب کرد.

دیپ‌مایند تأکید زیادی بر عملکرد کدنویسی داشته است و جمینی ۲.۵ نسبت به مدل قبلی خود، ۲.۰، جهشی قابل توجه را نشان می‌دهد، با بهبودهای بیشتر در دست اجرا. ۲.۵ پرو در ایجاد برنامه‌های کاربردی وب بصری جذاب و برنامه‌های کاربردی کد عاملی، و همچنین تبدیل و ویرایش کد، برتری دارد.

در SWE-Bench Verified، استاندارد صنعتی برای ارزیابی‌های کد عاملی، جمینی ۲.۵ پرو با استفاده از تنظیمات عامل سفارشی، امتیاز ۶۳.۸٪ را کسب کرد. قابلیت‌های استدلال مدل همچنین آن را قادر می‌سازد تا با تولید کد اجرایی از یک خط درخواست، یک بازی ویدیویی ایجاد کند.

ویدیو یوتیوب:

با تکیه بر نقاط قوت مدل‌های قبلی خود

جمینی ۲.۵ بر نقاط قوت اصلی مدل‌های قبلی جمینی، از جمله چندوجهی بودن ذاتی و پنجره متن طولانی، بنا شده است. ۲.۵ پرو با پنجره متن یک میلیون توکنی راه‌اندازی می‌شود و برنامه‌هایی برای گسترش آن به دو میلیون توکن به زودی دارد. این امر مدل را قادر می‌سازد تا مجموعه‌های داده عظیم را درک کند و مسائل پیچیده را از منابع اطلاعاتی متنوع، شامل متن، صدا، تصاویر، ویدئو و حتی کل مخازن کد، مدیریت کند.

توسعه‌دهندگان و شرکت‌ها اکنون می‌توانند آزمایش با جمینی ۲.۵ پرو را در Google AI Studio آغاز کنند. کاربران جمینی پیشرفته نیز می‌توانند از طریق منوی کشویی مدل در پلتفرم‌های دسکتاپ و موبایل به آن دسترسی داشته باشند. این مدل در هفته‌های آینده در Vertex AI عرضه خواهد شد.

گوگل دیپ‌مایند کاربران را تشویق می‌کند تا بازخورد ارائه دهند، که برای بهبود بیشتر قابلیت‌های جمینی استفاده خواهد شد.

منبع: اخبار هوش مصنوعی

اشتراک گذاری:

آخرین مقالات پیشنهادی

دیدگاه‌ها

اشتراک در
اطلاع از
guest
0 Comments
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دیتانید تو مراحل مختلف تحلیل داده می‌تونه به شما کمک کنه:
  1. امکان‌سنجی خواسته‌ها و تطبیق نیازمندی‌ها
  2. استخراج و تمیز کردن دادگان
  3. طراحی مدل‌های مناسب
  4. آموزش مدل براساس داده‌های به‌دست آمده
  5. استقرار مدل

آخرین اخبار

اخبار مشابه

Cursor یک اپلیکیشن وب برای مدیریت عوامل کدنویسی هوش مصنوعی راه‌اندازی می‌کند
شرکت سازنده Cursor، ویرایشگر کدنویسی هوش مصنوعی پرطرفدار، روز دوشنبه یک اپلیکیشن وب راه‌اندازی کرد که به کاربران امکان می‌دهد شبکه‌ای از عوامل کدنویسی
گوگل Doppl را راه‌اندازی کرد، یک اپلیکیشن جدید که به شما امکان می‌دهد تصور کنید یک لباس چگونه بر تنتان به نظر می‌رسد
گوگل روز پنجشنبه اعلام کرد که در حال راه‌اندازی یک اپلیکیشن آزمایشی جدید به نام Doppl است که از هوش مصنوعی برای تجسم نحوه نمایش لباس‌های مختلف ...
گوگل از Gemini CLI، یک ابزار هوش مصنوعی متن‌باز برای ترمینال‌ها رونمایی کرد
گوگل در حال راه‌اندازی یک ابزار هوش مصنوعی عاملی جدید است که مدل‌های هوش مصنوعی Gemini آن را به محل کدنویسی توسعه‌دهندگان نزدیک‌تر می‌کند...