خبر
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
زمان مطالعه: 2 دقیقه
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
خبر
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
زمان مطالعه: 2 دقیقه

جمینی ۲.۵ توسط گوگل دیپ‌مایند به عنوان “هوشمندترین مدل هوش مصنوعی” آن تا به امروز مورد تحسین قرار گرفته است.

اولین مدل از این نسل جدید، نسخه آزمایشی جمینی ۲.۵ پرو است که دیپ‌مایند می‌گوید در طیف گسترده‌ای از معیارها به نتایج پیشرفته‌ای دست یافته است.

به گفته کورای کاووکچواوغلو، مدیر ارشد فناوری گوگل دیپ‌مایند، مدل‌های جمینی ۲.۵ “مدل‌های تفکر” هستند. این نشان‌دهنده توانایی آن‌ها در استدلال از طریق افکارشان قبل از تولید پاسخ است که منجر به عملکرد بهتر و دقت بهبود یافته می‌شود.

کاووکچواوغلو توضیح می‌دهد که ظرفیت “استدلال” فراتر از طبقه‌بندی و پیش‌بینی صرف است. این شامل توانایی سیستم در تجزیه و تحلیل اطلاعات، استنتاج نتایج منطقی، گنجاندن زمینه و ظرافت، و در نهایت، تصمیم‌گیری آگاهانه است.

دیپ‌مایند مدتی است که روش‌هایی را برای افزایش هوش و توانایی‌های استدلال هوش مصنوعی با استفاده از تکنیک‌هایی مانند یادگیری تقویتی و درخواست زنجیره تفکر بررسی می‌کند. این کار زمینه‌ساز معرفی اخیر اولین مدل تفکر آن‌ها، جمینی ۲.۰ فلش تفکر شد.

کاووکچواوغلو می‌گوید: “اکنون، با جمینی ۲.۵، با ترکیب یک مدل پایه به طور قابل توجهی بهبود یافته با آموزش پس از آن بهبود یافته، به سطح جدیدی از عملکرد دست یافته‌ایم.”

گوگل قصد دارد این قابلیت‌های تفکر را مستقیماً در تمام مدل‌های آینده خود ادغام کند – و آن‌ها را قادر می‌سازد تا مسائل پیچیده‌تر را حل کنند و از عوامل توانمندتر و آگاه به زمینه پشتیبانی کنند.

جمینی ۲.۵ پرو جایگاه اول جدول رده‌بندی LMArena را به دست می‌آورد

جمینی ۲.۵ پرو آزمایشی به عنوان پیشرفته‌ترین مدل دیپ‌مایند برای مدیریت وظایف پیچیده قرار گرفته است. در زمان نوشتن، با اختلاف قابل توجهی جایگاه اول جدول رده‌بندی LMArena – معیار کلیدی برای ارزیابی ترجیحات انسانی – را به دست آورده است، که نشان‌دهنده یک مدل بسیار توانمند با سبک با کیفیت بالا است:

جمینی 2.5 پرو جایگاه اول جدول رده‌بندی LMArena را به دست می‌آورد.

جمینی ۲.۵ در ریاضیات، علوم، کدنویسی و استدلال “حرفه‌ای” است

جمینی ۲.۵ پرو در معیارهای مختلفی که نیازمند استدلال پیشرفته هستند، عملکردی پیشرفته از خود نشان داده است.

به طور قابل توجهی، در معیارهای ریاضی و علوم – مانند GPQA و AIME 2025 – بدون تکیه بر تکنیک‌های زمان آزمایش که هزینه‌ها را افزایش می‌دهند، مانند رأی‌گیری اکثریت، پیشتاز است. همچنین در Humanity’s Last Exam، مجموعه‌ای داده که توسط متخصصان موضوعی برای ارزیابی مرز دانش و استدلال انسانی طراحی شده، امتیاز پیشرفته ۱۸.۸٪ را کسب کرد.

دیپ‌مایند تأکید زیادی بر عملکرد کدنویسی داشته است و جمینی ۲.۵ نسبت به مدل قبلی خود، ۲.۰، جهشی قابل توجه را نشان می‌دهد، با بهبودهای بیشتر در دست اجرا. ۲.۵ پرو در ایجاد برنامه‌های کاربردی وب بصری جذاب و برنامه‌های کاربردی کد عاملی، و همچنین تبدیل و ویرایش کد، برتری دارد.

در SWE-Bench Verified، استاندارد صنعتی برای ارزیابی‌های کد عاملی، جمینی ۲.۵ پرو با استفاده از تنظیمات عامل سفارشی، امتیاز ۶۳.۸٪ را کسب کرد. قابلیت‌های استدلال مدل همچنین آن را قادر می‌سازد تا با تولید کد اجرایی از یک خط درخواست، یک بازی ویدیویی ایجاد کند.

ویدیو یوتیوب:

با تکیه بر نقاط قوت مدل‌های قبلی خود

جمینی ۲.۵ بر نقاط قوت اصلی مدل‌های قبلی جمینی، از جمله چندوجهی بودن ذاتی و پنجره متن طولانی، بنا شده است. ۲.۵ پرو با پنجره متن یک میلیون توکنی راه‌اندازی می‌شود و برنامه‌هایی برای گسترش آن به دو میلیون توکن به زودی دارد. این امر مدل را قادر می‌سازد تا مجموعه‌های داده عظیم را درک کند و مسائل پیچیده را از منابع اطلاعاتی متنوع، شامل متن، صدا، تصاویر، ویدئو و حتی کل مخازن کد، مدیریت کند.

توسعه‌دهندگان و شرکت‌ها اکنون می‌توانند آزمایش با جمینی ۲.۵ پرو را در Google AI Studio آغاز کنند. کاربران جمینی پیشرفته نیز می‌توانند از طریق منوی کشویی مدل در پلتفرم‌های دسکتاپ و موبایل به آن دسترسی داشته باشند. این مدل در هفته‌های آینده در Vertex AI عرضه خواهد شد.

گوگل دیپ‌مایند کاربران را تشویق می‌کند تا بازخورد ارائه دهند، که برای بهبود بیشتر قابلیت‌های جمینی استفاده خواهد شد.

منبع: اخبار هوش مصنوعی

اشتراک گذاری:

آخرین مقالات پیشنهادی

دیدگاه‌ها

اشتراک در
اطلاع از
guest
0 Comments
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دیتانید تو مراحل مختلف تحلیل داده می‌تونه به شما کمک کنه:
  1. امکان‌سنجی خواسته‌ها و تطبیق نیازمندی‌ها
  2. استخراج و تمیز کردن دادگان
  3. طراحی مدل‌های مناسب
  4. آموزش مدل براساس داده‌های به‌دست آمده
  5. استقرار مدل

آخرین اخبار

اخبار مشابه

Anthropic برنامه‌ای را برای حمایت از تحقیقات علمی راه‌اندازی می‌کند
Anthropic برنامه‌ای با عنوان "هوش مصنوعی برای علم" راه‌اندازی می‌کند تا از محققانی که روی پروژه‌های علمی "پرکاربرد" کار می‌کنند، با تمرکز بر کاربرد ..
یکی از مدل‌های هوش مصنوعی Gemini گوگل که اخیراً منتشر شده است، در زمینه ایمنی امتیاز بدتری کسب کرده است
گوگل در یک گزارش فنی که این هفته منتشر شد، فاش می‌کند که مدل Gemini 2.5 Flash آن نسبت به Gemini 2.0 Flash احتمال بیشتری دارد که متنی تولید کند که ...
روش جدید قابلیت اطمینان گزارش‌های تشخیصی رادیولوژیست‌ها را ارزیابی و بهبود می‌بخشد
به دلیل ابهام ذاتی در تصاویر پزشکی مانند اشعه ایکس، رادیولوژیست‌ها اغلب هنگام توصیف وجود یک آسیب‌شناسی خاص، مانند ذات‌الریه، از کلماتی مانند "ممکن ..