جمینی ۲.۵ توسط گوگل دیپمایند به عنوان “هوشمندترین مدل هوش مصنوعی” آن تا به امروز مورد تحسین قرار گرفته است.
اولین مدل از این نسل جدید، نسخه آزمایشی جمینی ۲.۵ پرو است که دیپمایند میگوید در طیف گستردهای از معیارها به نتایج پیشرفتهای دست یافته است.
به گفته کورای کاووکچواوغلو، مدیر ارشد فناوری گوگل دیپمایند، مدلهای جمینی ۲.۵ “مدلهای تفکر” هستند. این نشاندهنده توانایی آنها در استدلال از طریق افکارشان قبل از تولید پاسخ است که منجر به عملکرد بهتر و دقت بهبود یافته میشود.
کاووکچواوغلو توضیح میدهد که ظرفیت “استدلال” فراتر از طبقهبندی و پیشبینی صرف است. این شامل توانایی سیستم در تجزیه و تحلیل اطلاعات، استنتاج نتایج منطقی، گنجاندن زمینه و ظرافت، و در نهایت، تصمیمگیری آگاهانه است.
دیپمایند مدتی است که روشهایی را برای افزایش هوش و تواناییهای استدلال هوش مصنوعی با استفاده از تکنیکهایی مانند یادگیری تقویتی و درخواست زنجیره تفکر بررسی میکند. این کار زمینهساز معرفی اخیر اولین مدل تفکر آنها، جمینی ۲.۰ فلش تفکر شد.
کاووکچواوغلو میگوید: “اکنون، با جمینی ۲.۵، با ترکیب یک مدل پایه به طور قابل توجهی بهبود یافته با آموزش پس از آن بهبود یافته، به سطح جدیدی از عملکرد دست یافتهایم.”
گوگل قصد دارد این قابلیتهای تفکر را مستقیماً در تمام مدلهای آینده خود ادغام کند – و آنها را قادر میسازد تا مسائل پیچیدهتر را حل کنند و از عوامل توانمندتر و آگاه به زمینه پشتیبانی کنند.
جمینی ۲.۵ پرو جایگاه اول جدول ردهبندی LMArena را به دست میآورد
جمینی ۲.۵ پرو آزمایشی به عنوان پیشرفتهترین مدل دیپمایند برای مدیریت وظایف پیچیده قرار گرفته است. در زمان نوشتن، با اختلاف قابل توجهی جایگاه اول جدول ردهبندی LMArena – معیار کلیدی برای ارزیابی ترجیحات انسانی – را به دست آورده است، که نشاندهنده یک مدل بسیار توانمند با سبک با کیفیت بالا است:

جمینی ۲.۵ در ریاضیات، علوم، کدنویسی و استدلال “حرفهای” است
جمینی ۲.۵ پرو در معیارهای مختلفی که نیازمند استدلال پیشرفته هستند، عملکردی پیشرفته از خود نشان داده است.
به طور قابل توجهی، در معیارهای ریاضی و علوم – مانند GPQA و AIME 2025 – بدون تکیه بر تکنیکهای زمان آزمایش که هزینهها را افزایش میدهند، مانند رأیگیری اکثریت، پیشتاز است. همچنین در Humanity’s Last Exam، مجموعهای داده که توسط متخصصان موضوعی برای ارزیابی مرز دانش و استدلال انسانی طراحی شده، امتیاز پیشرفته ۱۸.۸٪ را کسب کرد.
دیپمایند تأکید زیادی بر عملکرد کدنویسی داشته است و جمینی ۲.۵ نسبت به مدل قبلی خود، ۲.۰، جهشی قابل توجه را نشان میدهد، با بهبودهای بیشتر در دست اجرا. ۲.۵ پرو در ایجاد برنامههای کاربردی وب بصری جذاب و برنامههای کاربردی کد عاملی، و همچنین تبدیل و ویرایش کد، برتری دارد.
در SWE-Bench Verified، استاندارد صنعتی برای ارزیابیهای کد عاملی، جمینی ۲.۵ پرو با استفاده از تنظیمات عامل سفارشی، امتیاز ۶۳.۸٪ را کسب کرد. قابلیتهای استدلال مدل همچنین آن را قادر میسازد تا با تولید کد اجرایی از یک خط درخواست، یک بازی ویدیویی ایجاد کند.
ویدیو یوتیوب:
با تکیه بر نقاط قوت مدلهای قبلی خود
جمینی ۲.۵ بر نقاط قوت اصلی مدلهای قبلی جمینی، از جمله چندوجهی بودن ذاتی و پنجره متن طولانی، بنا شده است. ۲.۵ پرو با پنجره متن یک میلیون توکنی راهاندازی میشود و برنامههایی برای گسترش آن به دو میلیون توکن به زودی دارد. این امر مدل را قادر میسازد تا مجموعههای داده عظیم را درک کند و مسائل پیچیده را از منابع اطلاعاتی متنوع، شامل متن، صدا، تصاویر، ویدئو و حتی کل مخازن کد، مدیریت کند.
توسعهدهندگان و شرکتها اکنون میتوانند آزمایش با جمینی ۲.۵ پرو را در Google AI Studio آغاز کنند. کاربران جمینی پیشرفته نیز میتوانند از طریق منوی کشویی مدل در پلتفرمهای دسکتاپ و موبایل به آن دسترسی داشته باشند. این مدل در هفتههای آینده در Vertex AI عرضه خواهد شد.
گوگل دیپمایند کاربران را تشویق میکند تا بازخورد ارائه دهند، که برای بهبود بیشتر قابلیتهای جمینی استفاده خواهد شد.
منبع: اخبار هوش مصنوعی