خبر
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
زمان مطالعه: 2 دقیقه
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
خبر
جمینی 2.5: گوگل "هوشمندترین" مدل هوش مصنوعی خود را تا به امروز ارائه می‌کند
زمان مطالعه: 2 دقیقه

جمینی ۲.۵ توسط گوگل دیپ‌مایند به عنوان “هوشمندترین مدل هوش مصنوعی” آن تا به امروز مورد تحسین قرار گرفته است.

اولین مدل از این نسل جدید، نسخه آزمایشی جمینی ۲.۵ پرو است که دیپ‌مایند می‌گوید در طیف گسترده‌ای از معیارها به نتایج پیشرفته‌ای دست یافته است.

به گفته کورای کاووکچواوغلو، مدیر ارشد فناوری گوگل دیپ‌مایند، مدل‌های جمینی ۲.۵ “مدل‌های تفکر” هستند. این نشان‌دهنده توانایی آن‌ها در استدلال از طریق افکارشان قبل از تولید پاسخ است که منجر به عملکرد بهتر و دقت بهبود یافته می‌شود.

کاووکچواوغلو توضیح می‌دهد که ظرفیت “استدلال” فراتر از طبقه‌بندی و پیش‌بینی صرف است. این شامل توانایی سیستم در تجزیه و تحلیل اطلاعات، استنتاج نتایج منطقی، گنجاندن زمینه و ظرافت، و در نهایت، تصمیم‌گیری آگاهانه است.

دیپ‌مایند مدتی است که روش‌هایی را برای افزایش هوش و توانایی‌های استدلال هوش مصنوعی با استفاده از تکنیک‌هایی مانند یادگیری تقویتی و درخواست زنجیره تفکر بررسی می‌کند. این کار زمینه‌ساز معرفی اخیر اولین مدل تفکر آن‌ها، جمینی ۲.۰ فلش تفکر شد.

کاووکچواوغلو می‌گوید: “اکنون، با جمینی ۲.۵، با ترکیب یک مدل پایه به طور قابل توجهی بهبود یافته با آموزش پس از آن بهبود یافته، به سطح جدیدی از عملکرد دست یافته‌ایم.”

گوگل قصد دارد این قابلیت‌های تفکر را مستقیماً در تمام مدل‌های آینده خود ادغام کند – و آن‌ها را قادر می‌سازد تا مسائل پیچیده‌تر را حل کنند و از عوامل توانمندتر و آگاه به زمینه پشتیبانی کنند.

جمینی ۲.۵ پرو جایگاه اول جدول رده‌بندی LMArena را به دست می‌آورد

جمینی ۲.۵ پرو آزمایشی به عنوان پیشرفته‌ترین مدل دیپ‌مایند برای مدیریت وظایف پیچیده قرار گرفته است. در زمان نوشتن، با اختلاف قابل توجهی جایگاه اول جدول رده‌بندی LMArena – معیار کلیدی برای ارزیابی ترجیحات انسانی – را به دست آورده است، که نشان‌دهنده یک مدل بسیار توانمند با سبک با کیفیت بالا است:

جمینی 2.5 پرو جایگاه اول جدول رده‌بندی LMArena را به دست می‌آورد.

جمینی ۲.۵ در ریاضیات، علوم، کدنویسی و استدلال “حرفه‌ای” است

جمینی ۲.۵ پرو در معیارهای مختلفی که نیازمند استدلال پیشرفته هستند، عملکردی پیشرفته از خود نشان داده است.

به طور قابل توجهی، در معیارهای ریاضی و علوم – مانند GPQA و AIME 2025 – بدون تکیه بر تکنیک‌های زمان آزمایش که هزینه‌ها را افزایش می‌دهند، مانند رأی‌گیری اکثریت، پیشتاز است. همچنین در Humanity’s Last Exam، مجموعه‌ای داده که توسط متخصصان موضوعی برای ارزیابی مرز دانش و استدلال انسانی طراحی شده، امتیاز پیشرفته ۱۸.۸٪ را کسب کرد.

دیپ‌مایند تأکید زیادی بر عملکرد کدنویسی داشته است و جمینی ۲.۵ نسبت به مدل قبلی خود، ۲.۰، جهشی قابل توجه را نشان می‌دهد، با بهبودهای بیشتر در دست اجرا. ۲.۵ پرو در ایجاد برنامه‌های کاربردی وب بصری جذاب و برنامه‌های کاربردی کد عاملی، و همچنین تبدیل و ویرایش کد، برتری دارد.

در SWE-Bench Verified، استاندارد صنعتی برای ارزیابی‌های کد عاملی، جمینی ۲.۵ پرو با استفاده از تنظیمات عامل سفارشی، امتیاز ۶۳.۸٪ را کسب کرد. قابلیت‌های استدلال مدل همچنین آن را قادر می‌سازد تا با تولید کد اجرایی از یک خط درخواست، یک بازی ویدیویی ایجاد کند.

ویدیو یوتیوب:

با تکیه بر نقاط قوت مدل‌های قبلی خود

جمینی ۲.۵ بر نقاط قوت اصلی مدل‌های قبلی جمینی، از جمله چندوجهی بودن ذاتی و پنجره متن طولانی، بنا شده است. ۲.۵ پرو با پنجره متن یک میلیون توکنی راه‌اندازی می‌شود و برنامه‌هایی برای گسترش آن به دو میلیون توکن به زودی دارد. این امر مدل را قادر می‌سازد تا مجموعه‌های داده عظیم را درک کند و مسائل پیچیده را از منابع اطلاعاتی متنوع، شامل متن، صدا، تصاویر، ویدئو و حتی کل مخازن کد، مدیریت کند.

توسعه‌دهندگان و شرکت‌ها اکنون می‌توانند آزمایش با جمینی ۲.۵ پرو را در Google AI Studio آغاز کنند. کاربران جمینی پیشرفته نیز می‌توانند از طریق منوی کشویی مدل در پلتفرم‌های دسکتاپ و موبایل به آن دسترسی داشته باشند. این مدل در هفته‌های آینده در Vertex AI عرضه خواهد شد.

گوگل دیپ‌مایند کاربران را تشویق می‌کند تا بازخورد ارائه دهند، که برای بهبود بیشتر قابلیت‌های جمینی استفاده خواهد شد.

منبع: اخبار هوش مصنوعی

اشتراک گذاری:

آخرین مقالات پیشنهادی

دیدگاه‌ها

اشتراک در
اطلاع از
guest
0 Comments
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دیتانید تو مراحل مختلف تحلیل داده می‌تونه به شما کمک کنه:
  1. امکان‌سنجی خواسته‌ها و تطبیق نیازمندی‌ها
  2. استخراج و تمیز کردن دادگان
  3. طراحی مدل‌های مناسب
  4. آموزش مدل براساس داده‌های به‌دست آمده
  5. استقرار مدل

آخرین اخبار

اخبار مشابه

Anthropic اشتراک ماهانه 200 دلاری Claude را عرضه می‌کند
Anthropic روز چهارشنبه اعلام کرد که در حال راه‌اندازی یک طرح اشتراک بسیار گران‌قیمت جدید برای چت‌بات هوش مصنوعی خود، Claude: Max است. Max که پاسخی ...
OpenAI برنامه‌ای را برای طراحی معیارهای جدید هوش مصنوعی «خاص دامنه» راه‌اندازی می‌کند
OpenAI معتقد است که معیارهای هوش مصنوعی مشکل دارند. اکنون این شرکت برنامه‌ای را برای اصلاح نحوه امتیازدهی مدل‌های هوش مصنوعی راه‌اندازی می‌کند...
مطالعه MIT نشان می‌دهد که هوش مصنوعی در واقع ارزش ندارد.
مطالعه‌ای چند ماه پیش به دلیل این ادعا که با پیچیده‌تر شدن هوش مصنوعی، "سیستم‌های ارزشی" توسعه می‌دهد - سیستم‌هایی که آن را به عنوان مثال، به ...