گوگل در حال عرضه یک مدل هوش مصنوعی جدید است که برای ارائه عملکرد قوی با تمرکز بر کارایی طراحی شده است.
این مدل، Gemini 2.5 Flash، به زودی در Vertex AI، پلتفرم توسعه هوش مصنوعی گوگل، راهاندازی خواهد شد. این شرکت میگوید که این مدل محاسبات “پویا و قابل کنترل” را ارائه میدهد و به توسعهدهندگان اجازه میدهد زمان پردازش را بر اساس پیچیدگی پرس و جوها تنظیم کنند.
گوگل در یک پست وبلاگی که در اختیار تککرانچ قرار داده است، نوشت: “[شما میتوانید] تعادل سرعت، دقت و هزینه را برای نیازهای خاص خود تنظیم کنید. این انعطافپذیری کلید بهینهسازی عملکرد Flash در برنامههای کاربردی با حجم بالا و حساس به هزینه است.”
Gemini 2.5 Flash در حالی از راه میرسد که هزینه مدلهای هوش مصنوعی پیشرو همچنان روند صعودی دارد. مدلهای کارآمد با قیمت پایینتر مانند ۲.۵ Flash، جایگزین جذابی برای گزینههای گرانقیمت و درجه یک، با هزینه کمی کاهش دقت، ارائه میدهند.
Gemini 2.5 Flash یک مدل “استدلال” در راستای o3-mini اوپنایآی و R1 دیپسیک است. این بدان معناست که برای بررسی صحت اطلاعات خود، کمی بیشتر طول میکشد تا به سؤالات پاسخ دهد.
گوگل میگوید که ۲.۵ Flash برای برنامههای کاربردی “با حجم بالا” و “بلادرنگ” مانند خدمات مشتری و تجزیه اسناد ایدهآل است.
گوگل در پست وبلاگ خود گفت: “این مدل پرکاربرد به طور خاص برای تأخیر کم و کاهش هزینه بهینه شده است. این موتور ایدهآل برای دستیارهای مجازی پاسخگو و ابزارهای خلاصهسازی بلادرنگ است، جایی که کارایی در مقیاس بزرگ کلیدی است.”
گوگل گزارش ایمنی یا فنی برای Gemini 2.5 Flash منتشر نکرده است، که تشخیص نقاط قوت و ضعف مدل را دشوارتر میکند. این شرکت قبلاً به تککرانچ گفته بود که برای مدلهایی که آنها را “آزمایشی” میدانند، گزارشی منتشر نمیکند.
گوگل همچنین روز چهارشنبه اعلام کرد که قصد دارد مدلهای Gemini مانند ۲.۵ Flash را از سه ماهه سوم سال جاری به محیطهای محلی بیاورد. مدلهای Gemini این شرکت در Google Distributed Cloud (GDC)، راه حل محلی گوگل برای مشتریانی با الزامات سختگیرانه حاکمیت داده، در دسترس خواهند بود. گوگل میگوید که با Nvidia برای آوردن مدلهای Gemini به سیستمهای Nvidia Blackwell سازگار با GDC که مشتریان میتوانند از طریق گوگل یا کانالهای ترجیحی خود خریداری کنند، همکاری میکند.