DeepSeek V3-0324 در یک دستاورد برجسته برای هوش مصنوعی متنباز، به بالاترین امتیاز مدل غیر استدلالی در شاخص هوش تحلیل مصنوعی تبدیل شده است.
این مدل جدید هفت امتیاز در معیار پیشرفت کرده و از همتایان اختصاصی مانند جمینی ۲.۰ پرو گوگل، کلود ۳.۷ سونت آنتروپیک و لاما ۳.۳ 70B متا پیشی گرفته است.
در حالی که V3-0324 از مدلهای استدلالی، از جمله R1 خود DeepSeek و محصولات OpenAI و علیبابا عقبتر است، این دستاورد بر قابلیت رشد راهحلهای متنباز در برنامههای کاربردی حساس به تأخیر که پاسخهای فوری حیاتی هستند، تأکید میکند.
DeepSeek V3-0324 عصر جدیدی را برای هوش مصنوعی متنباز رقم میزند.
مدلهای غیر استدلالی – که بدون مراحل “فکر کردن” سنجیده، فوراً پاسخ تولید میکنند – برای موارد استفاده در زمان واقعی مانند چتباتها، اتوماسیون خدمات مشتری و ترجمه زنده ضروری هستند. آخرین تکرار DeepSeek اکنون استاندارد این برنامهها را تعیین میکند و حتی از ابزارهای اختصاصی پیشرو نیز پیشی میگیرد.

“این اولین بار است که یک مدل وزنی باز، مدل غیر استدلالی پیشرو است، یک نقطه عطف برای متنباز”، هوش تحلیل مصنوعی اعلام میکند. عملکرد مدل، آن را به مدلهای استدلالی اختصاصی نزدیکتر میکند، اگرچه مدلهای استدلالی برای وظایفی که نیاز به حل مسئله پیچیده دارند، برتر باقی میمانند.
DeepSeek V3-0324 اکثر مشخصات مدل قبلی خود در دسامبر ۲۰۲۴ را حفظ میکند، از جمله:
- پنجره متن ۱۲۸ هزار توکنی (با محدودیت ۶۴ هزار توکن از طریق API DeepSeek)
- ۶۷۱ میلیارد پارامتر کل، که نیاز به بیش از ۷۰۰ گیگابایت حافظه GPU برای دقت FP8 دارد
- ۳۷ میلیارد پارامتر فعال
- عملکرد فقط متن (بدون پشتیبانی چندوجهی)
- مجوز MIT
“هنوز چیزی نیست که بتوانید در خانه اجرا کنید!” هوش تحلیل مصنوعی با اشاره به نیازهای زیرساختی درجه سازمانی آن، طعنه میزند.
هوش مصنوعی متنباز در حال افزایش رقابت است
در حالی که مدلهای استدلالی اختصاصی مانند DeepSeek R1 تسلط خود را در شاخص هوش گستردهتر حفظ میکنند، این شکاف در حال باریک شدن است.
سه ماه پیش، DeepSeek V3 تقریباً با مدلهای اختصاصی آنتروپیک و گوگل مطابقت داشت، اما از پیشی گرفتن از آنها بازماند. امروز، V3-0324 بهروزرسانیشده نه تنها جایگزینهای متنباز را رهبری میکند، بلکه از تمام رقبای غیر استدلالی اختصاصی نیز عملکرد بهتری دارد.
هوش تحلیل مصنوعی میگوید: “این انتشار احتمالاً حتی از R1 نیز چشمگیرتر است.”
پیشرفت DeepSeek نشاندهنده تغییری در بخش هوش مصنوعی است، جایی که چارچوبهای متنباز به طور فزایندهای با سیستمهای بسته رقابت میکنند. برای توسعهدهندگان و شرکتها، V3-0324 با مجوز MIT یک ابزار قدرتمند و قابل انطباق ارائه میدهد – اگرچه هزینههای محاسباتی آن ممکن است دسترسی را محدود کند.
هوش تحلیل مصنوعی اعلام میکند: “DeepSeek اکنون در حال پیشبرد مرز مدلهای وزنی باز غیر استدلالی است.”
با R2 در افق، جامعه منتظر یک جهش بالقوه دیگر در عملکرد هوش مصنوعی است.
منبع: اخبار هوش مصنوعی