زمانی که OpenAI در ماه دسامبر از مدل هوش مصنوعی “استدلالی” o3 خود رونمایی کرد، با سازندگان ARC-AGI، یک معیار طراحی شده برای آزمایش هوش مصنوعی بسیار توانمند، همکاری کرد تا قابلیتهای o3 را به نمایش بگذارد. ماهها بعد، نتایج بازبینی شدهاند و اکنون کمی کمتر از آنچه در ابتدا به نظر میرسید، چشمگیر هستند.
هفته گذشته، بنیاد جایزه Arc، که مسئول نگهداری و مدیریت ARC-AGI است، هزینههای محاسباتی تقریبی o3 را بهروزرسانی کرد. این سازمان در ابتدا تخمین زده بود که بهترین پیکربندی o3 که آزمایش کرده است، o3 high، برای حل یک مسئله ARC-AGI حدود ۳۰۰۰ دلار هزینه دارد. اکنون بنیاد جایزه Arc فکر میکند که این هزینه بسیار بیشتر است – احتمالاً حدود ۳۰۰۰۰ دلار برای هر کار.
این بازبینی قابل توجه است زیرا نشان میدهد که پرهزینه ترین مدلهای هوش مصنوعی امروزی حداقل در اوایل کار، برای برخی وظایف چقدر میتوانند پرهزینه باشند. OpenAI هنوز قیمت o3 را تعیین نکرده است – یا حتی آن را منتشر نکرده است. اما بنیاد جایزه Arc معتقد است که قیمت مدل o1-pro OpenAI یک تقریب منطقی است.
برای اطلاع، o1-pro گرانترین مدل OpenAI تا به امروز است.
مایک نوپ، یکی از بنیانگذاران بنیاد جایزه Arc، به TechCrunch گفت: “ما معتقدیم o1-pro به دلیل میزان محاسبات زمان آزمایش استفاده شده، مقایسه نزدیکتری از هزینه واقعی o3 است. اما این هنوز یک تقریب است و ما o3 را به عنوان پیشنمایش در جدول ردهبندی خود نگه داشتهایم تا عدم قطعیت را تا زمان اعلام قیمت رسمی نشان دهیم.”
با توجه به میزان منابع محاسباتی که مدل ظاهراً استفاده میکند، قیمت بالای o3 high دور از ذهن نیست. به گفته بنیاد جایزه Arc، o3 high برای مقابله با ARC-AGI، ۱۷۲ برابر بیشتر از o3 low، کمهزینهترین پیکربندی o3، از محاسبات استفاده کرده است.
علاوه بر این، مدت زیادی است که شایعاتی در مورد برنامههای گرانقیمتی که OpenAI در نظر دارد برای مشتریان سازمانی معرفی کند، منتشر شده است. در اوایل ماه مارس، The Information گزارش داد که این شرکت ممکن است قصد داشته باشد تا ماهانه ۲۰۰۰۰ دلار برای “عوامل” هوش مصنوعی تخصصی، مانند یک عامل توسعهدهنده نرمافزار، هزینه دریافت کند.
برخی ممکن است استدلال کنند که حتی گرانترین مدلهای OpenAI بسیار کمتر از آنچه یک پیمانکار یا کارمند معمولی انسان دریافت میکند، هزینه خواهند داشت. اما همانطور که توبی ارد، محقق هوش مصنوعی، در پستی در X اشاره کرد، ممکن است این مدلها به همان اندازه کارآمد نباشند. به عنوان مثال، o3 high برای دستیابی به بهترین امتیاز خود در ARC-AGI به ۱۰۲۴ تلاش برای هر کار نیاز داشت.
منبع: تککرانچ