طبق گزارشی از فایننشال تایمز، مدل بزرگ بعدی «متنباز» متا ممکن است بر قابلیتهای صوتی تمرکز داشته باشد.
بر اساس این گزارش، متا در حال برنامهریزی برای معرفی ویژگیهای صوتی بهبودیافته در لاما ۴، مدل پرچمدار بعدی از خانواده مدلهای لاما، است که انتظار میرود طی «چند هفته» عرضه شود. گفته میشود متا بهویژه روی این موضوع تمرکز کرده که کاربران بتوانند در حین صحبت مدل، آن را قطع کنند؛ چیزی شبیه به حالت صوتی ChatGPT شرکت OpenAI و تجربه Gemini Live گوگل.
کریس کاکس، مدیر ارشد محصولات متا، این هفته در کنفرانسی که توسط مورگان استنلی برگزار شد، اظهار داشت که لاما ۴ یک مدل «همهکاره» خواهد بود که بهصورت بومی قادر به درک و تولید گفتار، متن و انواع دیگر دادهها است.
موفقیت مدلهای متنباز آزمایشگاه هوش مصنوعی چینی DeepSeek، که عملکردی برابر یا بهتر از مدلهای لاما متا دارند، توسعه لاما را به شدت سرعت بخشیده است. گفته میشود متا با عجله اتاقهای عملیاتی تشکیل داده تا بفهمد DeepSeek چگونه هزینههای اجرا و پیادهسازی مدلها را کاهش داده است.