شرکت OpenAI روز دوشنبه بهروزرسانیهایی را برای حالت پیشرفته صوتی (Advanced Voice Mode)، که یک قابلیت هوش مصنوعی برای مکالمات زنده در ChatGPT است، منتشر کرد. این بهروزرسانیها با هدف بهبود شخصیتپذیری دستیار صوتی و کاهش قطع کردن صحبتهای کاربران طراحی شدهاند.
مانوکا استراتا، یکی از پژوهشگران پس از آموزش در OpenAI، این تغییرات را در ویدیویی که روز دوشنبه در کانالهای رسمی شبکههای اجتماعی این شرکت منتشر شد، اعلام کرد.
هدف اصلی این بهروزرسانی جدید OpenAI رفع مشکلی شایع در دستیارهای صوتی هوش مصنوعی است که معمولاً وقتی کاربران برای فکر کردن یا نفس کشیدن مکث میکنند، صحبت آنها را قطع میکنند.
کاربران رایگان ChatGPT حالا به نسخه جدیدی از حالت پیشرفته صوتی دسترسی دارند که به آنها اجازه میدهد بدون قطع شدن توسط دستیار صوتی، هنگام صحبت مکث کنند. کاربران پولی ChatGPT — از جمله مشترکین طرحهای Plus، Teams، Edu، Business و Pro — نیز از این پس با کاهش قطع شدن صحبتهایشان در حالت پیشرفته صوتی مواجه خواهند شد و همچنین شاهد بهبود شخصیتپذیری دستیار صوتی خواهند بود.
سخنگوی OpenAI به TechCrunch گفته است که دستیار صوتی جدید برای کاربران پولی “مستقیمتر، جذابتر، مختصرتر، دقیقتر و خلاقتر در پاسخهایش” است.
این پیشرفتها در حالت پیشرفته صوتی در حالی رخ میدهد که رقابت در حوزه دستیارهای صوتی هوش مصنوعی به شدت افزایش یافته است. استارتاپ Sesame — که توسط برندن ایریب، یکی از بنیانگذاران Oculus، و با حمایت شرکت Andreessen Horowitz راهاندازی شده — اخیراً به دلیل دستیارهای صوتی طبیعی خود به نامهای مایا و مایلز بسیار مورد توجه قرار گرفته است. شرکتهای بزرگتر نیز با جدیت بیشتری وارد این عرصه شدهاند؛ به عنوان مثال، آمازون در حال آمادهسازی نسخهای از الکسا با پشتیبانی از مدل زبانی بزرگ (LLM) است.
منبع: تککرانچ