پلتفرم ضبط و ویرایش پادکست پادکستِل اکنون با عرضه مدل هوش مصنوعی خود به نام Asyncflow v1.0 به جمع دیگر شرکتها در رقابت تبدیل متن به گفتار مبتنی بر هوش مصنوعی پیوسته است. همچنین یک API برای توسعهدهندگان در دسترس خواهد بود که به آنها اجازه میدهد این مدل تبدیل متن به گفتار را مستقیماً در برنامههای خود ادغام کنند.
به لطف این مدل جدید، شرکت قادر است بیش از ۴۵۰ صدای هوش مصنوعی ارائه دهد که میتوانند متن شما را روایت کنند. این استارتاپ اعلام کرد که فناوری و مدل را به گونهای توسعه داده که هزینههای آموزش و استنتاج آن پایین باشد و این امر به آن برتری نسبت به رقبا میبخشد.
با این اقدام، پادکستِل به تعدادی از استارتاپها از جمله ElevenLabs، Speechify و WellSaid میپیوندد که فناوری و مدلهای هوش مصنوعی را برای تبدیل هر نوع متنی به کلیپ صوتی روایتشده توسط هوش مصنوعی توسعه دادهاند. این فناوری در حوزههایی مانند بازاریابی، تبلیغات، تولید محتوا، آموزش و آموزش سازمانی کاربرد دارد.
آرتو یریتسیان، بنیانگذار پادکستِل، به تککرانچ گفت که این شرکت از ابتدا قصد داشت یک مدل تبدیل متن به گفتار بسازد، اما هزینههای آموزش و نیاز به دادههای زیاد برای این کار بسیار بالا بود.
او گفت: «ما از زمان تأسیس شرکت میخواستیم یک مدل تبدیل متن به گفتار قدرتمند بسازیم. با این حال، هزینههای توسعه بسیار زیاد بود. به لطف پیشرفتهای اخیر در مدلهای زبانی بزرگ، سال گذشته به نقطه عطفی رسیدیم که توانستیم یک مدل صوتی باکیفیت را بدون نیاز به حجم عظیمی از دادهها بسازیم.»
تلاشهای این شرکت همچنین با جمعآوری ۱۳.۵ میلیون دلار در دور سرمایهگذاری سری A در سال گذشته پشتیبانی شد.
یریتسیان اظهار داشت که در حالی که پادکستِل برای ۵۰۰ دقیقه تبدیل متن به گفتار حدود ۴۰ دلار دریافت میکند، ElevenLabs برای همین مقدار ۹۹ دلار مطالبه میکند. قابلیت شبیهسازی صدای پادکستِل نیز در حال ارتقا است تا فرآیند آموزش سریعتری داشته باشد.

پیشتر، فرآیند آموزش شامل خواندن حدود ۷۰ جمله مختلف بود. اکنون تنها چند ثانیه ضبط صدا از شما کافی است تا یک نسخه شبیهسازیشده از صدایتان ایجاد شود. این فرآیند جدید همچنین از هوش مصنوعی Magic Dust پادکستِل، که سال گذشته منتشر شد، برای بهبود کیفیت ضبط صدا استفاده میکند. در آزمایش ما، صدایی که با فرآیند جدید ایجاد شد کمی رباتیک به نظر میرسید، هرچند لحن ما را تقلید میکرد. شرکت اعلام کرد که با گذشت زمان این قابلیت را بهبود خواهد داد. علاوه بر این، میتوانید نمونههای مختلفی از صدای خود را آموزش دهید تا نتایج متفاوتی بگیرید.
پادکستِل اعلام کرد که علاوه بر هزینهها، داشتن ابزارهایی برای صدا، ویدئو، پادکستها و روایت مبتنی بر هوش مصنوعی در یک وبسایت بازطراحیشده، به آن برتری نسبت به رقبا خواهد داد. یریتسیان گفت که در حالی که اکثر کاربران از پادکستِل برای کار روی محتوای صوتی استفاده میکنند، ویدئو نیز در حال نزدیک شدن به این سطح است.