خبر
پلتفرم پادکست‌سازی پادکستِل یک مدل تبدیل متن به گفتار با بیش از ۴۵۰ صدای هوش مصنوعی راه‌اندازی کرد
زمان مطالعه: 3 دقیقه
پلتفرم پادکست‌سازی پادکستِل یک مدل تبدیل متن به گفتار با بیش از ۴۵۰ صدای هوش مصنوعی راه‌اندازی کرد
پلتفرم پادکست‌سازی پادکستِل یک مدل تبدیل متن به گفتار با بیش از ۴۵۰ صدای هوش مصنوعی راه‌اندازی کرد
خبر
پلتفرم پادکست‌سازی پادکستِل یک مدل تبدیل متن به گفتار با بیش از ۴۵۰ صدای هوش مصنوعی راه‌اندازی کرد
زمان مطالعه: 3 دقیقه

پلتفرم ضبط و ویرایش پادکست پادکستِل اکنون با عرضه مدل هوش مصنوعی خود به نام Asyncflow v1.0 به جمع دیگر شرکت‌ها در رقابت تبدیل متن به گفتار مبتنی بر هوش مصنوعی پیوسته است. همچنین یک API برای توسعه‌دهندگان در دسترس خواهد بود که به آن‌ها اجازه می‌دهد این مدل تبدیل متن به گفتار را مستقیماً در برنامه‌های خود ادغام کنند.

به لطف این مدل جدید، شرکت قادر است بیش از ۴۵۰ صدای هوش مصنوعی ارائه دهد که می‌توانند متن شما را روایت کنند. این استارتاپ اعلام کرد که فناوری و مدل را به گونه‌ای توسعه داده که هزینه‌های آموزش و استنتاج آن پایین باشد و این امر به آن برتری نسبت به رقبا می‌بخشد.

با این اقدام، پادکستِل به تعدادی از استارتاپ‌ها از جمله ElevenLabs، Speechify و WellSaid می‌پیوندد که فناوری و مدل‌های هوش مصنوعی را برای تبدیل هر نوع متنی به کلیپ صوتی روایت‌شده توسط هوش مصنوعی توسعه داده‌اند. این فناوری در حوزه‌هایی مانند بازاریابی، تبلیغات، تولید محتوا، آموزش و آموزش سازمانی کاربرد دارد.

آرتو یریتسیان، بنیان‌گذار پادکستِل، به تک‌کرانچ گفت که این شرکت از ابتدا قصد داشت یک مدل تبدیل متن به گفتار بسازد، اما هزینه‌های آموزش و نیاز به داده‌های زیاد برای این کار بسیار بالا بود.

او گفت: «ما از زمان تأسیس شرکت می‌خواستیم یک مدل تبدیل متن به گفتار قدرتمند بسازیم. با این حال، هزینه‌های توسعه بسیار زیاد بود. به لطف پیشرفت‌های اخیر در مدل‌های زبانی بزرگ، سال گذشته به نقطه عطفی رسیدیم که توانستیم یک مدل صوتی باکیفیت را بدون نیاز به حجم عظیمی از داده‌ها بسازیم.»

تلاش‌های این شرکت همچنین با جمع‌آوری ۱۳.۵ میلیون دلار در دور سرمایه‌گذاری سری A در سال گذشته پشتیبانی شد.

یریتسیان اظهار داشت که در حالی که پادکستِل برای ۵۰۰ دقیقه تبدیل متن به گفتار حدود ۴۰ دلار دریافت می‌کند، ElevenLabs برای همین مقدار ۹۹ دلار مطالبه می‌کند. قابلیت شبیه‌سازی صدای پادکستِل نیز در حال ارتقا است تا فرآیند آموزش سریع‌تری داشته باشد.

نمای کلی از پلتفرم
منبع تصویر: پادکاسل

پیش‌تر، فرآیند آموزش شامل خواندن حدود ۷۰ جمله مختلف بود. اکنون تنها چند ثانیه ضبط صدا از شما کافی است تا یک نسخه شبیه‌سازی‌شده از صدای‌تان ایجاد شود. این فرآیند جدید همچنین از هوش مصنوعی Magic Dust پادکستِل، که سال گذشته منتشر شد، برای بهبود کیفیت ضبط صدا استفاده می‌کند. در آزمایش ما، صدایی که با فرآیند جدید ایجاد شد کمی رباتیک به نظر می‌رسید، هرچند لحن ما را تقلید می‌کرد. شرکت اعلام کرد که با گذشت زمان این قابلیت را بهبود خواهد داد. علاوه بر این، می‌توانید نمونه‌های مختلفی از صدای خود را آموزش دهید تا نتایج متفاوتی بگیرید.

پادکستِل اعلام کرد که علاوه بر هزینه‌ها، داشتن ابزارهایی برای صدا، ویدئو، پادکست‌ها و روایت مبتنی بر هوش مصنوعی در یک وب‌سایت بازطراحی‌شده، به آن برتری نسبت به رقبا خواهد داد. یریتسیان گفت که در حالی که اکثر کاربران از پادکستِل برای کار روی محتوای صوتی استفاده می‌کنند، ویدئو نیز در حال نزدیک شدن به این سطح است.

منبع: تک‌کرانچ

اشتراک گذاری:

آخرین مقالات پیشنهادی

دیدگاه‌ها

اشتراک در
اطلاع از
guest
0 Comments
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
دیتانید تو مراحل مختلف تحلیل داده می‌تونه به شما کمک کنه:
  1. امکان‌سنجی خواسته‌ها و تطبیق نیازمندی‌ها
  2. استخراج و تمیز کردن دادگان
  3. طراحی مدل‌های مناسب
  4. آموزش مدل براساس داده‌های به‌دست آمده
  5. استقرار مدل

آخرین اخبار

اخبار مشابه

OpenAI قصد دارد GPT-4.5، بزرگترین مدل هوش مصنوعی خود تا کنون را به تدریج از API خود حذف کند
OpenAI روز دوشنبه اعلام کرد که به زودی دسترسی به GPT-4.5، بزرگترین مدل هوش مصنوعی خود تا کنون، را از طریق API خود متوقف خواهد کرد. GPT-4.5 تنها در ...
متا آموزش مدل‌های هوش مصنوعی خود را بر روی محتوای عمومی در اتحادیه اروپا آغاز خواهد کرد
متا روز دوشنبه اعلام کرد که قصد دارد مدل‌های هوش مصنوعی خود را بر روی محتوای عمومی، مانند پست‌ها و نظرات در فیسبوک و اینستاگرام، در اتحادیه اروپا ...