پلتفرم پادکست‌سازی پادکستِل یک مدل تبدیل متن به گفتار با بیش از ۴۵۰ صدای هوش مصنوعی راه‌اندازی کرد

خبر

زمان مطالعه: 3 دقیقه

علیرضا رحیمی
14 اسفند 1403
21:42

پلتفرم پادکست‌سازی پادکستِل یک مدل تبدیل متن به گفتار با بیش از ۴۵۰ صدای هوش مصنوعی راه‌اندازی کرد

خبر

پلتفرم پادکست‌سازی پادکستِل یک مدل تبدیل متن به گفتار با بیش از ۴۵۰ صدای هوش مصنوعی راه‌اندازی کرد

زمان مطالعه: 3 دقیقه

علیرضا رحیمی
14 اسفند 1403
21:42

پلتفرم ضبط و ویرایش پادکست پادکستِل اکنون با عرضه مدل هوش مصنوعی خود به نام Asyncflow v1.0 به جمع دیگر شرکت‌ها در رقابت تبدیل متن به گفتار مبتنی بر هوش مصنوعی پیوسته است. همچنین یک API برای توسعه‌دهندگان در دسترس خواهد بود که به آن‌ها اجازه می‌دهد این مدل تبدیل متن به گفتار را مستقیماً در برنامه‌های خود ادغام کنند.

به لطف این مدل جدید، شرکت قادر است بیش از ۴۵۰ صدای هوش مصنوعی ارائه دهد که می‌توانند متن شما را روایت کنند. این استارتاپ اعلام کرد که فناوری و مدل را به گونه‌ای توسعه داده که هزینه‌های آموزش و استنتاج آن پایین باشد و این امر به آن برتری نسبت به رقبا می‌بخشد.

با این اقدام، پادکستِل به تعدادی از استارتاپ‌ها از جمله ElevenLabs، Speechify و WellSaid می‌پیوندد که فناوری و مدل‌های هوش مصنوعی را برای تبدیل هر نوع متنی به کلیپ صوتی روایت‌شده توسط هوش مصنوعی توسعه داده‌اند. این فناوری در حوزه‌هایی مانند بازاریابی، تبلیغات، تولید محتوا، آموزش و آموزش سازمانی کاربرد دارد.

آرتو یریتسیان، بنیان‌گذار پادکستِل، به تک‌کرانچ گفت که این شرکت از ابتدا قصد داشت یک مدل تبدیل متن به گفتار بسازد، اما هزینه‌های آموزش و نیاز به داده‌های زیاد برای این کار بسیار بالا بود.

او گفت: «ما از زمان تأسیس شرکت می‌خواستیم یک مدل تبدیل متن به گفتار قدرتمند بسازیم. با این حال، هزینه‌های توسعه بسیار زیاد بود. به لطف پیشرفت‌های اخیر در مدل‌های زبانی بزرگ، سال گذشته به نقطه عطفی رسیدیم که توانستیم یک مدل صوتی باکیفیت را بدون نیاز به حجم عظیمی از داده‌ها بسازیم.»

تلاش‌های این شرکت همچنین با جمع‌آوری ۱۳.۵ میلیون دلار در دور سرمایه‌گذاری سری A در سال گذشته پشتیبانی شد.

یریتسیان اظهار داشت که در حالی که پادکستِل برای ۵۰۰ دقیقه تبدیل متن به گفتار حدود ۴۰ دلار دریافت می‌کند، ElevenLabs برای همین مقدار ۹۹ دلار مطالبه می‌کند. قابلیت شبیه‌سازی صدای پادکستِل نیز در حال ارتقا است تا فرآیند آموزش سریع‌تری داشته باشد.

نمای کلی از پلتفرم — منبع تصویر: پادکاسل

پیش‌تر، فرآیند آموزش شامل خواندن حدود ۷۰ جمله مختلف بود. اکنون تنها چند ثانیه ضبط صدا از شما کافی است تا یک نسخه شبیه‌سازی‌شده از صدای‌تان ایجاد شود. این فرآیند جدید همچنین از هوش مصنوعی Magic Dust پادکستِل، که سال گذشته منتشر شد، برای بهبود کیفیت ضبط صدا استفاده می‌کند. در آزمایش ما، صدایی که با فرآیند جدید ایجاد شد کمی رباتیک به نظر می‌رسید، هرچند لحن ما را تقلید می‌کرد. شرکت اعلام کرد که با گذشت زمان این قابلیت را بهبود خواهد داد. علاوه بر این، می‌توانید نمونه‌های مختلفی از صدای خود را آموزش دهید تا نتایج متفاوتی بگیرید.

پادکستِل اعلام کرد که علاوه بر هزینه‌ها، داشتن ابزارهایی برای صدا، ویدئو، پادکست‌ها و روایت مبتنی بر هوش مصنوعی در یک وب‌سایت بازطراحی‌شده، به آن برتری نسبت به رقبا خواهد داد. یریتسیان گفت که در حالی که اکثر کاربران از پادکستِل برای کار روی محتوای صوتی استفاده می‌کنند، ویدئو نیز در حال نزدیک شدن به این سطح است.

منبع: تک‌کرا ن چ

اخبار مدل‌ها

اشتراک گذاری:

آخرین مقالات پیشنهادی

انواع یادگیری در شبکه‌های عصبی ژرف

مقدمه‌ای بر زندگی مصنوعی برای دوست‌داران هوش‌مصنوعی

قسمت دوم: چگونه کار می‌کنند؟ (فناوری‌های زیربنایی ماشین‌های خودران)

قسمت اول: ماشین‌های خودران، سفری به آینده‌ای بدون راننده

علیرضا رحیمی

دانشجوی دکتری کامپیوتر - هوش مصنوعی هستم. تخصص من در توسعه مدل‌های یادگیری ماشین و بهینه‌سازی جریان‌های کاری داده‌ها برای استخراج بینش‌های ارزشمند از داده‌های پیچیده است. علاقه‌مند به استفاده از هوش مصنوعی و مهندسی داده برای ایجاد راه‌حل‌های مقیاس‌پذیر جهت بهبود هوش تجاری و تصمیم‌گیری هستم.

مشاهده کلیه مقالات

دیدگاه‌ها

اشتراک در

0 Comments

قدیمی‌ترین

تازه‌ترین بیشترین رأی

بازخورد (Feedback) های اینلاین

مشاهده همه دیدگاه ها

دیتانید تو مراحل مختلف تحلیل داده می‌تونه به شما کمک کنه:

امکان‌سنجی خواسته‌ها و تطبیق نیازمندی‌ها
استخراج و تمیز کردن دادگان
طراحی مدل‌های مناسب
آموزش مدل براساس داده‌های به‌دست آمده
استقرار مدل

آخرین اخبار

مایکروسافت ابزار اسکرین‌شات هوش مصنوعی را با نام مستعار “کابوس حریم خصوصی” عرضه می‌کند

۲۹ فروردین ۱۴۰۴
روش جدید قابلیت اطمینان گزارش‌های تشخیصی رادیولوژیست‌ها را ارزیابی و بهبود می‌بخشد

۲۸ فروردین ۱۴۰۴
فناوری Web3 به ایجاد اطمینان و اعتماد در هوش مصنوعی کمک می‌کند

۲۸ فروردین ۱۴۰۴
نینا شیک(نویسنده): تأثیر هوش مصنوعی مولد بر تجارت، سیاست و جامعه

۲۸ فروردین ۱۴۰۴
محققان به LLMها آموزش می‌دهند تا چالش‌های برنامه‌ریزی پیچیده را حل کنند

۲۶ فروردین ۱۴۰۴
بحث‌ها بر سر محک‌زنی هوش مصنوعی به پوکمون رسیده است

۲۶ فروردین ۱۴۰۴

اخبار مشابه

OpenAI قصد دارد GPT-4.5، بزرگترین مدل هوش مصنوعی خود تا کنون را به تدریج از API خود حذف کند

OpenAI روز دوشنبه اعلام کرد که به زودی دسترسی به GPT-4.5، بزرگترین مدل هوش مصنوعی خود تا کنون، را از طریق API خود متوقف خواهد کرد. GPT-4.5 تنها در ...