دیپگرام از نوا-۳ پزشکی، یک مدل گفتار به متن (STT) مبتنی بر هوش مصنوعی که بهطور خاص برای رونویسی در محیط چالشبرانگیز مراقبتهای بهداشتی طراحی شده، رونمایی کرد.
نوا-۳ پزشکی با هدف ادغام یکپارچه با جریانهای کاری بالینی موجود، در نظر دارد تا نیاز رو به رشد به رونویسی دقیق و کارآمد را در نظام بهداشت عمومی NHS بریتانیا و چشمانداز مراقبتهای خصوصی برآورده کند.
با فراگیر شدن سوابق الکترونیکی سلامت (EHR)، پزشکی از راه دور و پلتفرمهای سلامت دیجیتال، تقاضا برای رونویسی قابل اعتماد مبتنی بر هوش مصنوعی بیش از هر زمان دیگری افزایش یافته است. با این حال، مدلهای سنتی گفتار به متن اغلب با واژگان پیچیده و تخصصی مورد استفاده در محیطهای بالینی مشکل دارند و این امر به خطاها و «توهمات» منجر میشود که میتواند مراقبت از بیمار را به خطر بیندازد.
نوا-۳ پزشکی دیپگرام برای غلبه بر این چالشها طراحی شده است. این مدل از یادگیری ماشینی پیشرفته و آموزش واژگان پزشکی تخصصی بهره میبرد تا اصطلاحات پزشکی، مخففها و اصطلاحات بالینی را حتی در شرایط صوتی دشوار با دقت ضبط کند. این ویژگی بهویژه در محیطهایی که متخصصان مراقبتهای بهداشتی ممکن است از دستگاههای ضبط دور شوند، اهمیت دارد.
اسکات استفنسون، مدیرعامل دیپگرام، اظهار داشت: «نوا-۳ پزشکی گامی بزرگ در تعهد ما برای تحول مستندسازی بالینی از طریق هوش مصنوعی است. با توجه به ظرافتهای زبان بالینی و ارائه سفارشیسازی بیسابقه، ما به توسعهدهندگان قدرت میدهیم تا محصولاتی بسازند که مراقبت از بیمار و کارایی عملیاتی را بهبود میبخشد.»
یکی از ویژگیهای کلیدی این مدل، توانایی آن در ارائه رونویسیهای ساختاریافته است که بهطور یکپارچه با جریانهای کاری بالینی و سیستمهای EHR ادغام میشود و اطمینان میدهد که دادههای حیاتی بیمار بهطور دقیق سازماندهی شده و بهراحتی در دسترس است. این مدل همچنین سفارشیسازی انعطافپذیر و خودکار را ارائه میدهد، از جمله قابلیت «پیشنهاد کلیدواژه» برای حداکثر ۱۰۰ اصطلاح کلیدی، که به توسعهدهندگان اجازه میدهد راهحل را با نیازهای منحصربهفرد تخصصهای مختلف پزشکی تطبیق دهند.
ویدیو از یوتوب:
گزینههای استقرار متنوع – از جمله پیکربندیهای محلی و ابر خصوصی مجازی (VPC) – امنیت در سطح سازمانی و انطباق با HIPAA را تضمین میکند، که برای رعایت مقررات حفاظت از دادهها در بریتانیا حیاتی است.
کوین فردریک، شریک مدیریتی OneReach.ai، گفت: «گفتار به متن برای موارد استفاده سازمانی کار سادهای نیست و تفاوت اساسی بین پلتفرمهای هوش مصنوعی صوتی طراحیشده برای موارد سازمانی در مقابل موارد سرگرمی وجود دارد. مدلهای نوا-۳ و نوا-۳ پزشکی دیپگرام، از جمله TTS، در زمینه دقت، تأخیر، کارایی و مقیاسپذیری مورد نیاز برای موارد استفاده سازمانی پیشرو هستند.»
معیاربندی نوا-۳ پزشکی: دقت، سرعت و کارایی
دیپگرام معیاربندیهایی را برای نشان دادن عملکرد نوا-۳ پزشکی انجام داده است. این مدل ادعا میکند که دقت رونویسی پیشرو در صنعت را ارائه میدهد و هم شناسایی کلی کلمات و هم دقت اصطلاحات پزشکی حیاتی را بهینه میکند.
- نرخ خطای کلمه (WER): با نرخ خطای متوسط ۳.۴۵ درصد، نوا-۳ پزشکی از رقبا پیشی میگیرد و نسبت به بهترین رقیب بعدی، ۶۳.۶ درصد کاهش خطا را به دست آورده است. این دقت بهبودیافته نیاز به اصلاحات دستی را به حداقل میرساند و جریانهای کاری را سادهتر میکند.
- نرخ خطای کلیدواژه (KER): بهطور حیاتی، نوا-۳ پزشکی با نرخ خطای ۶.۷۹ درصد، ۴۰.۳۵ درصد کاهش خطا نسبت به بهترین رقیب بعدی را به دست آورده است. این اطمینان میدهد که اصطلاحات پزشکی حیاتی – مانند نام داروها و بیماریها – بهطور دقیق رونویسی شوند و خطر سوءتفاهم و مشکلات ایمنی بیمار را کاهش میدهد.
علاوه بر دقت، نوا-۳ پزشکی در کاربردهای بلادرنگ نیز برتری دارد. این مدل گفتار را ۵ تا ۴۰ برابر سریعتر از بسیاری از ارائهدهندگان تشخیص گفتار دیگر رونویسی میکند و آن را برای پزشکی از راه دور و پلتفرمهای سلامت دیجیتال ایدهآل میسازد. معماری مقیاسپذیر آن عملکرد بالا را حتی با افزایش حجم رونویسی تضمین میکند.
علاوه بر این، نوا-۳ پزشکی از نظر هزینه مقرونبهصرفه طراحی شده است. با شروع از ۰.۰۰۷۷ دلار به ازای هر دقیقه صوت جاری – که دیپگرام ادعا میکند بیش از دو برابر ارزانتر از ارائهدهندگان ابری پیشرو است – این مدل به شرکتهای فناوری سلامت اجازه میدهد تا در نوآوری سرمایهگذاری مجدد کرده و توسعه محصول را تسریع کنند.
نوا-۳ پزشکی دیپگرام قصد دارد به توسعهدهندگان قدرت دهد تا برنامههای رونویسی پزشکی تحولآفرین بسازند و نتایج استثنایی را در سراسر حوزه مراقبتهای بهداشتی به ارمغان آورند.
منبع: اخبار هوش مصنوعی