Midjourney اولین مدل تولید ویدیوی هوش مصنوعی خود، V1 را راه‌اندازی کرد

خبر

زمان مطالعه: 4 دقیقه

علیرضا رحیمی
10 تیر 1404
19:33

Midjourney اولین مدل تولید ویدیوی هوش مصنوعی خود، V1 را راه‌اندازی کرد

خبر

Midjourney اولین مدل تولید ویدیوی هوش مصنوعی خود، V1 را راه‌اندازی کرد

زمان مطالعه: 4 دقیقه

علیرضا رحیمی
10 تیر 1404
19:33

Midjourney، یکی از محبوب‌ترین استارت‌آپ‌های تولید تصویر هوش مصنوعی، روز چهارشنبه راه‌اندازی مدل تولید ویدیوی هوش مصنوعی مورد انتظار خود، V1 را اعلام کرد.

V1 یک مدل تصویر به ویدیو است که در آن کاربران می‌توانند یک تصویر را آپلود کنند — یا تصویری را که توسط یکی از مدل‌های دیگر Midjourney تولید شده است، بردارند — و V1 مجموعه‌ای از چهار ویدیوی پنج ثانیه‌ای را بر اساس آن تولید خواهد کرد. درست مانند مدل‌های تصویر Midjourney، V1 فقط از طریق Discord و در زمان راه‌اندازی فقط در وب در دسترس است.

رقابت با غول‌ها و جاه‌طلبی‌های بزرگ

راه‌اندازی V1، Midjourney را وارد رقابت با مدل‌های تولید ویدیوی هوش مصنوعی از شرکت‌های دیگر مانند Sora OpenAI، Gen 4 Runway، Firefly Adobe و Veo 3 گوگل می‌کند. در حالی که بسیاری از شرکت‌ها بر توسعه مدل‌های ویدیوی هوش مصنوعی قابل کنترل برای استفاده در محیط‌های تجاری تمرکز دارند، Midjourney همیشه به خاطر مدل‌های تصویر هوش مصنوعی متمایز خود که به انواع خلاق پاسخ می‌دهند، برجسته بوده است.

این شرکت می‌گوید اهداف بزرگ‌تری برای مدل‌های ویدیوی هوش مصنوعی خود دارد تا صرفاً تولید B-roll برای فیلم‌های هالیوود یا تبلیغات برای صنعت تبلیغات. دیوید هولز، مدیرعامل Midjourney، در یک پست وبلاگی می‌گوید مدل ویدیوی هوش مصنوعی آن‌ها گام بعدی شرکت به سمت مقصد نهایی‌اش، یعنی ایجاد مدل‌های هوش مصنوعی “قادر به شبیه‌سازی‌های بلادرنگ دنیای باز” است.

Midjourney می‌گوید پس از مدل‌های ویدیوی هوش مصنوعی، قصد دارد مدل‌های هوش مصنوعی برای تولید رندرهای سه‌بعدی و همچنین مدل‌های هوش مصنوعی بلادرنگ را توسعه دهد.

چالش‌های حقوقی و مدل قیمت‌گذاری

راه‌اندازی مدل V1 Midjourney تنها یک هفته پس از آن صورت می‌گیرد که این استارت‌آپ توسط دو استودیوی معروف فیلم هالیوود، دیزنی و یونیورسال، مورد شکایت قرار گرفت. این شکایت ادعا می‌کند که تصاویر ایجاد شده توسط مدل‌های تصویر هوش مصنوعی Midjourney، شخصیت‌های دارای حق چاپ این استودیو، مانند هومر سیمپسون و دارث ویدر را به تصویر می‌کشند.

استودیوهای هالیوود برای مقابله با محبوبیت رو به رشد مدل‌های تولید تصویر و ویدیو با هوش مصنوعی، مانند مواردی که Midjourney توسعه می‌دهد، با مشکل مواجه شده‌اند. ترس فزاینده‌ای وجود دارد که این ابزارهای هوش مصنوعی می‌توانند کار خلاقان در زمینه‌های مربوطه خود را جایگزین یا بی‌ارزش کنند، و چندین شرکت رسانه‌ای ادعا کرده‌اند که این محصولات بر روی آثار دارای حق چاپ آن‌ها آموزش دیده‌اند.

در حالی که Midjourney سعی کرده است خود را متفاوت از سایر استارت‌آپ‌های تصویر و ویدیوی هوش مصنوعی — بیشتر بر خلاقیت تمرکز دارد تا کاربردهای تجاری فوری — معرفی کند، این استارت‌آپ نمی‌تواند از این اتهامات فرار کند.

برای شروع، Midjourney می‌گوید برای تولید ویدیو ۸ برابر بیشتر از تولید تصویر معمولی هزینه دریافت خواهد کرد، به این معنی که مشترکین هنگام ایجاد ویدیوها، سهمیه تولید ماهانه خود را به طور قابل توجهی سریع‌تر از تصاویر به پایان خواهند رساند.

در زمان راه‌اندازی، ارزان‌ترین راه برای امتحان V1، اشتراک در طرح Basic Midjourney با قیمت ۱۰ دلار در ماه است. مشترکین طرح Pro Midjourney با قیمت ۶۰ دلار در ماه و طرح Mega با قیمت ۱۲۰ دلار در ماه، در حالت کندتر شرکت، “Relax”، تولید ویدیوی نامحدود خواهند داشت. Midjourney می‌گوید در ماه آینده، قیمت‌گذاری خود را برای مدل‌های ویدیویی دوباره ارزیابی خواهد کرد.

تنظیمات و قابلیت‌های V1

V1 با چند تنظیم سفارشی ارائه می‌شود که به کاربران امکان کنترل خروجی‌های مدل ویدیویی را می‌دهد.

کاربران می‌توانند یک تنظیم انیمیشن خودکار را برای حرکت تصادفی یک تصویر انتخاب کنند، یا می‌توانند یک تنظیم دستی را انتخاب کنند که به کاربران امکان می‌دهد، به صورت متنی، انیمیشن خاصی را که می‌خواهند به ویدیوی خود اضافه کنند، توصیف کنند. کاربران همچنین می‌توانند میزان حرکت دوربین و سوژه را با انتخاب “حرکت کم” یا “حرکت زیاد” در تنظیمات تغییر دهند.

در حالی که ویدیوهای تولید شده با V1 تنها پنج ثانیه طول دارند، کاربران می‌توانند آن‌ها را تا چهار بار به مدت چهار ثانیه افزایش دهند، به این معنی که ویدیوهای V1 می‌توانند تا ۲۱ ثانیه طولانی شوند.

کیفیت و پذیرش اولیه

درست مانند مدل‌های تصویر هوش مصنوعی Midjourney، نمونه‌های اولیه ویدیوهای V1 کمی فرازمینی به نظر می‌رسند تا فوق‌واقع‌گرایانه. پاسخ اولیه به V1 مثبت بوده است، اگرچه هنوز مشخص نیست که چقدر خوب با سایر مدل‌های ویدیوی هوش مصنوعی پیشرو، که ماه‌ها یا حتی سال‌ها در بازار بوده‌اند، مطابقت دارد.

منبع: تک‌کرانچ

Midjourney، اخبار مدل‌ها، تولید ویدیو با هوش مصنوعی، میدجرنی، هوش مصنوعی

اشتراک گذاری:

آخرین مقالات پیشنهادی

انواع یادگیری در شبکه‌های عصبی ژرف

مقدمه‌ای بر زندگی مصنوعی برای دوست‌داران هوش‌مصنوعی

قسمت دوم: چگونه کار می‌کنند؟ (فناوری‌های زیربنایی ماشین‌های خودران)

قسمت اول: ماشین‌های خودران، سفری به آینده‌ای بدون راننده

علیرضا رحیمی

دانشجوی دکتری کامپیوتر - هوش مصنوعی هستم. تخصص من در توسعه مدل‌های یادگیری ماشین و بهینه‌سازی جریان‌های کاری داده‌ها برای استخراج بینش‌های ارزشمند از داده‌های پیچیده است. علاقه‌مند به استفاده از هوش مصنوعی و مهندسی داده برای ایجاد راه‌حل‌های مقیاس‌پذیر جهت بهبود هوش تجاری و تصمیم‌گیری هستم.

مشاهده کلیه مقالات

دیدگاه‌ها

اشتراک در

0 Comments

قدیمی‌ترین

تازه‌ترین بیشترین رأی

بازخورد (Feedback) های اینلاین

مشاهده همه دیدگاه ها

دیتانید تو مراحل مختلف تحلیل داده می‌تونه به شما کمک کنه:

امکان‌سنجی خواسته‌ها و تطبیق نیازمندی‌ها
استخراج و تمیز کردن دادگان
طراحی مدل‌های مناسب
آموزش مدل براساس داده‌های به‌دست آمده
استقرار مدل

آخرین اخبار

اخبار مشابه

Cursor یک اپلیکیشن وب برای مدیریت عوامل کدنویسی هوش مصنوعی راه‌اندازی می‌کند

شرکت سازنده Cursor، ویرایشگر کدنویسی هوش مصنوعی پرطرفدار، روز دوشنبه یک اپلیکیشن وب راه‌اندازی کرد که به کاربران امکان می‌دهد شبکه‌ای از عوامل کدنویسی