Midjourney، یکی از محبوبترین استارتآپهای تولید تصویر هوش مصنوعی، روز چهارشنبه راهاندازی مدل تولید ویدیوی هوش مصنوعی مورد انتظار خود، V1 را اعلام کرد.
V1 یک مدل تصویر به ویدیو است که در آن کاربران میتوانند یک تصویر را آپلود کنند — یا تصویری را که توسط یکی از مدلهای دیگر Midjourney تولید شده است، بردارند — و V1 مجموعهای از چهار ویدیوی پنج ثانیهای را بر اساس آن تولید خواهد کرد. درست مانند مدلهای تصویر Midjourney، V1 فقط از طریق Discord و در زمان راهاندازی فقط در وب در دسترس است.
رقابت با غولها و جاهطلبیهای بزرگ
راهاندازی V1، Midjourney را وارد رقابت با مدلهای تولید ویدیوی هوش مصنوعی از شرکتهای دیگر مانند Sora OpenAI، Gen 4 Runway، Firefly Adobe و Veo 3 گوگل میکند. در حالی که بسیاری از شرکتها بر توسعه مدلهای ویدیوی هوش مصنوعی قابل کنترل برای استفاده در محیطهای تجاری تمرکز دارند، Midjourney همیشه به خاطر مدلهای تصویر هوش مصنوعی متمایز خود که به انواع خلاق پاسخ میدهند، برجسته بوده است.
این شرکت میگوید اهداف بزرگتری برای مدلهای ویدیوی هوش مصنوعی خود دارد تا صرفاً تولید B-roll برای فیلمهای هالیوود یا تبلیغات برای صنعت تبلیغات. دیوید هولز، مدیرعامل Midjourney، در یک پست وبلاگی میگوید مدل ویدیوی هوش مصنوعی آنها گام بعدی شرکت به سمت مقصد نهاییاش، یعنی ایجاد مدلهای هوش مصنوعی “قادر به شبیهسازیهای بلادرنگ دنیای باز” است.
Midjourney میگوید پس از مدلهای ویدیوی هوش مصنوعی، قصد دارد مدلهای هوش مصنوعی برای تولید رندرهای سهبعدی و همچنین مدلهای هوش مصنوعی بلادرنگ را توسعه دهد.
چالشهای حقوقی و مدل قیمتگذاری
راهاندازی مدل V1 Midjourney تنها یک هفته پس از آن صورت میگیرد که این استارتآپ توسط دو استودیوی معروف فیلم هالیوود، دیزنی و یونیورسال، مورد شکایت قرار گرفت. این شکایت ادعا میکند که تصاویر ایجاد شده توسط مدلهای تصویر هوش مصنوعی Midjourney، شخصیتهای دارای حق چاپ این استودیو، مانند هومر سیمپسون و دارث ویدر را به تصویر میکشند.
استودیوهای هالیوود برای مقابله با محبوبیت رو به رشد مدلهای تولید تصویر و ویدیو با هوش مصنوعی، مانند مواردی که Midjourney توسعه میدهد، با مشکل مواجه شدهاند. ترس فزایندهای وجود دارد که این ابزارهای هوش مصنوعی میتوانند کار خلاقان در زمینههای مربوطه خود را جایگزین یا بیارزش کنند، و چندین شرکت رسانهای ادعا کردهاند که این محصولات بر روی آثار دارای حق چاپ آنها آموزش دیدهاند.
در حالی که Midjourney سعی کرده است خود را متفاوت از سایر استارتآپهای تصویر و ویدیوی هوش مصنوعی — بیشتر بر خلاقیت تمرکز دارد تا کاربردهای تجاری فوری — معرفی کند، این استارتآپ نمیتواند از این اتهامات فرار کند.
برای شروع، Midjourney میگوید برای تولید ویدیو ۸ برابر بیشتر از تولید تصویر معمولی هزینه دریافت خواهد کرد، به این معنی که مشترکین هنگام ایجاد ویدیوها، سهمیه تولید ماهانه خود را به طور قابل توجهی سریعتر از تصاویر به پایان خواهند رساند.
در زمان راهاندازی، ارزانترین راه برای امتحان V1، اشتراک در طرح Basic Midjourney با قیمت ۱۰ دلار در ماه است. مشترکین طرح Pro Midjourney با قیمت ۶۰ دلار در ماه و طرح Mega با قیمت ۱۲۰ دلار در ماه، در حالت کندتر شرکت، “Relax”، تولید ویدیوی نامحدود خواهند داشت. Midjourney میگوید در ماه آینده، قیمتگذاری خود را برای مدلهای ویدیویی دوباره ارزیابی خواهد کرد.
تنظیمات و قابلیتهای V1
V1 با چند تنظیم سفارشی ارائه میشود که به کاربران امکان کنترل خروجیهای مدل ویدیویی را میدهد.
کاربران میتوانند یک تنظیم انیمیشن خودکار را برای حرکت تصادفی یک تصویر انتخاب کنند، یا میتوانند یک تنظیم دستی را انتخاب کنند که به کاربران امکان میدهد، به صورت متنی، انیمیشن خاصی را که میخواهند به ویدیوی خود اضافه کنند، توصیف کنند. کاربران همچنین میتوانند میزان حرکت دوربین و سوژه را با انتخاب “حرکت کم” یا “حرکت زیاد” در تنظیمات تغییر دهند.
در حالی که ویدیوهای تولید شده با V1 تنها پنج ثانیه طول دارند، کاربران میتوانند آنها را تا چهار بار به مدت چهار ثانیه افزایش دهند، به این معنی که ویدیوهای V1 میتوانند تا ۲۱ ثانیه طولانی شوند.
کیفیت و پذیرش اولیه
درست مانند مدلهای تصویر هوش مصنوعی Midjourney، نمونههای اولیه ویدیوهای V1 کمی فرازمینی به نظر میرسند تا فوقواقعگرایانه. پاسخ اولیه به V1 مثبت بوده است، اگرچه هنوز مشخص نیست که چقدر خوب با سایر مدلهای ویدیوی هوش مصنوعی پیشرو، که ماهها یا حتی سالها در بازار بودهاند، مطابقت دارد.
منبع: تککرانچ