Midjourney، یکی از اولین سرویسهای تولید تصویر هوش مصنوعی در وب، اولین مدل جدید تصویر هوش مصنوعی خود را در نزدیک به یک سال گذشته منتشر کرده است.
این مدل که V7 نام دارد، از حدود نیمهشب به وقت شرقی روز پنجشنبه به صورت آلفا عرضه شد. این عرضه یک هفته پس از آن صورت گرفت که OpenAI یک تولیدکننده تصویر جدید در ChatGPT معرفی کرد که به دلیل تواناییاش در ایجاد عکسهای سبک گیبلی به سرعت وایرال شد.
اگرچه مدل Midjourney به طور رسمی برای سبک گیبلی بهینه نشده است، اما با این وجود میتواند آثار زیباییشناختی دلپذیری تولید کند، حداقل از نظر یک فرد غیرمتخصص.

برای استفاده از آن، ابتدا باید حدود ۲۰۰ تصویر را رتبهبندی کنید تا یک پروفایل “شخصیسازی” Midjourney بسازید، اگر قبلاً این کار را نکردهاید. این پروفایل مدل را با ترجیحات بصری فردی شما تنظیم میکند؛ V7 اولین مدل Midjourney است که شخصیسازی به طور پیشفرض برای آن فعال است.
پس از انجام این کار، میتوانید V7 را در وبسایت Midjourney و اگر عضو سرور Discord Midjourney هستید، در چتبات Discord آن روشن یا خاموش کنید. در برنامه وب، میتوانید به سرعت مدل را از منوی کشویی کنار برچسب “Version” انتخاب کنید.

دیوید هولز، مدیرعامل Midjourney، در پستی در X، V7 را “یک معماری کاملاً متفاوت” توصیف کرد.
هولز در اطلاعیهای در Discord ادامه داد: «V7 با دستورات متنی بسیار هوشمندتر است. دستورات تصویری فوقالعاده به نظر میرسند، کیفیت تصویر به طور محسوسی با بافتهای زیبا بالاتر است و بدنها، دستها و اشیاء از هر نوع، انسجام بسیار بهتری در تمام جزئیات دارند.»
V7 در دو نوع Turbo (اجرای آن پرهزینهتر است) و Relax در دسترس است و از یک ابزار جدید به نام Draft Mode پشتیبانی میکند که تصاویر را با ۱۰ برابر سرعت و نصف هزینه حالت استاندارد رندر میکند. تصاویر Draft کیفیت پایینتری نسبت به تصاویر حالت استاندارد دارند، اما میتوان آنها را با یک کلیک بهبود بخشید و دوباره رندر کرد.
به گفته هولز، تعدادی از ویژگیهای استاندارد Midjourney هنوز برای V7 در دسترس نیستند، از جمله ارتقاء کیفیت تصویر و تغییر بافت. او گفت که این ویژگیها در آینده نزدیک، احتمالاً ظرف دو ماه آینده، ارائه خواهند شد.
هولز در Discord نوشت: «این یک مدل کاملاً جدید با نقاط قوت منحصر به فرد و احتمالاً چند نقطه ضعف است. ما میخواهیم از شما یاد بگیریم که در چه زمینههایی خوب و بد است، اما حتماً به خاطر داشته باشید که ممکن است به سبکهای مختلفی از دستورات نیاز داشته باشد. پس کمی با آن بازی کنید.»

در آزمایشهای کوتاه من، V7 تا حدودی به دستورات من پایبند بود، اگرچه فرصت کافی برای آزمایش کامل مدل را نداشتم.

Midjourney یک عملیات غیرمعمول است. این سرویس در سال ۲۰۲۲ توسط هولز، که یکی از بنیانگذاران شرکت تولیدکننده لوازم جانبی رایانه Leap Motion است، راهاندازی شد و هیچ سرمایه خارجی جذب نکرده است.
در اواخر سال ۲۰۲۳، گزارش شد که Midjourney انتظار داشت حدود ۲۰۰ میلیون دلار درآمد کسب کند. اخیراً، این شرکت مستقر در سان فرانسیسکو اعلام کرد که در حال ایجاد یک تیم سختافزاری برای کار بر روی برخی پروژهها است که جزئیات آنها را فاش نکرد، و به آموزش مدلهای قبلاً اعلام شده برای تولید ویدئو و اشیاء سه بعدی ادامه میدهد.
این شرکت با چندین شکایت روبرو است که آن را به نقض حقوق میلیونها هنرمند از طریق آموزش ابزارهای هوش مصنوعی بر روی تصاویری که از وب بدون رضایت خالقان تصاویر جمعآوری شدهاند، متهم میکنند.
منبع: تککرانچ