قابلیت تولید تصویر ChatGPT ارتقا یافت

خبر فوری

زمان مطالعه: 2 دقیقه

علیرضا رحیمی
9 فروردین 1404
15:42

خبر فوری

قابلیت تولید تصویر ChatGPT ارتقا یافت

زمان مطالعه: 2 دقیقه

علیرضا رحیمی
9 فروردین 1404
15:42

در جریان یک پخش زنده روز سه‌شنبه، سام آلتمن، مدیرعامل OpenAI، اولین ارتقاء عمده قابلیت‌های تولید تصویر ChatGPT را در بیش از یک سال گذشته اعلام کرد.

ChatGPT اکنون می‌تواند از مدل GPT-4o این شرکت برای ایجاد و ویرایش بومی تصاویر و عکس‌ها استفاده کند. GPT-4o مدت‌هاست که زیربنای پلتفرم چت‌بات مبتنی بر هوش مصنوعی را تشکیل می‌دهد، اما تا کنون، این مدل فقط قادر به تولید و ویرایش متن بود، نه تصاویر.

آلتمن گفت که تولید تصویر بومی GPT-4o امروز در ChatGPT و Sora، محصول تولید ویدئوی هوش مصنوعی OpenAI، برای مشترکین طرح Pro با هزینه ۲۰۰ دلار در ماه، فعال شده است. OpenAI می‌گوید این ویژگی به زودی برای کاربران Plus و رایگان ChatGPT و همچنین توسعه‌دهندگانی که از سرویس API این شرکت استفاده می‌کنند، عرضه خواهد شد.

GPT-4o با خروجی تصویر، به گفته OpenAI، کمی بیشتر از مدل تولید تصویر قبلی خود، DALL-E 3، “فکر می‌کند” تا تصاویر دقیق‌تر و با جزئیات بیشتری تولید کند. GPT-4o می‌تواند تصاویر موجود، از جمله تصاویر حاوی افراد را ویرایش کند، آن‌ها را تغییر دهد یا جزئیاتی مانند اشیاء پیش‌زمینه و پس‌زمینه را “نقاشی درون تصویر” کند.

OpenAI به وال استریت ژورنال گفت که برای تقویت ویژگی جدید تصویر، GPT-4o را بر روی “داده‌های در دسترس عموم” و همچنین داده‌های اختصاصی حاصل از مشارکت‌هایش با شرکت‌هایی مانند Shutterstock آموزش داده است.

بسیاری از فروشندگان هوش مصنوعی مولد، داده‌های آموزشی را یک مزیت رقابتی می‌دانند، بنابراین آن را و هر اطلاعات مربوط به آن را محرمانه نگه می‌دارند. اما جزئیات داده‌های آموزشی همچنین یک منبع بالقوه برای دعاوی مربوط به مالکیت معنوی است، که یک عامل بازدارنده دیگر برای شرکت‌ها برای افشای اطلاعات زیاد است.

برد لایت‌کپ، مدیر ارشد عملیاتی OpenAI، در بیانیه‌ای به ژورنال گفت: “ما به حقوق هنرمندان از نظر نحوه خروجی احترام می‌گذاریم و سیاست‌هایی داریم که از تولید تصاویری که مستقیماً از آثار هنرمندان زنده تقلید می‌کنند، جلوگیری می‌کند.”

OpenAI یک فرم انصراف ارائه می‌دهد که به سازندگان اجازه می‌دهد درخواست کنند آثارشان از مجموعه‌داده‌های آموزشی آن حذف شود. این شرکت همچنین می‌گوید که به درخواست‌ها برای جلوگیری از جمع‌آوری داده‌های آموزشی، از جمله تصاویر، از وب‌سایت‌ها توسط ربات‌های وب‌کاوی خود احترام می‌گذارد.

ویژگی ارتقاء یافته تولید تصویر ChatGPT، به دنبال خروجی تصویر بومی آزمایشی گوگل برای Gemini 2.0 Flash، یکی از مدل‌های اصلی این شرکت، ارائه می‌شود. این ویژگی قدرتمند در رسانه‌های اجتماعی به سرعت پخش شد، اما لزوماً به دلایل مثبت. مشخص شد که بخش تصویر Gemini 2.0 Flash محافظ‌های کمی دارد و به افراد اجازه می‌دهد واترمارک‌ها را حذف کنند و تصاویری از شخصیت‌های دارای حق چاپ ایجاد کنند.

منبع: تک‌کرانچ

chatgpt، openai، اخبار مدل‌ها، اوپن‌ای‌آی، تولید تصویر، چت‌بات هوش مصنوعی، چت‌جی‌پی‌تی، سام آلتمن

اشتراک گذاری:

آخرین مقالات پیشنهادی

انواع یادگیری در شبکه‌های عصبی ژرف

مقدمه‌ای بر زندگی مصنوعی برای دوست‌داران هوش‌مصنوعی

قسمت دوم: چگونه کار می‌کنند؟ (فناوری‌های زیربنایی ماشین‌های خودران)

قسمت اول: ماشین‌های خودران، سفری به آینده‌ای بدون راننده

علیرضا رحیمی

دانشجوی دکتری کامپیوتر - هوش مصنوعی هستم. تخصص من در توسعه مدل‌های یادگیری ماشین و بهینه‌سازی جریان‌های کاری داده‌ها برای استخراج بینش‌های ارزشمند از داده‌های پیچیده است. علاقه‌مند به استفاده از هوش مصنوعی و مهندسی داده برای ایجاد راه‌حل‌های مقیاس‌پذیر جهت بهبود هوش تجاری و تصمیم‌گیری هستم.

مشاهده کلیه مقالات

دیدگاه‌ها

اشتراک در

0 Comments

قدیمی‌ترین

تازه‌ترین بیشترین رأی

بازخورد (Feedback) های اینلاین

مشاهده همه دیدگاه ها

دیتانید تو مراحل مختلف تحلیل داده می‌تونه به شما کمک کنه:

امکان‌سنجی خواسته‌ها و تطبیق نیازمندی‌ها
استخراج و تمیز کردن دادگان
طراحی مدل‌های مناسب
آموزش مدل براساس داده‌های به‌دست آمده
استقرار مدل

آخرین اخبار

اخبار مشابه

Cursor یک اپلیکیشن وب برای مدیریت عوامل کدنویسی هوش مصنوعی راه‌اندازی می‌کند

شرکت سازنده Cursor، ویرایشگر کدنویسی هوش مصنوعی پرطرفدار، روز دوشنبه یک اپلیکیشن وب راه‌اندازی کرد که به کاربران امکان می‌دهد شبکه‌ای از عوامل کدنویسی

cursor ai، اخبار مدل‌ها، برنامه نویسی با هوش مصنوعی، دستیار کدنویسی، دستیار کدنویسی هوش مصنوعی، کدنویسی، کدنویسی هوش مصنوعی، هوش مصنوعی

علیرضا رحیمی

۱۰ تیر ۱۴۰۴

گوگل از Gemini CLI، یک ابزار هوش مصنوعی متن‌باز برای ترمینال‌ها رونمایی کرد

گوگل در حال راه‌اندازی یک ابزار هوش مصنوعی عاملی جدید است که مدل‌های هوش مصنوعی Gemini آن را به محل کدنویسی توسعه‌دهندگان نزدیک‌تر می‌کند...

ابزار هوش مصنوعی گوگل، اخبار مدل‌ها، جمینای، گوگل جمینی، مدل متن‌باز، مدل هوش مصنوعی متن باز، مدل‌های Gemini گوگل، هوش مصنوعی، هوش مصنوعی گوگل

علیرضا رحیمی

۱۰ تیر ۱۴۰۴

Midjourney اولین مدل تولید ویدیوی هوش مصنوعی خود، V1 را راه‌اندازی کرد

Midjourney، یکی از محبوب‌ترین استارت‌آپ‌های تولید تصویر هوش مصنوعی، روز چهارشنبه راه‌اندازی مدل تولید ویدیوی هوش مصنوعی مورد انتظار خود، V1 را اعلام ک

Midjourney، اخبار مدل‌ها، تولید ویدیو با هوش مصنوعی، میدجرنی، هوش مصنوعی

علیرضا رحیمی

۱۰ تیر ۱۴۰۴

تحلیل‌هاتو به ما بسپار |‌ ارائه‌ی راهکارهای جامع مبتنی بر داده

دسترسی سریع

شبکه‌های اجتماعی

تمامی حقوق مادی و معنوی این وبسایت متعلق به مجموعه دیتانید است.

اشتراک گذاری:

انواع یادگیری در شبکه‌های عصبی ژرف

مقدمه‌ای بر زندگی مصنوعی برای دوست‌داران هوش‌مصنوعی

قسمت دوم: چگونه کار می‌کنند؟ (فناوری‌های زیربنایی ماشین‌های خودران)

قسمت اول: ماشین‌های خودران، سفری به آینده‌ای بدون راننده

علیرضا رحیمی

Cursor یک اپلیکیشن وب برای مدیریت عوامل کدنویسی هوش مصنوعی راه‌اندازی می‌کند

گوگل Doppl را راه‌اندازی کرد، یک اپلیکیشن جدید که به شما امکان می‌دهد تصور کنید یک لباس چگونه بر تنتان به نظر می‌رسد

گوگل از Gemini CLI، یک ابزار هوش مصنوعی متن‌باز برای ترمینال‌ها رونمایی کرد

Midjourney اولین مدل تولید ویدیوی هوش مصنوعی خود، V1 را راه‌اندازی کرد

مدل‌های هوش مصنوعی ارتقاءیافته اپل در زمینه عملکرد، ناامیدکننده ظاهر شدند

ادعای محقق سابق OpenAI: چت‌جی‌پی‌تی در سناریوهای تهدیدکننده زندگی از خاموش شدن جلوگیری می‌کند

دسترسی سریع

شبکه‌های اجتماعی