شرکت OpenAI نسخه جدید ابزار «ChatGPT Images» را با تمرکز بر دقت بالاتر، سرعت بیشتر و حفظ جزئیات بصری، بهصورت رسمی معرفی کرد.
به گزارش سرویس اخبار هوش مصنوعی این بهروزرسانی که بر پایه مدل جدید تولید تصویر OpenAI توسعه یافته است، امکان ویرایش و تولید تصاویر را با کیفیت بالاتر و تطابق دقیقتر با خواست کاربر فراهم میکند و از امروز در اختیار همه کاربران ChatGPT و همچنین توسعهدهندگان API قرار گرفته است.
OpenAI اعلام کرده است که در این نسخه، مدل تولید تصویر توانایی انجام ویرایشهای بسیار دقیقتری را دارد و میتواند تنها بخشهایی از تصویر را که کاربر مشخص کرده تغییر دهد، بدون آنکه عناصر مهمی مانند نورپردازی، ترکیببندی یا ظاهر افراد دچار تغییر ناخواسته شود. این موضوع بهویژه در ویرایش عکس، امتحانکردن لباس و مدل مو، و اعمال فیلترهای سبکی اهمیت زیادی دارد و باعث میشود نتیجه نهایی به تصویر ذهنی کاربر نزدیکتر باشد.
بر اساس توضیحات ارائهشده شرکت OepnAI، سرعت تولید تصویر در نسخه جدید تا چهار برابر افزایش یافته است. این افزایش سرعت به کاربران اجازه میدهد ایدههای بیشتری را در زمان کوتاهتری آزمایش کنند و همزمان چند فرایند تولید تصویر را پیش ببرند، بدون آنکه منتظر تکمیل هر مرحله بمانند. OpenAI این ویژگی را گامی مهم برای تبدیل ChatGPT Images به یک ابزار خلاقانه روزمره توصیف کرده است.
یکی از مهمترین پیشرفتها، بهبود چشمگیر در ویرایش تصاویر بارگذاریشده است. مدل جدید میتواند تغییراتی مانند افزودن، حذف، ترکیب یا جابهجایی عناصر را با دقت بالا انجام دهد، در حالی که ویژگیهای اصلی تصویر حفظ میشود. این قابلیت به کاربران حرفهای و تولیدکنندگان محتوا اجازه میدهد اصلاحهای پیچیدهتری را انجام دهند، بدون آنکه کیفیت یا هویت تصویر از بین برود.
در کنار ویرایش، دگرگونیهای خلاقانه نیز نقش پررنگتری در این نسخه دارند. مدل جدید قادر است عناصر مفهومی مانند متن، چیدمان و سبک هنری را به تصویر اضافه کند و در عین حال ماهیت تصویر اصلی را نگه دارد. این قابلیت هم برای پروژههای ساده و هم برای مفاهیم پیچیده کاربرد دارد و از طریق مجموعهای از سبکها و ایدههای آماده در دسترس کاربران ChatGPT Images قرار گرفته است.
OpenAI همچنین از بهبود قابل توجه در پیروی از دستورها خبر داده است. در نسخه جدید، مدل روابط میان عناصر تصویر را دقیقتر درک میکند و در ترکیبهای پیچیده نیز مطابق خواست کاربر عمل میکند. این موضوع بهویژه در تولید تصاویر چندبخشی یا دارای ساختار مشخص اهمیت دارد و خطاهای رایج نسخههای پیشین را کاهش میدهد.
نمایش متن در تصاویر نیز یکی دیگر از حوزههایی است که ارتقا یافته است. مدل جدید میتواند متنهای متراکم و کوچک را با وضوح بالاتر رندر کند، قابلیتی که برای طراحی پوستر، اینفوگرافیک، ماکاپهای خبری و محتوای آموزشی اهمیت زیادی دارد.

همزمان با معرفی مدل جدید، یک فضای اختصاصی برای تولید و آزمایش تصاویر در رابط کاربری ChatGPT اضافه شده است. این بخش که در نوار کناری ChatGPT در دسترس قرار دارد، شامل فیلترهای آماده، دستورهای ترندشده و ابزارهایی برای شروع سریع فرایند خلاقانه است. همچنین امکان بارگذاری یکباره چهره فراهم شده تا کاربران بتوانند از ظاهر خود در تولیدهای بعدی بدون نیاز به بارگذاری مجدد استفاده کنند.
OpenAI تأکید کرده است که با وجود این پیشرفتها، مدل جدید همچنان بینقص نیست. ارزیابی مجدد نمونههای اولیه نشان میدهد که دقت و کیفیت خروجیها بهطور محسوسی افزایش یافته، اما در برخی موارد مانند سبکهای خاص، چهرههای متعدد یا دقت علمی، محدودیتهایی باقی مانده است. با این حال، این شرکت این نسخه را یک گام مهم رو به جلو در مسیر توسعه ChatGPT Images میداند.
بیشتر بخوانید: چگونه از ChatGPT پاسخ های دقیق بگیریم؟
به نقل از انگجت، نسخه API این مدل با نام GPT Image 1.5 نیز در دسترس توسعهدهندگان قرار گرفته است. این نسخه، علاوه بر بهبود کیفیت و ثبات بصری، حدود ۲۰ درصد هزینه کمتری نسبت به نسل قبلی دارد و برای کاربردهایی مانند طراحی گرافیک، بازاریابی، تولید محتوای تجاری و کاتالوگهای فروش آنلاین مناسبتر شده است.
OpenAI در پایان اعلام کرده است که نسخه جدید ChatGPT Images از امروز بهصورت جهانی برای همه کاربران فعال شده و نسخه قبلی همچنان بهعنوان یک GPT سفارشی قابل استفاده خواهد بود. این شرکت تأکید میکند که تولید تصویر هنوز در ابتدای مسیر توسعه قرار دارد و بهروزرسانیهای آینده با تمرکز بر دقت بیشتر، ویرایشهای ظریفتر و پشتیبانی گستردهتر از زبانها ارائه خواهد شد.

















