شرکت OpenAI مدل پیشرفته تولید تصویر خود با نام «gpt-image-1» را از طریق API در دسترس توسعهدهندگان قرار داده است. این مدل چندوجهی (multimodal) قادر است تصاویر را در سبکهای متنوع، با رعایت دستورالعملهای سفارشی، بهرهگیری از دانش جهان واقعی و رندر دقیق متن تولید کند.
به گزارش تکناک، شرکت OpenAI از در دسترس قرار گرفتن مدل جدید تولید تصویر خود با نام «gpt-image-1» برای سایر شرکتها خبر داد؛ مدلی که پیشتر در چتبات ChatGPT به دلیل توانایی خلق تصاویر متنوع از جمله در سبک انیمههای استودیو جیبلی و عروسکهای فانتزی، توجه بسیاری را به خود جلب کرده بود. حالا این مدل از طریق API اختصاصی OpenAI در اختیار پلتفرمها و توسعهدهندگان قرار میگیرد تا کاربردهای خلاقانه و تجاری گستردهای را ممکن سازد.
به گفته OpenAI، مدل «gpt-image-1» یک مدل «بومی چندوجهی» است که میتواند تصاویر را در سبکهای گوناگون تولید کند، از دستورالعملهای سفارشی دقیق پیروی کند، از دانش عمومی جهان بهره ببرد و حتی متن را بهدرستی در تصاویر رندر کند. این انعطافپذیری بالا باعث شده که دامنهی کاربردهای این مدل به حوزههای مختلفی مانند طراحی، بازاریابی، تولید محتوا و تجارت گسترش یابد.

به نقل از تککرانچ، در گام نخست، دو شرکت بزرگ و تأثیرگذار در حوزه طراحی، یعنی Adobe و Figma، استفاده از این مدل را در ابزارهای خود آغاز کردهاند:
- ادوبی این مدل را به اکوسیستم ابزارهای خلاقانه خود از جمله Firefly و Express اضافه کرده است. بهاینترتیب، طراحان، مصرفکنندگان و متخصصان کسبوکار میتوانند برای ایدهپردازی و خلق محتوای بصری، سبکهای متنوعی را تجربه کنند و از قابلیت انعطافپذیر مدل بهره ببرند.
- فیگما نیز با ادغام «gpt-image-1» در بخش Design خود، امکان تولید و ویرایش تصاویر تنها با دستورهای متنی ساده را فراهم کرده است. کاربران میتوانند سبک تصاویر را تغییر دهند، پسزمینه را گسترش دهند، اشیا را حذف یا اضافه کنند و در نتیجه به شکلی سریعتر و بصریتر ایدههای طراحی را اجرا کنند.
OpenAI همچنین اعلام کرده که همکاریهای گستردهتری را با دیگر شرکتها مانند Canva، GoDaddy و Instacart در دست دارد تا کاربردهای جدید این مدل در فضای API کشف و پیادهسازی شود.
در حال حاضر، مدل «gpt-image-1» از طریق Images API در دسترس است و به گفته این شرکت، پشتیبانی از Responses API نیز بهزودی به آن افزوده خواهد شد. این اقدام گامی مهم در مسیر گسترش فناوری هوش مصنوعی مولد در ابزارهای طراحی و تولید محتوا به شمار میرود.