باتوجهبه تصاویری که کاربران مختلف با Stable Diffusion 3 تولید کردهاند، این هوش مصنوعی خروجیهای عجیبوغریب و حتی وحشتناکی ارائه داده است.
بهگزارش تکناک، روز چهارشنبه، Stability AI وزنهای Stable Diffusion 3 Medium را منتشر کرد. این مدل هوش مصنوعی مولد تصویر دستورهای متنی را به تصاویر تولیدشده با هوش مصنوعی تبدیل میکند.
بااینحال، بهدلیل اینکه تصاویر انسانها را بهگونهای تولید میکند که بهنظر میرسد گامی عقبگرد از سایر هوشهای مصنوعی مولد تصویر مانند میدجنری یا DALL-E 3 برداشته است، این مدل در فضای آنلاین با تمسخر مواجه شد.
در ردیت، تاپیکی با عنوان «آیا این انتشار قرار است یک شوخی باشد؟» به جزئیات ناکامیهای چشمگیر Stable Diffusion 3 Medium در نمایش انسانها، بهویژه اندامهای انسانی مانند دست و پا میپردازد. تاپیک دیگری با عنوان «چرا Stable Diffusion 3 در تولید تصاویر دختران درازکشیده روی چمن اینقدر بد است؟» مشکلات مشابهی را نشان میدهد؛ اما برای کل بدن انسان.
دستها همیشه بهدلیل کمبود نمونههای مناسب در مجموعه دادههای آموزشی اولیه، برای هوشهای مصنوعی مولد دشوار بودهاند. بااینحال، اخیراً بهنظر میرسد چندین مدل هوش مصنوعی مولد تصویر بر این مشکل غلبه کردهاند. از این نظر، Stable Diffusion 3 بهنظر میرسد عقبگرد بزرگی برای علاقهمندان به ترکیب تصویر باشد؛ بهویژه درمقایسهبا نسخههای اخیر Stability مانند SD XL Turbo در نوامبر.
Arstechnica مینویسد:
تاکنون، طرفداران تصاویر هوش مصنوعی ناکامیهای آناتومی Stable Diffusion 3 را به اصرار Stability در فیلترکردن محتوای بزرگسالان که اغلب بهعنوان محتوای NSFW شناخته میشود، از دادههای آموزشی Stable Diffusion 3 که به مدل آموزش میدهد چگونه تصاویر را تولید کند، نسبت میدهند.
مشکل دیگری که ممکن است در پیشآموزش مدل رخ دهد، این است گاهی اوقات فیلتر NSFW که محققان برای حذف تصاویر بزرگسال از مجموعه داده استفاده میکنند، بیشازحد حساس عمل و بهطور تصادفی تصاویری را حذف میکند که ممکن است توهینآمیز نباشند و مدل را از نمایش انسانها در موقعیتهای خاص محروم میکند. یکی از کاربران ردیت دراینباره نوشت:
تا زمانیکه هیچ انسانی در تصویر نباشد، بهخوبی کار میکند. فکر میکنم فیلتر NSFW بهبودیافتهی آنها برای فیلترکردن دادههای آموزشی تصمیم گرفته که هر چیز انساننمایی نامناسب است.
شرکت Stability AI اخیراً با استعفای مدیرعامل و بنیانگذار خود، عماد مستقی، در مارس و سپس تعدیل نیرو به سراشیبی سقوط کرد. درست قبلازآن، سه مهندس خبره، روبین رومباخ و آندریاس بلاتمن و دومینیک لورنز، شرکت را ترک کردند.
مشکلات این شرکت حتی به گذشته دورتر و به وضعیت مالی وخیم شرکت از سال ۲۰۲۳ باز میگردد. برای برخی از طرفداران Stable Diffusion، شکستهای Stable Diffusion 3 Medium نشانهای عینی از سوءمدیریت این شرکت و فروپاشی اوضاع است.