شرکت انویدیا در کنفرانس GTC 2024 مدل جدید هوش مصنوعی خود به نام Latte3D را رونمایی کرد. این هوش مصنوعی با دستورهای متنی مدل سهبعدی خلق میکند.
بهگزارش تکناک، انویدیا مدل جدید هوش مصنوعی Latte3D رونمایی کرد. Latte3D مانند ChatGPT بسیار قدرتمند است که میتواند مدلهای سهبعدی را از متن توضیحی بسازد و بدینترتیب، انقلابی در شیوه کار خالقان محتوا ایجاد کند. Latte3D بسیار سریعتر از مدلهای قدیمیتر و همچون چاپگر سهبعدی مجازی عمل میکند که میتواند برای خالقان محتوا در بسیاری از صنایع مفید باشد.
همانطورکه در وبلاگ انویدیا اعلام شد، این غول سازنده کارتهای گرافیک سخت مشغول توسعه مدلی از هوش مصنوعی بوده است که بتواند ورودیهای متنی را دریافت و آنها را به مدل سهبعدی تبدیل کند. تاکنون، هوش مصنوعی عمدتاً به تصویرها و ویدئوهای دوبعدی محدود بوده است؛ اما این پیشرفت میتواند نحوه استفاده از هوش مصنوعی در صنعت بازیهای ویدئویی را متحول کند.
اگر توسعهدهندهای بخواهد مدل سهبعدی از موضوعی را به بازی خود اضافه کند، میتواند از Latte3D درخواست کند تا برای او محتوایی سهبعدی تولید کند. سانجا فیدلر، معاون تحقیقات هوش مصنوعی در انویدیا، درباره Latte3D گفت:
یک سال پیش، تولید تصاویر سهبعدی با این کیفیت بهکمک مدلهای هوش مصنوعی یک ساعت طول میکشید؛ ولی حالا این فرایند حدود ۱۰ تا ۱۲ ثانیه بهطول میانجامد. اکنون میتوانیم نتایج را با سرعتی بهمراتب بیشتر ارائه کنیم و نسل جدیدی از تولید متن به تصویر سهبعدی با زمان تقریباً لحظهای را برای خالقان محتوا در صنایع گوناگون دردسترس قرار دهیم.
در نمایش اولیه انویدیا از مدل Latte3D، بهنظر میرسد استفاده از آن بسیار ساده است. هوش مصنوعی پس از دریافت توضیح متنی کوتاه، مدل سهبعدی را تولید و کمی بعد آن را با جزئیات بیشتری کامل میکند. درحالیکه نتیجه نهایی بهاندازه مدل Sora شرکت OpenAI به واقعیت شباهت ندارد، هدف این مدل هم رسیدن به آن سطح از واقعیت نیست؛ بلکه هدف این است که بهجای ساخت محتواها از ابتدا، به فرایند ساخت آنها سرعت ببخشد.
هوش مصنوعی Latte3D گزینههای مختلفی را برای انتخاب دردسترس کاربر قرار میدهد و انویدیا میگوید که این اشکال را میتوان در چند دقیقه برای کیفیت بهتر بهینه کرد. سپس میتوان طرحها را به پلتفرمهای مختلفی مانند Omniverse انویدیا صادر و آنها را برای مطابقت با نتیجه نهایی مدنظر تنظیم کرد.
انویدیا با استفاده از پردازندههای گرافیکی Ada A100 Tensor Core خود، Latte3D را آموزش داد و از توضیحات متنی ChatGPT برای آمادهسازی آن برای تعامل با کاربران واقعی پشتیبانی کرد.
درحالحاضر، Latte3D فقط میتواند از اشیاء و حیوانات مدل سهبعدی تولید کند؛ بنابراین، بهنظر میرسد در تشخیص حیوانات مختلف و بافتها و انواع اشیاء موفق عمل میکند. انویدیا این قابلیتها را با نمایش اشیائی مانند لکلک تاجدار (قلاببافی) یا گربه ابوالهول اریگامی بهرخ کشید. به این مدل یاد داده شده است که گونههای مختلف را تشخیص دهد؛ پس میتواند تفاوت بین تازی ایتالیایی و شيباهينو را تشخیص دهد.
آن دسته از خالقان محتوا که میخواهند از Latte3D برای کارهای بیشتری استفاده کنند، آن را روی مجموعه داده متفاوتی مانند گیاهان یا اشیاء خانگی میتوانند آموزش دهند و بعداً برای اهداف خودشان از آن استفاده کنند.
اعلامیههای اخیر مرتبط با استفاده از هوش مصنوعی در توسعه بازی همگی کاملاً پیشگامانه هستند و Latte3D انویدیا به فهرست روبهافزایش از ابزارهایی میپیوندد که ممکن است روزی بهطور کامل فرایند ساخت بازی را تغییر دهند.
برای مثال، انویدیا بهتازگی شخصیتهای غیرقابلبازی (NPC) با دیالوگهای تولیدشده بهکمک هوش مصنوعی را رونمایی کرده است. در همین حال، جدیدترین بهروزرسانی موتور بازیسازی آنریل انجین میتواند با کمک یادگیری ماشین، تصاویر باکیفیت فیلم را بهصورت Real-Time در بازیها تولید کند.