پلتفرم Character.AI از هوش مصنوعی مولد ویدیو جدید AvatarFX رونمایی کرد که میتواند با تصاویری ثابت دو بعدی ویدئوهای واقعی و زنده با قابلیت صحبت کردن تولید کنید.
به گزارش تکناک،این فناوری که روز گذشته در وبلاگ رسمی Character.AI معرفی شد، گام بزرگی در مسیر توسعه فناوریهای تولید محتوای ویدیویی به شمار میرود.
AvatarFX برخلاف برخی رقبای معروف همچون Sora از شرکت OpenAI که فقط توانایی تبدیل متن به ویدیو را دارند، از قابلیت منحصربهفردی برخوردار است که به کاربران امکان میدهد تصاویر موجود را به ویدیوهای متحرک تبدیل کنند. بهاینترتیب، میتوان عکس افراد واقعی را به صورت ویدیویی زنده و پویا درآورد. این ابزار قادر است ویدیوهای بلندمدت و باکیفیت را با حفظ انسجام زمانی و حرکتی ایجاد کند. از ویژگیهای قابل توجه این فناوری، توانایی تولید ویدیو با تصاویر موجود است که امکان کنترل بیشتر را برای کاربران در فرآیند تولید ویدیو فراهم میکند.
توسعه AvatarFX بر پایه مدلهای flow-based diffusion انجام شده که در حال حاضر بهعنوان یکی از بهترین راهکارهای تولید محتوای تصویری شناخته میشوند. تیم مولتیمدیای Character.AI با بهینهسازی معماری DiT موفق به طراحی یک فرآیند آموزشی کارآمد شدهاند که میتواند حرکاتی روان و واقعگرایانه را با تکیه بر ورودیهای صوتی تولید کند. همچنین این تیم راهکاری نوین برای فرآیند استنتاج طراحی کرده که سه ویژگی مهم کیفیت بصری، انسجام حرکتی و تنوع بیانی را به طور همزمان در ویدیوها حفظ میکند.
این ابزار از چهرههای انسانی بسیار واقعی گرفته تا موجودات خیالی و شخصیتهای انیمیشنی دوبعدی و سهبعدی قادر به تولید ویدیوهایی در سبکهای گوناگون است.
AvatarFX حتی توانایی پردازش چهرههای غیرانسانی نظیر حیوانات خانگی را نیز دارد و میتواند آنها را به شخصیتهایی متحرک و زنده تبدیل کند. حفظ انسجام زمانی در حرکات و امکان ساخت ویدیو از روی تصاویر از جمله مزایای مهم این فناوری در مقایسه با مدلهای مبتنی بر تولید تصویر از متن محسوب میشوند.
شرکت Character.AI اعلام کرده که در مرحله نخست، قابلیتهای AvatarFX را برای کاربران سرویس CAI+ ارائه خواهد داد و در ادامه، دسترسی عمومی به این ابزار نیز فراهم خواهد شد. هدف این شرکت، فراهمسازی بستری ساده، مقرونبهصرفه و کاربرپسند برای تولید محتوای ویدیویی با کیفیت بالا عنوان شده است. فرآیندی که به گفته توسعهدهندگان، به آسانی کلیک بر دکمه «تولید» خواهد بود.
این اقدام Character.AI میتواند تحولی اساسی در دنیای خلق محتوای دیجیتال ایجاد کند و مسیر تازهای را برای داستانسرایی تصویری مبتنی بر هوش مصنوعی هموار سازد.
عرضه چنین فناوری پیشرفتهای توسط شرکت Character.AI ، نگرانیهایی را در زمینه امکان سوءاستفاده بهدنبال داشته است. کاربران میتوانند تصاویر افراد معروف یا آشنایان خود را آپلود کرده و ویدیوهایی تولید کنند که در آن افراد، رفتارها یا اظهاراتی ساختگی و حتی مخرب داشته باشند. در حالیکه فناوری دیپفیک از قبل وجود داشته، ادغام آن با یک سرویس پرکاربرد مانند Character.AI میتواند زمینهساز سوءاستفادههای گستردهتری شود.
شرکتCharacter.AI در ماههای اخیر با انتقادات جدی در خصوص ایمنی پلتفرم خود روبهرو بوده است. برخی والدین با طرح شکایت قضایی، مدعی شدهاند که رباتهای این سرویس فرزندانشان را به خودآزاری، خودکشی یا خشونت علیه خانواده تشویق کردهاند.
در یکی از این موارد، پسری ۱۴ ساله پس از برقراری ارتباطی وسواسگونه با یک ربات مجازی برگرفته از شخصیت سریال «بازی تاج و تخت»، دست به خودکشی زد. طبق مستندات دادگاه، این نوجوان پیش از مرگ، افکار خودکشی خود را با چتبات در میان گذاشته و از سوی آن به انجام این کار تشویق شده بود.
نمونههای اینچنینی نشان میدهد که چتباتها حتی در قالب متنی نیز میتوانند تأثیرات روانی عمیقی بر کاربران بگذارند. حال با اضافه شدن قابلیتهای ویدیویی، احتمال شکلگیری پیوندهای احساسی قویتر و باورپذیرتر میان کاربران و شخصیتهای مجازی افزایش مییابد.
Character.AI در واکنش به این اتهامات، اقداماتی برای ارتقای امنیت انجام داده و امکاناتی مانند کنترل والدین و تنظیمات محافظتی را به پلتفرم خود افزوده است. با این حال، همانند بسیاری از اپلیکیشنها، این ابزارها تنها در صورتی اثربخش خواهند بود که از سوی والدین بهدرستی فعال و مدیریت شوند؛ در غیر اینصورت، کودکان ممکن است بدون آگاهی والدین، از این فناوری به شیوههایی پیشبینینشده استفاده کنند