مایکروسافت ابزار هوش مصنوعی جدیدی به نام VASA-1 را توسعه داده است که با استفاده از تصویر و فایل صوتی میتواند ویدئو تولید کند.
بهگزارش تکناک، هوش مصنوعی مولد (Generative AI) همچنان به بازآفرینی دنیای دیجیتال ما ادامه میدهد و هر چند وقت یک بار گامهای روبهجلو مهمی برمیدارد.
جدیدترین نوآوری مایکروسافت ممکن است تابهامروز پیشگامانهترین و درعینحال نگرانکنندهترین آنها باشد.
VASA-1، هوش مصنوعی تبدیل تصویر به ویدئو مایکروسافت، مرز بین ویدئو واقعی و ساختهشده را از میان برمیدارد. این مدل فقط با تصویر و فایل صوتی، میتواند فیلمهایی باورنکردنی و واقعگرایانه تولید کند؛ بهطوریکه حرکات لبها و حالتهای چهره کاملاً طبیعی بهنظر میرسد.
اندروید آتوریتی مینویسد که مایکروسافت از قدرت VASA-1 کاملاً آگاه است. این شرکت اشاره میکند که هوش مصنوعی مذکور نهتنها میتواند بهطور دقیق حرکت لبها و صدا را همگامسازی کند؛ بلکه میتواند طیف وسیعی از احساسات و ظرافتهای احساسی صورت و حرکات طبیعی سر را بهتصویر بکشد که به درک واقعگرایی و زندهبودن آن کمک میکند.
هوش مصنوعی VASA-1 ویدئوهایی با رزولوشن مناسب (512 در 512) را با نرخ فریم درخورتوجه 45 فریمبرثانیه تولید میکند. نکته جالبتر اینکه، میتواند در لحظه و با سرعت 40 فریمبرثانیه ویدئوهای چهره سخنگو با ظاهری طبیعی تولید کند.
کاربردهای بالقوه VASA-1 وسوسهانگیز هستند. بااینحال، احتمال سوءاستفاده از آن نیز به همان اندازه زیاد است؛ بهگونهای که بلافاصله نگرانیهایی درباره دیپفیکهای بسیار باورپذیر بهوجود میآورد که میتوانند اطلاعات نادرست را منتشر کنند و به اعتماد عمومی ضربه بزنند. مایکروسافت بهخوبی از این موضوع آگاه است و تأکید میکند که این فناوری دستکم فعلاً فقط تلاشی تحقیقاتی است.
خوشبختانه مایکروسافت همچنان بر این باور است که این فناوری قدرتمند را بهزودی منتشر نخواهد کرد. برنامه این شرکت برای انتظار تا وضع قوانین بازدارنده درخورتحسین است و باید به رویهای عادی برای کل صنعت فناوری تبدیل شود.
سرعت سرسامآور نوآوری و پیشبینی آینده پیامدهای سیستمهایی مانند VASA-1 را به کاری دلهرهآور تبدیل میکند. اگر چنین ابزاری دراختیار عموم قرار گیرد، آیا باعث ایجاد موج جدیدی از خلاقیت و دسترسی خواهد شد یا بر موج فزایندهی بیاعتمادی و دستکاری دامن خواهد زد؟ دیدگاه شما کاربران تکناک درباره این موضوع چیست؟