تب هوش مصنوعی مولد، که ابتدا با پاسخهای متنی ChatGPT آغاز شد، به سرعت به دیگر عرصهها گسترش یافته و اکنون شامل تولید تصویر و حتی تولید ویدئو شده است.
به گزارش تکناک،این تحول سریع در صنعت تکنولوژی باعث شده است که شرکتهای بزرگی همچون آمازون، یوتیوب، علی بابا و استودیوی فیلمسازی Lionsgate وارد این حوزه شوند و ابزارهای جدیدی برای تولید محتوای ویدئویی از طریق توضیحات متنی ارائه دهند.اما این فناوری هنوز راه درازی تا تکامل دارد.
فهرست مطالب
معرفی ابزارهای جدید هوش مصنوعی ویدئویی
هفته گذشته، چهار ابزار جدید توسط این شرکتهای بزرگ معرفی شدند. این ابزارها قادر به تولید ویدئو از توضیحات نوشتاری ساده هستند.
به عنوان مثال، شما میتوانید عبارتی مانند «ویدئویی از سگی که توپ میگیرد بساز» را وارد کنید و این ابزارها بر اساس آن یک ویدئو تولید میکنند. با این حال، این فناوری هنوز در مراحل ابتدایی خود قرار دارد و نیاز به پیشرفتهای بیشتری دارد.
یکی از این ابزارها، Veo، محصول YouTube است. این ابزار فعلاً تنها قادر به ایجاد پسزمینهای به سبک پرده سبز برای کلیپهای عمودی کوتاه (Shorts) است. اما قرار است در سال ۲۰۲۴ قابلیت تولید کلیپهای کامل (تا شش ثانیه طول) نیز به این ابزار اضافه شود.
از سوی دیگر، ابزار Amazon به فروشندگان این امکان را میدهد تا تبلیغات سادهای ایجاد کنند. یکی از نمونههای ارائه شده توسط این ابزار، ویدئویی از یک فنجان قهوه در حال بخار کردن در پسزمینهای مصنوعی است. جزئیات درباره ابزار Alibaba هنوز به طور کامل فاش نشده است، اما معرفی آن همراه با انتشار ۱۰۰ مدل متنباز توسط این شرکت انجام شده است.
رقابت OpenAI و دیگران در عرصه تولید ویدئو
با وجود این پیشرفتها، ابزارهای ذکر شده در مقایسه با آنچه که OpenAI با مولد ویدئویی Sora وعده داده است، بسیار ساده به نظر میرسند. Sora میتواند ویدئوهای بیصدای تا ۶۰ ثانیه تولید کند.
این ابزار که در فوریه امسال معرفی شد، توجه بسیاری را به خود جلب کرد. با استفاده از Sora، حتی شرکت Toys R Us توانست یک تبلیغ کامل با داستانی کامل و انیمیشنی بینقص تولید کند.
هرچند Sora هنوز برای استفاده عمومی عرضه نشده است، Mira Murati، مدیر فناوری OpenAI اعلام کرده که این ابزار تا پایان امسال در دسترس عموم قرار خواهد گرفت. همچنین، قابلیت تولید صدا نیز به زودی به آن اضافه خواهد شد.
در این بین، OpenAI تمرکز خود را روی انتشار دو مدل جدید هوش مصنوعی گذاشته است: GPT-4o و GPT-o1. مدل دوم، که با نام “Strawberry” شناخته میشود، به طور خاص برای دانشمندان و مهندسانی طراحی شده که با مسائل پیچیده استدلالی سر و کار دارند.
آیا آمازون و یوتیوب از OpenAI جلوتر هستند؟
در حال حاضر، با توجه به عرضه عمومی ابزارهای Amazon و YouTube برای تولید ویدئو، این شرکتها در ارائه ابزارهای عملی برای عموم از OpenAI جلوتر هستند. حتی اگر Sora از نظر فنی ابزار بهتری برای تولید ویدئو باشد، ادغام ابزارهای Amazon و YouTube در سایتهای پرطرفدار و پرمخاطب ممکن است باعث شود که این دو شرکت استفاده بیشتری از ابزارهای خود ببرند.
به علاوه، هنوز مشخص نیست هزینه استفاده از Sora چقدر خواهد بود و چه محدودیتهایی برای کاربران وجود خواهد داشت.
چالشهای امنیتی و اخلاقی
تولید ویدئوهای هوش مصنوعی نگرانیهای بسیاری را درباره ویدئوهای جعلی (deepfakes) افزایش داده است. از گذشته، ویدئوها به عنوان منبع نهایی حقیقت در نظر گرفته میشدند. در حالی که ایمیلها، متون و عکسها میتوانند به راحتی دستکاری شوند، دستکاری ویدئوها دشوارتر بود. اما با پیشرفت این فناوری، امکان ساخت ویدئوهای جعلی از افراد به وجود آمده است که میتواند به تخریب یا سوءتعبیر از آنها منجر شود.
اگرچه این فناوری برخی استفادههای مثبت نیز داشته است؛ برای مثال، روزنامهنگاران در ونزوئلا از آن برای تولید ویدئوهای خبری استفاده کردهاند. اما به نظر میرسد که پتانسیل سوءاستفادههای احتمالی از این فناوری بیشتر از مزایای آن باشد.
چالشهای قانونی و آینده
در ایالات متحده، هنوز قوانین مشخصی برای نظارت بر این فناوری وجود ندارد و سودآوری همچنان انگیزه اصلی شرکتهاست. برخی شرکتها مانند Google با ابزار Gemini محدودیتهایی برای تولید تصاویر افراد عمومی، از جمله نامزدهای ریاست جمهوری، وضع کردهاند. اما چت بات Grok AI متعلق به ایلان ماسک به کاربران اجازه میدهد که تصاویر افراد معروف را، بدون توجه به میزان عجیب بودن درخواست، تولید کنند.
بدون هیچگونه قانونگذاری و با انگیزههای عظیم سودآوری، این سوال مطرح میشود که این فناوری چگونه به پیش خواهد رفت و چه مشکلاتی ممکن است در آینده ایجاد کند؟
در حالی که شرکتهای بزرگ تکنولوژی همچون Amazon، YouTube، و OpenAI در حال رقابت برای تسلط بر بازار تولید ویدئوهای هوش مصنوعی هستند، همچنان سوالات زیادی درباره تأثیرات اجتماعی، اخلاقی و امنیتی این فناوری وجود دارد.
این ابزارها به سرعت در حال گسترش هستند و ممکن است در آیندهای نزدیک تحولی بزرگ در نحوه تولید و مصرف محتوای دیجیتال ایجاد کنند. اما باید دید که آیا قوانین و مقررات لازم برای نظارت بر این فناوریها وضع خواهند شد یا خیر.