• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » هوش مصنوعی متا مدل جدیدی برای تولید ویدئو از متن عرضه کرد

هوش مصنوعی متا مدل جدیدی برای تولید ویدئو از متن عرضه کرد

صمد کردی نوشته شده توسط صمد کردی
دوشنبه 11 مهر 1401 - 10:10 - به‌روزشده در دوشنبه 5 خرداد 1404 - 05:34
در اخبار هوش مصنوعی, فناوری
Make-A-Video
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

تیمی از مهندسان یادگیری ماشین از شرکت متا از سیستم جدیدی به نام Make-A-Video رونمایی کردند که به کاربران اجازه می‌دهد تا توصیف تقریبی از یک صحنه را تایپ کنند و ویدیوی کوتاهی مطابق با متن آن‌ها تولید می‌کند. این ویدیوها به صورت انیمیشن مصنوعی، تار و تحریف‌شده هستند، اما نشان‌دهنده پیشرفت قابل توجهی در زمینه تولید محتوای هوش مصنوعی هستند. سیستم قادر به تولید ویدیوهایی با حرکت‌های متنوع است که بیشتر از پنج ثانیه طول نمی‌کشد و فاقد صدا هستند. این ابزار می‌تواند برای سازندگان و هنرمندان مفید باشد، اما نگرانی‌هایی در خصوص استفاده نادرست آن، مانند تولید اطلاعات نادرست یا هرزه‌نگاری، وجود دارد. متا قصد دارد نسخه‌ای از این سیستم را منتشر کند، اما هنوز تاریخ دقیق آن مشخص نیست. این مدل در حال حاضر محدودیت‌هایی دارد، از جمله تولید ویدیوهای طولانی‌تر و صحنه‌های پیچیده‌تر. همچنین، این مدل تحت تأثیر سوگیری‌های اجتماعی است که ممکن است از داده‌های جمع‌آوری‌شده از وب ناشی شود.

به گزارش تک ناک، ویدیوها به صورت انیمیشن مصنوعی، تار و تحریف شده هستند، اما هنوز هم نشان دهنده پیشرفت قابل توجهی در زمینه تولید محتوای هوش مصنوعی خواهند بود.

متا در یک پست وبلاگی که این کار را اعلام کرد، گفت: تحقیقات مولد هوش مصنوعی با ارائه ابزارهایی به افراد برای ایجاد سریع و آسان محتوای جدید، بیان خلاقانه را به جلو می‌برد. تنها با چند کلمه یا خط متن، Make-A-Video می تواند تخیل را زنده کند و ویدیوهای منحصر به فردی را پر از رنگ ها و مناظر زنده بسازد.


مارک زاکربرگ، مدیرعامل متا در یک پست فیسبوک، این کار را «پیشرفت شگفت‌انگیز» توصیف کرد و افزود: تولید ویدیو بسیار سخت‌تر از عکس‌ها است، زیرا فراتر از تولید صحیح هر پیکسل، سیستم همچنین باید پیش‌بینی کند که چگونه در طول زمان این پیکسل ها باید تغییر کنند.

کلیپ ها بیشتر از پنج ثانیه نیستند و صدا ندارند اما طیف وسیعی از حرکت ها را در بر می گیرند. بهترین راه برای قضاوت در مورد عملکرد این مدل، تماشای خروجی آن است. هر یک از ویدیوهای زیر توسط Make-A-Video تولید شده است و با دستوری که برای تولید ویدیو استفاده شده است، شرح داده شده است.
با این حال، شایان ذکر است که ویدیو های زیر توسط متا در اختیار The Verge قرار گرفته است، که در حال حاضر به هیچکس اجازه دسترسی به مدل را نمی دهد. این بدان معناست که این کلیپ‌ها ممکن است برای نشان دادن سیستم در بهترین حالت انتخاب شده اند.

باز هم، در حالی که واضح است که این ویدیوها توسط رایانه تولید می شوند، خروجی چنین مدل های هوش مصنوعی در آینده نزدیک به سرعت بهبود می یابد. به عنوان مقایسه، تنها در عرض چند سال، تولیدکنندگان تصویر هوش مصنوعی از ایجاد تصاویر نامفهوم مرزی به محتوای واقعی فوتورالیستی تبدیل شده‌اند. اگرچه با توجه به پیچیدگی تقریباً بی حد و حصر موضوع، پیشرفت در ویدیو می تواند کندتر باشد، اما ارزش بالای تولید یکپارچه ویدیو باعث انگیزه بسیاری از مؤسسات و شرکت ها می شود تا منابع مالی بزرگی را در پروژه سرمایه گذاری کنند.

در پست وبلاگ متا که Make-a-Video را اعلام می کند، این شرکت خاطرنشان می کند که ابزارهای تولید ویدیو می توانند «برای سازندگان و هنرمندان» ارزشمند باشند. اما، مانند مدل های متن به تصویر، چشم اندازهای نگران کننده ای نیز وجود دارد. خروجی این ابزارها می‌تواند برای اطلاعات نادرست، تبلیغات، و – به احتمال زیاد، بر اساس آنچه در سیستم‌های تصویری هوش مصنوعی و دیپ‌فیک‌ها دیده‌ایم – برای تولید هرزه‌نگاری غیرتوافقی که می‌تواند برای آزار و اذیت و ارعاب زنان استفاده شود، استفاده شود.

  • بیشتر بخوانید: قابلیت تنظیم طول در مرورهای صوتی به NotebookLM اضافه شد

متا می‌گوید که در مورد چگونگی ساخت سیستم‌های هوش مصنوعی جدید مانند این فکر میکند و در حال حاضر فقط مقاله‌ای در مورد مدل Make-A-Video منتشر می‌کند. این شرکت می‌گوید که قصد دارد نسخه‌ای از این سیستم را منتشر کند، اما نمی‌گوید چه زمانی و چگونه دسترسی به این مدل ممکن است محدود شود.

همچنین شایان ذکر است که متا تنها شرکتی نیست که روی تولیدکننده‌های ویدیوی هوش مصنوعی کار می‌کند. به عنوان مثال، در اوایل سال جاری، گروهی از محققان دانشگاه Tsinghua و آکادمی هوش مصنوعی پکن (BAAI) مدل متن به ویدیوی خود را با نام CogVideo (تنها مدل دیگر متن به ویدیو در دسترس عموم) منتشر کردند. می‌توانید خروجی نمونه از CogVideo را در اینجا تماشا کنید، که تقریباً مانند کار متا محدود است.

Make-A-Video
در مقاله‌ای که این مدل را توصیف می‌کند، محققان متا خاطرنشان می‌کنند که Make-A-Video در حال آموزش روی جفت تصاویر و زیرنویس‌ها و همچنین فیلم‌های ویدیویی بدون برچسب است. محتوای آموزشی از دو مجموعه داده (WebVid-10M و HD-VILA-100M) که مجموعاً حاوی میلیون‌ها ویدیو هستند که صدها هزار ساعت فیلم را پوشش می‌دهند، تهیه شده است. این شامل فیلم های ویدئویی است که توسط سایت هایی مانند Shutterstock ایجاد شده و از وب جمع آوری شده است.

محققان در این مقاله خاطرنشان می‌کنند که این مدل محدودیت‌های فنی زیادی فراتر از فیلم‌های مبهم و انیمیشن‌های ناهمگون دارد. برای مثال، روش‌های آموزشی آن‌ها قادر به یادگیری اطلاعاتی نیستند که ممکن است فقط توسط یک انسان در حال تماشای یک ویدیو استنباط شود . از دیگر مشکلات می توان به تولید ویدیوهای طولانی تر از پنج ثانیه، ویدیوهایی با صحنه ها و رویدادهای متعدد و وضوح بالاتر اشاره کرد. مدل Make-A-Video در حال حاضر 16 فریم ویدئو با وضوح 64 در 64 پیکسل را تولید می کند که سپس با استفاده از یک مدل هوش مصنوعی جداگانه اندازه آنها به 768 در 768 افزایش می دهد.
تیم متا همچنین خاطرنشان می‌کند مدل Make-A-Video مانند تمام مدل‌های هوش مصنوعی آموزش‌دیده از روی داده‌های جمع‌آوری‌شده از وب، شامل سوگیری‌های اجتماعی و موارد آزار دهنده نیز می شود. در مدل های متن به تصویر، این سوگیری ها اغلب تعصبات اجتماعی را تقویت می کنند. برای مثال، از یک مدل بخواهید تصویری از یک «تروریست» ایجاد کند، و احتمالاً فردی را با عمامه به تصویر می‌کشد. با این حال، نمی توان گفت که مدل متا چه سوگیری هایی را بدون دسترسی آزاد آموخته است.
متا می‌گوید این تحقیقات و نتایج مولد هوش مصنوعی را با کاربران به اشتراک می‌گذارد تا از بازخورد آنها استفاده کنند و با استفاده از چارچوب هوش مصنوعی به صورت مسئولانه توسط کاربران برای اصلاح و تکامل رویکرد کاربران به این فناوری در حال ظهور ادامه خواهد داد.

اگر از این مطلب لذت بردید، حتما سایر جدیدترین اخبار هوش مصنوعی را هم بررسی کنید! مطالب ما پر از اطلاعات مفید و جذاب هستند که می‌توانند به شما کمک کنند تا به راحتی با دنیای جدید آشنا شوید. همراه ما باشید و دانش خود را گسترش دهید!

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

لوگوی سه‌بعدی حرف G گوگل روی دیواری با بافت خطوط موازی.
پیشنهاد سردبیر

چه انتظاری باید از گوگل در سال ۲۰۲۶ داشته باشیم؟

نوشته شده توسط اسما کلهر
12 دی 1404
نمای هوایی از پارکینگ تسلا با چیدمان خودروهای رنگارنگ و لوگوی تسلا در وسط.
فناوری

سقوط فروش تسلا و واکنش منفی بازار سهام

نوشته شده توسط اسما کلهر
12 دی 1404
نمای نزدیک از ساعت Pebble Round 2 با بدنه نقره‌ای و بند چرمی قهوه‌ای که زمان و وضعیت آب‌وهوا را نمایش می‌دهد.
اخبار هوش مصنوعی

ساعت هوشمند Pebble Round 2 با صفحه e-paper و قیمت اقتصادی معرفی شد

نوشته شده توسط اسما کلهر
12 دی 1404
نمای شب از یک شهر با آیکون‌های دیجیتالی متصل به هم که نماد شبکه مالی و هوش مصنوعی است.
اخبار هوش مصنوعی

بانک‌های اروپایی تا ۲۰۳۰ با هوش مصنوعی ۲۰۰ هزار شغل را حذف می‌کنند

نوشته شده توسط امیرحسین یونس
12 دی 1404
یک طرح گرافیکی انتزاعی با رنگ‌های سبز و سرمه‌ای که لوگوی نمایشگاه CES در مرکز آن قرار دارد.
پیشنهاد سردبیر

از نمایشگاه CES 2026 چه انتظاراتی باید داشته باشیم؟

نوشته شده توسط امیرحسین یونس
12 دی 1404
خبر بعدی
اپل در حال توسعه مدل های جدید آیپد پرو، مک و اپل تی وی است و برخی از این محصولات در ماه اکتبر عرضه خواهند شد.اما از مراسم رونمایی اپل در اکتبر خبری نیست

اپل تا یک ماه آینده رویداد جدیدی برگزار نمی‌کند

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

یادگیری ماشین

یادگیری ماشین چیست؟ + راهنمای کامل الگوریتم‌ها و کاربردها

30 آذر 1404
آیا هوش مصنوعی باعث کاهش عمق یادگیری می‌ شود؟

آیا هوش مصنوعی باعث کاهش عمق یادگیری می‌ شود؟

17 آذر 1404

داغ‌ترین‌های روز

لوگوی عدد ۳ بزرگ سفید روی پس‌زمینه انتزاعی آبی و نارنجی با متن Xiaomi HyperOS.

جانی دوباره در رگ‌های محصولات قدیمی؛ آغاز انتشار HyperOS 3 شیائومی برپایه اندروید ۱۵

10 دی 1404
کارت گرافیک ROG Matrix با طراحی مشکی و قرمز، مجهز به سیستم خنک‌کننده سه‌فن، در حال نمایش از نمای بالا روی سطح چوبی

نسخه چینی کارت گرافیک ایسوس RTX 5090 رکورد جدیدی ثبت کرد

10 دی 1404
بهترین گوشی موبایل بازار ایران

بهترین گوشی‌های بازار ایران در دی‌ماه ۱۴۰۴+ راهنمای جامع خرید

7 دی 1404 - به‌روزشده در 8 دی 1404
همه قابلیت‌های ویندوز که مایکروسافت در سال ۲۰۲۵ حذف یا منسوخ کرد

همه قابلیت‌های ویندوز که مایکروسافت در سال ۲۰۲۵ حذف یا منسوخ کرد + تصویر

11 دی 1404
تصویر گرافیکی از یک ماهواره با پنل‌های خورشیدی صلیبی شکل در فضای تاریک.

انقلاب در صنعت نیمه‌رسانا؛ کوره ۱,۰۰۰ درجه‌ای بریتانیا در فضا با موفقیت روشن شد

10 دی 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

لوگوی سه‌بعدی حرف G گوگل روی دیواری با بافت خطوط موازی.

چه انتظاری باید از گوگل در سال ۲۰۲۶ داشته باشیم؟

12 دی 1404
مایی از گوشی تاشو موتورولا در تاریکی با لوگوی موتورولا و فیفا به همراه عبارت «شریک رسمی گوشی هوشمند» و تاریخ ۰۱.۰۶.۲۶.

تیزر گوشی تاشوی Razr ویژه جام جهانی ۲۰۲۶ منتشر شد

12 دی 1404
نمای کامل از رابط کاربری ویندوز ۱۱ اس‌ئی با پس‌زمینه آبی مشهور ویندوز و آیکون‌های اپلیکیشن‌های مایکروسافت در منوی استارت.

ویندوز ۱۱ SE به خط پایان رسید؛ آغاز شمارش معکوس برای توقف کامل پشتیبانی

12 دی 1404
نمای هوایی از پارکینگ تسلا با چیدمان خودروهای رنگارنگ و لوگوی تسلا در وسط.

سقوط فروش تسلا و واکنش منفی بازار سهام

12 دی 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir