No Result

مشاهده تمامی نتایج

No Result

مشاهده تمامی نتایج

تک ناک » فناوری » اخبار هوش مصنوعی » تولید ویدئو از تصویر ثابت با کمک هوش مصنوعی OmniHuman

تولید ویدئو از تصویر ثابت با کمک هوش مصنوعی OmniHuman

نوشته شده توسط اسما کلهر

چهارشنبه 17 بهمن 1403 - 18:00 - به‌روزشده در پنجشنبه 18 بهمن 1403 - 07:13

در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری

پیشرفت چشمگیر در حوزه هوش مصنوعی: تولید ویدیو از یک تصویر ثابت

محققان شرکت بایت دنس مالک تیک‌ناک، با بهره‌گیری از تکنیک‌های یادگیری عمیق، موفق شدند هوش مصنوعی OmniHuman را توسعه دهند که می‌تواند از تصویر ثابت ویدئو متحرک و واقع‌گرایانه تولید کند.

به گزارش تک‌ناک، پژوهشگران شرکت چینی بایت‌دنس سامانه‌ای مبتنی‌بر هوش مصنوعی توسعه داده‌اند که می‌تواند از تصویر ثابت ویدئو واقعی از افراد در حال صحبت و آواز‌خواندن و حرکات طبیعی ایجاد کند. این پیشرفت می‌تواند حوزه سرگرمی دیجیتال و ارتباطات را متحول کند.

سامانه جدید چینی‌ها OmniHuman نام دارد که می‌تواند ویدئوهایی تمام‌قد از افراد تولید کند که در آن حرکت‌ها و اشاره‌های بدن با گفتار آن‌ها هماهنگ است. این قابلیت OmniHuman را از مدل‌های پیشین هوش مصنوعی متمایز می‌سازد که تنها می‌توانستند چهره یا بالاتنه را متحرک‌ کنند.

پژوهشگران بایت‌دنس در مقاله‌ای منتشرشده در نشریه arXiv عنوان کرده‌اند که با وجود پیشرفت‌های چشمگیر در حوزه‌ انیمیشن‌سازی، روش‌های فعلی در مقیاس‌پذیری به سطح مدل‌های بزرگ تولید ویدئو با محدودیت‌هایی روبه‌رو هستند که کارایی آن‌ها را در کاربردهای عملی کاهش می‌دهد.

برای رفع این مشکل تیم تحقیقاتی OmniHuman را با بیش از ۱۸,۷۰۰ ساعت داده‌ ویدئویی انسانی آموزش داده است. این فرایند از رویکردی نوین بهره می‌برد که ورودی‌های متعددی نظیر متن و صدا و حرکات بدن را هم‌زمان ترکیب می‌کند. این راهبرد آموزشی چندبخشی امکان یادگیری از مجموعه داده‌هایی بسیار گسترده‌تر و متنوع‌تر را در مقایسه با روش‌های پیشین فراهم می‌آورد.

01
از 01
تحولی در تولید ویدئوهای مبتنی‌بر هوش مصنوعی

Venturebeat می‌نویسد که اعضای تیم تحقیقاتی توضیح داده‌اند که ادغام چندین سیگنال شرطی مانند متن و صدا و وضعیت بدن در فرایند آموزش، نقش مهمی در کاهش اتلاف داده‌ها ایفا می‌کند و موجب بهینه‌سازی عملکرد مدل می‌شود. این فناوری نقطه عطفی در حوزه تولید محتوای بصری مبتنی‌بر هوش مصنوعی محسوب می‌شود و می‌تواند ویدئوهایی از افراد در حال سخنرانی یا نواختن ساز خلق کند. نتایج آزمایش‌ها نشان داده است که سامانه OmniHuman در شاخص‌های متعدد کیفیت، عملکردی برتر از مدل‌های موجود ارائه می‌دهد.

با بهره‌گیری از تکنیک‌های یادگیری عمیق، محققان موفق به توسعه الگوریتمی شده‌اند که قادر است از یک تصویر ثابت، ویدیوهای متحرک و واقع‌گرایانه تولید کند.

این دستاورد در شرایطی به دست آمده است که رقابت برای پیشرفت در حوزه تولید ویدئو با هوش مصنوعی شدت گرفته است. شرکت‌هایی همچون گوگل و متا و مایکروسافت نیز در حال توسعه فناوری‌های مشابهی هستند. در این میان، بایت‌دنس با این نوآوری می‌تواند مزیتی راهبردی برای خود در این عرصه در حال رشد ایجاد کند.

کارشناسان معتقدند که این فناوری توان بالقوه‌ فراوانی برای تحول در زمینه‌های تولید محتوای سرگرمی و آموزشی و ارتباطات دیجیتال دارد. با‌این‌حال، برخی نگرانی‌ها درباره سوءاستفاده احتمالی از این سیستم در تولید محتوای ساختگی و فریبنده مطرح شده است.

اسما کلهر

دانش آموخته مترجمی زبان انگلیسی ،نویسنده حوزه تکنولوژی

مطالب مرتبط

بازگشت متا به دنیای خبر با قراردادهای هوش مصنوعی

اخبار هوش مصنوعی

بازگشت متا به دنیای خبر با قراردادهای هوش مصنوعی

نوشته شده توسط اسما کلهر

رونمایی بزرگ‌های فناوری در CES 2026 با محوریت هوش مصنوعی و تراشه‌های ۲ نانومتری

پیشنهاد سردبیر

در نمایشگاه فناوری CES 2026 شاهد چه اتفاقاتی خواهیم بود؟

نوشته شده توسط اسما کلهر

طرح گرافیکی با پس‌زمینه تیره و اشکال انتزاعی آبی و بنفش که لوگوی کروی و پازلی ویکی‌پدیا را در مرکز نشان می‌دهد

با این قابلیت ویکی‌پدیا می توانید فعالیت شخصی یکساله خود را مرور کنید

نوشته شده توسط اسما کلهر

لوگوی تایپوگرافی شرکت OpenAI با رنگ مشکی بر روی پس‌زمینه‌ی سبزآبی و طرح‌های هندسی

اخبار هوش مصنوعی

رقابت داغ هوش مصنوعی؛ اپن‌ای‌آی با عرضه زودهنگام GPT-5.2 به گوگل پاسخ می‌دهد

نوشته شده توسط اسما کلهر

لوگوی اپل درون یک ساختمان شیشه‌ای

پیشنهاد سردبیر

بحران مدیریتی اپل؛ موج استعفای مدیران ارشد شدت گرفت

نوشته شده توسط تارخ ترهنده

خبر بعدی

گوگل ابزار Deep Research را به برنامه‌ی جمنای در اندروید اضافه کرد

گوگل ابزار Deep Research را به برنامه جمنای در اندروید اضافه کرد

دیدگاهتان را بنویسید لغو پاسخ

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

بازگشت متا به دنیای خبر با قراردادهای هوش مصنوعی

بازگشت متا به دنیای خبر با قراردادهای هوش مصنوعی

14 آذر 1404

رونمایی بزرگ‌های فناوری در CES 2026 با محوریت هوش مصنوعی و تراشه‌های ۲ نانومتری

در نمایشگاه فناوری CES 2026 شاهد چه اتفاقاتی خواهیم بود؟

14 آذر 1404

طرح گرافیکی با پس‌زمینه تیره و اشکال انتزاعی آبی و بنفش که لوگوی کروی و پازلی ویکی‌پدیا را در مرکز نشان می‌دهد

با این قابلیت ویکی‌پدیا می توانید فعالیت شخصی یکساله خود را مرور کنید

14 آذر 1404

لوگوی تایپوگرافی شرکت OpenAI با رنگ مشکی بر روی پس‌زمینه‌ی سبزآبی و طرح‌های هندسی

رقابت داغ هوش مصنوعی؛ اپن‌ای‌آی با عرضه زودهنگام GPT-5.2 به گوگل پاسخ می‌دهد

14 آذر 1404

دسترسی سریع

© Copyright 2025 Technoc.ir

No Result

مشاهده تمامی نتایج

© Copyright 2025 Technoc.ir