• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » مدل جدید Gemini Omni معرفی شد؛ جهشی در تبدیل متن به ویدیو

مدل جدید Gemini Omni معرفی شد؛ جهشی در تبدیل متن به ویدیو

تارخ ترهنده نوشته شده توسط تارخ ترهنده
یکشنبه 3 خرداد 1405 - 10:40
در اخبار هوش مصنوعی, فناوری
مدل جدید Gemini Omni معرفی شد؛ جهشی در تبدیل متن به ویدیو
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت گوگل مدل جدید Gemini Omni را برای تبدیل متن به ویدیو معرفی کرده که با درک بهتر دنیای واقعی، پایداری کاراکترها را نسبت به مدل Veo بهبود بخشیده است.

به گزارش سرویس هوش مصنوعی تک‌ناک، سال گذشته من عروسک مخملی بچه‌ام را دیپ‌فیک کردم تا طوری به نظر برسد که گوزن پارچه‌ای آن به تعطیلات رفته است. این فقط یک آزمایش بود تا ببینم می‌توانم صحنه‌هایی را که در یک آگهی گوگل از Gemini نمایش داده شده بود، بازسازی کنم یا خیر. هیچ‌وقت ویدیوهای سفر «بادی» گوزن را به پسر چهار ساله‌ام نشان ندادم، اما این تجربه برای من یک خط تفکیک جدی بین «تفریح بی‌ضرر با هوش مصنوعی مولد» و «اسلاپ تمام‌عیار» کشید. شاید این دو دایره در واقع یک دایره کامل باشند، شاید هم نه؛ اما چیزی که مطمئن هستم این است که ابزارهای ساخت ویدیوهای واقع‌گرایانه، فوق‌العاده خوب شده‌اند و به طرز شگفت‌انگیزی تلاش و دانش کمی می‌خواهند.

این روند حالا در عصر جدید مدل Gemini Omni هم با قدرت ادامه دارد. Omni یک خانواده جدید از مدل‌های مولد است که قرار است در نهایت بتوانند هر نوع ورودی (عکس، ویدیو، متن) را به هر چیز دیگری تبدیل کنند. اما فعلاً فقط ویدیو تولید می‌کند. Omni Flash اولین مدلی است که گوگل منتشر کرده و اکنون در پلتفرم ساخت و ویرایش ویدیوی هوش مصنوعی این شرکت یعنی Flow در دسترس است. هنوز می‌توانید از مدل قبلی یعنی Veo استفاده کنید، اما Omni از چند جهت بر پایه Veo بهبود پیدا کرده است.

با Omni می‌توانید یک ویدیو آپلود کنید و آن را همراه با یک پرامپت متنی به عنوان نقطه شروع خروجی هوش مصنوعی استفاده نمایید. گوگل ادعا می‌کند که Omni هنگام تولید ویدیو، دانش بیشتر و واقع‌گرایانه‌تری از دنیای واقعی را دخیل می‌کند و در نتیجه، خیلی بهتر می‌تواند ظاهر و هویت کاراکترها را در طول ویدیو ثابت نگه دارد. فقط یک راه برای آزمودن این ادعا وجود داشت و آن هم آزمایش عملی این مدل بود.

مرتبط: راهنمای کامل استفاده از هوش مصنوعی جمینای گوگل

نتیجه‌ها آن‌قدر ترکیبی و متناقض بود که آدم را گیج می‌کند. بعضی کلیپ‌ها واقعاً خوب بودند؛ بسیار منسجم‌تر و وفادارتر به پرامپت نسبت به زمانی که پنج ماه پیش Veo را تست می‌کردیم. اما حتی بهترین کلیپ‌هایی که Omni برای ما ساخت هم لحظات «جامپ‌اسکیر» هوش مصنوعی داشتند.

با Omni می‌توانید با پرامپت متنی ویدیوها را ادیت کنید و انصافاً باید به گوگل اعتبار داد: این بخش نسبت به زمانی که مدل Veo 3 را تست کردیم، بهتر عمل می‌کند. اما نتایج با Veo آن‌قدر بد بود که راحت‌تر بود هر بار به جای ویرایش، از صفر ویدیوی جدید بسازیم. Omni واقعاً ویرایش‌های شما را اعمال می‌کند، اما همیشه هم نتیجه درست از آب درنمی‌آید.

ناگفته نماند که هیچ‌کدام از این‌ مدل‌ها رایگان نیستند. ساخت ویدیو با Omni اعتباری است؛ بسته به طول سکانس و موادی که به مدل می‌دهید، هر کلیپ بین ۱۵ تا ۴۰ اعتبار هزینه دارد. یک دور ویرایش هم ۴۰ اعتبار می‌سوزاند. طرح AI Pro با قیمت ماهانه ۲۰ دلار این مدل هر ماه ۱۰۰۰ اعتبار می‌دهد. بعد از حدود ۲۰ کلیپ، با چند ویرایش روی بعضی از آنها، فقط ۱۴۵ اعتبار برای‌ شما می‌ماند. اگر ذهنیت مشخصی از ویدیوی نهایی داشته باشید، احتمالاً برای نزدیک شدن به تصویر دلخواه‌ خود باید چندین رفت‌وبرگشت گران با مدل داشته باشید.

یکی از نقاط قوت ادعایی مدل Gemini Omni اضافه کردن عناصر هوش مصنوعی به ویدیوهای واقعی است یا به عبارت دیگر دیپ‌فیک است. با یک ویدیوی سلفی و صورت خنثی شروع کردیم و از Omni خواستیم کلیپ‌هایی بسازد و واقعاً برای چیزی که دیدیم آماده نبودیم.

مرتبط: ابزارهای ویرایش ویدیو کپ‌کات به هوش مصنوعی جمینای می‌آیند

در این دیپ‌فیک‌ها نشانه‌هایی از هوش مصنوعی وجود دارد. برای مثال صداهای برخورد اشیا بیش از حد مصنوعی است یا فردی در پس‌زمینه وجود دارد که دوبار ظاهر می‌شود. اما به جز این اشکالات کوچک و حس کمی ناخوشایند، ویدیوها به طرز ترسناکی باورپذیر هستند.

کلیپ پاستا را به همسرم نشان دادم؛ می‌دانست دارم یک ابزار ویدیوی هوش مصنوعی را تست می‌کنم اما نگفتم کدام بخش صحنه مصنوعی است. بدون اینکه بداند چه چیزی در صحنه با هوش مصنوعی ساخته شده است، پذیرفت که من جلوی دوربین نشسته‌ام و پاستا می‌خورم و تنها موضوع غیرعادی برای او این بود که ظرف غذا برایش ناآشنا به نظر می‌رسید. خود عمل پاستا خوردن آن‌قدر واقعی بود که او را — کسی که تقریباً هر روز در ده سال گذشته از نزدیک مرا دیده است — قانع کند.

دیپ‌فیک‌های دیگر نیز در سطح‌های مختلفی از «کافی برای فریب مردم در شبکه‌های اجتماعی» هستند. مثلا بعضی از کلیپ‌های برج ایفل کمی کارتونی به نظر می‌رسند، اما یکی از کلیپ‌ها آن‌قدر قانع‌کننده است که اگر چند بار نگاه‌ نکنید شاید متوجه مصنوعی بودن‌ آن نشوید.

بر اساس گزارش ورج، هنوز ساخت یک شاهکار سینمایی با هوش مصنوعی آن‌قدر که گوگل دوست دارد وانمود کند، آسان نشده است. اما مدل Gemini Omni به شکل قابل‌ تشخیصی نسبت به Veo بهتر شده است. اگر یک حساب گوگل و یک کارت اعتباری داشته باشید، می‌توانید با کمترین تلاش از یک ویدیوی خانگی ساده، کلیپی بسازید که انگار وسط یک پرواز به مائوی نشسته‌اید.

مرتبط: جمنای تصاویر ساخته‌شده با هوش مصنوعی را شناسایی می‌کند

تارخ ترهنده

تارخ ترهنده

The burning heart never knows surrender.

مطالب مرتبط

حرکت موفقیت آمیز نخستین سگ رباتیک جهان روی یخ‌های قطب شمال
رباتیک

حرکت موفقیت آمیز نخستین سگ رباتیک جهان روی یخ‌های قطب شمال + ویدیو

نوشته شده توسط نرگس چالوک
24 خرداد 1405
مدل GLM-5
اخبار هوش مصنوعی

رونمایی استارتاپ چینی از مدل زبانی پیشرفته GLM-5

نوشته شده توسط مانی
24 خرداد 1405
استارتاپ پرومتئوس
اخبار هوش مصنوعی

استارتاپ ۱۲ میلیارد دلاری بزوس؛ پرومتئوس بالاخره معرفی شد

نوشته شده توسط مانی
24 خرداد 1405
تحقیقات امنیتی آمازون باعث محدودیت دسترسی به مدل‌های آنتروپیک شد
اخبار هوش مصنوعی

تحقیقات امنیتی آمازون باعث محدودیت دسترسی به مدل‌های آنتروپیک شد

نوشته شده توسط مانی
24 خرداد 1405
توقف پروژه لاین عربستان تا سال ۲۰۳۰
پیشنهاد سردبیر

توقف پروژه لاین عربستان تا سال ۲۰۳۰

نوشته شده توسط نرگس چالوک
24 خرداد 1405
خبر بعدی
بلندترین ساختمان آفریقا در ساحل عاج افتتاح می‌ شود

بلندترین ساختمان آفریقا در ساحل عاج افتتاح می‌ شود + تصویر

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

نمای شماتیک از پوشش خودتمیزشونده پارچه با لایه سولفونات که از چسبیدن لکه‌ها و آلودگی‌ها جلوگیری می‌کند و امکان شست‌وشو تنها با آب را فراهم می‌سازد.

این فناوری جدید مانع لک شدن لباس شما می شود

13 خرداد 1405
راهنمای کامل جلوگیری از کلاهبرداری ملکی در خرید، فروش و اجاره ملک

راهنمای کامل جلوگیری از کلاهبرداری ملکی در خرید، فروش و اجاره ملک

8 خرداد 1405 - به‌روزشده در 9 خرداد 1405

داغ‌ترین‌های روز

مقایسه F-35 و Su-57؛ کدام جنگنده نسل پنجم برتری دارد؟

مقایسه F-35 و Su-57؛ کدام جنگنده نسل پنجم برتری دارد؟

22 خرداد 1405 - به‌روزشده در 23 خرداد 1405
انواع تیپ های سورن پلاس

معرفی انواع تیپ های سورن پلاس ؛ کدام مدل خودرو ارزش خرید بالاتری دارد؟

22 خرداد 1405 - به‌روزشده در 23 خرداد 1405
پهپاد رهگیر Cobra 600 آلمان معرفی شد

پهپاد رهگیر Cobra 600 آلمان معرفی شد + تصویر

23 خرداد 1405 - به‌روزشده در 24 خرداد 1405
نصب موتور Pratt & Whitney F135 روی نخستین جنگنده رادارگریز F-35A آلمان در خط مونتاژ نهایی شرکت Lockheed Martin

نخستین جنگنده F-35A آلمان وارد مرحله نهایی تولید شد

16 خرداد 1405 - به‌روزشده در 17 خرداد 1405
نخستین جنگنده دوکابینه Gripen F جهان رونمایی شد

نخستین جنگنده دوکابینه Gripen F جهان رونمایی شد

19 خرداد 1405 - به‌روزشده در 20 خرداد 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

نمودار عملکرد پردازنده در ویندوز ۱۱

افزایش سرعت پردازنده در ویندوز ۱۱ آسیبی به سخت‌افزار نمی‌زند

24 خرداد 1405
پرواز موفق نخستین هواپیمای برقی سرنشین‌دار مجهز به باتری

پرواز موفق نخستین هواپیمای برقی سرنشین‌دار مجهز به باتری + تصویر

24 خرداد 1405
حرکت موفقیت آمیز نخستین سگ رباتیک جهان روی یخ‌های قطب شمال

حرکت موفقیت آمیز نخستین سگ رباتیک جهان روی یخ‌های قطب شمال + ویدیو

24 خرداد 1405
اعتراف بیل گیتس در دادگاه و ماجرای تلاش جفری اپستین برای اخاذی از او

اعتراف بیل گیتس در دادگاه و ماجرای تلاش جفری اپستین برای اخاذی از او

24 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir