• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » مدل جدید Gemini Omni معرفی شد؛ جهشی در تبدیل متن به ویدیو

مدل جدید Gemini Omni معرفی شد؛ جهشی در تبدیل متن به ویدیو

تارخ ترهنده نوشته شده توسط تارخ ترهنده
یکشنبه 3 خرداد 1405 - 10:40
در اخبار هوش مصنوعی, فناوری
مدل جدید Gemini Omni معرفی شد؛ جهشی در تبدیل متن به ویدیو
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت گوگل مدل جدید Gemini Omni را برای تبدیل متن به ویدیو معرفی کرده که با درک بهتر دنیای واقعی، پایداری کاراکترها را نسبت به مدل Veo بهبود بخشیده است.

به گزارش سرویس هوش مصنوعی تک‌ناک، سال گذشته من عروسک مخملی بچه‌ام را دیپ‌فیک کردم تا طوری به نظر برسد که گوزن پارچه‌ای آن به تعطیلات رفته است. این فقط یک آزمایش بود تا ببینم می‌توانم صحنه‌هایی را که در یک آگهی گوگل از Gemini نمایش داده شده بود، بازسازی کنم یا خیر. هیچ‌وقت ویدیوهای سفر «بادی» گوزن را به پسر چهار ساله‌ام نشان ندادم، اما این تجربه برای من یک خط تفکیک جدی بین «تفریح بی‌ضرر با هوش مصنوعی مولد» و «اسلاپ تمام‌عیار» کشید. شاید این دو دایره در واقع یک دایره کامل باشند، شاید هم نه؛ اما چیزی که مطمئن هستم این است که ابزارهای ساخت ویدیوهای واقع‌گرایانه، فوق‌العاده خوب شده‌اند و به طرز شگفت‌انگیزی تلاش و دانش کمی می‌خواهند.

این روند حالا در عصر جدید مدل Gemini Omni هم با قدرت ادامه دارد. Omni یک خانواده جدید از مدل‌های مولد است که قرار است در نهایت بتوانند هر نوع ورودی (عکس، ویدیو، متن) را به هر چیز دیگری تبدیل کنند. اما فعلاً فقط ویدیو تولید می‌کند. Omni Flash اولین مدلی است که گوگل منتشر کرده و اکنون در پلتفرم ساخت و ویرایش ویدیوی هوش مصنوعی این شرکت یعنی Flow در دسترس است. هنوز می‌توانید از مدل قبلی یعنی Veo استفاده کنید، اما Omni از چند جهت بر پایه Veo بهبود پیدا کرده است.

با Omni می‌توانید یک ویدیو آپلود کنید و آن را همراه با یک پرامپت متنی به عنوان نقطه شروع خروجی هوش مصنوعی استفاده نمایید. گوگل ادعا می‌کند که Omni هنگام تولید ویدیو، دانش بیشتر و واقع‌گرایانه‌تری از دنیای واقعی را دخیل می‌کند و در نتیجه، خیلی بهتر می‌تواند ظاهر و هویت کاراکترها را در طول ویدیو ثابت نگه دارد. فقط یک راه برای آزمودن این ادعا وجود داشت و آن هم آزمایش عملی این مدل بود.

نتیجه‌ها آن‌قدر ترکیبی و متناقض بود که آدم را گیج می‌کند. بعضی کلیپ‌ها واقعاً خوب بودند؛ بسیار منسجم‌تر و وفادارتر به پرامپت نسبت به زمانی که پنج ماه پیش Veo را تست می‌کردیم. اما حتی بهترین کلیپ‌هایی که Omni برای ما ساخت هم لحظات «جامپ‌اسکیر» هوش مصنوعی داشتند.

با Omni می‌توانید با پرامپت متنی ویدیوها را ادیت کنید و انصافاً باید به گوگل اعتبار داد: این بخش نسبت به زمانی که مدل Veo 3 را تست کردیم، بهتر عمل می‌کند. اما نتایج با Veo آن‌قدر بد بود که راحت‌تر بود هر بار به جای ویرایش، از صفر ویدیوی جدید بسازیم. Omni واقعاً ویرایش‌های شما را اعمال می‌کند، اما همیشه هم نتیجه درست از آب درنمی‌آید.

ناگفته نماند که هیچ‌کدام از این‌ مدل‌ها رایگان نیستند. ساخت ویدیو با Omni اعتباری است؛ بسته به طول سکانس و موادی که به مدل می‌دهید، هر کلیپ بین ۱۵ تا ۴۰ اعتبار هزینه دارد. یک دور ویرایش هم ۴۰ اعتبار می‌سوزاند. طرح AI Pro با قیمت ماهانه ۲۰ دلار این مدل هر ماه ۱۰۰۰ اعتبار می‌دهد. بعد از حدود ۲۰ کلیپ، با چند ویرایش روی بعضی از آنها، فقط ۱۴۵ اعتبار برای‌ شما می‌ماند. اگر ذهنیت مشخصی از ویدیوی نهایی داشته باشید، احتمالاً برای نزدیک شدن به تصویر دلخواه‌ خود باید چندین رفت‌وبرگشت گران با مدل داشته باشید.

یکی از نقاط قوت ادعایی مدل Gemini Omni اضافه کردن عناصر هوش مصنوعی به ویدیوهای واقعی است یا به عبارت دیگر دیپ‌فیک است. با یک ویدیوی سلفی و صورت خنثی شروع کردیم و از Omni خواستیم کلیپ‌هایی بسازد و واقعاً برای چیزی که دیدیم آماده نبودیم.

در این دیپ‌فیک‌ها نشانه‌هایی از هوش مصنوعی وجود دارد. برای مثال صداهای برخورد اشیا بیش از حد مصنوعی است یا فردی در پس‌زمینه وجود دارد که دوبار ظاهر می‌شود. اما به جز این اشکالات کوچک و حس کمی ناخوشایند، ویدیوها به طرز ترسناکی باورپذیر هستند.

کلیپ پاستا را به همسرم نشان دادم؛ می‌دانست دارم یک ابزار ویدیوی هوش مصنوعی را تست می‌کنم اما نگفتم کدام بخش صحنه مصنوعی است. بدون اینکه بداند چه چیزی در صحنه با هوش مصنوعی ساخته شده است، پذیرفت که من جلوی دوربین نشسته‌ام و پاستا می‌خورم و تنها موضوع غیرعادی برای او این بود که ظرف غذا برایش ناآشنا به نظر می‌رسید. خود عمل پاستا خوردن آن‌قدر واقعی بود که او را — کسی که تقریباً هر روز در ده سال گذشته از نزدیک مرا دیده است — قانع کند.

دیپ‌فیک‌های دیگر نیز در سطح‌های مختلفی از «کافی برای فریب مردم در شبکه‌های اجتماعی» هستند. مثلا بعضی از کلیپ‌های برج ایفل کمی کارتونی به نظر می‌رسند، اما یکی از کلیپ‌ها آن‌قدر قانع‌کننده است که اگر چند بار نگاه‌ نکنید شاید متوجه مصنوعی بودن‌ آن نشوید.

بر اساس گزارش ورج، هنوز ساخت یک شاهکار سینمایی با هوش مصنوعی آن‌قدر که گوگل دوست دارد وانمود کند، آسان نشده است. اما مدل Gemini Omni به شکل قابل‌ تشخیصی نسبت به Veo بهتر شده است. اگر یک حساب گوگل و یک کارت اعتباری داشته باشید، می‌توانید با کمترین تلاش از یک ویدیوی خانگی ساده، کلیپی بسازید که انگار وسط یک پرواز به مائوی نشسته‌اید.

تارخ ترهنده

تارخ ترهنده

The burning heart never knows surrender.

مطالب مرتبط

اپل در آستانه کنفرانس WWDC یک زیردامنه جدید ثبت کرد
اخبار هوش مصنوعی

اپل در آستانه کنفرانس WWDC یک زیردامنه جدید ثبت کرد

نوشته شده توسط مانی
3 خرداد 1405
موتور فوتونیک لیزری، فناوری جدید چین برای اینترنت 6G
اینترنت و شبکه

فناوری جدید چین برای اینترنت 6G معرفی شد

نوشته شده توسط نرگس چالوک
3 خرداد 1405
بلندترین ساختمان آفریقا در ساحل عاج افتتاح می‌ شود
فناوری

بلندترین ساختمان آفریقا در ساحل عاج افتتاح می‌ شود + تصویر

نوشته شده توسط نرگس چالوک
3 خرداد 1405
بلیت رایگان جام جهانی، هدیه ویژه Verizon
اینترنت و شبکه

بلیت رایگان جام جهانی، هدیه ویژه Verizon

نوشته شده توسط مانی
3 خرداد 1405
طرح مفهومی تغییرات جدید مرورگر فایرفاکس
اینترنت و شبکه

موزیلا از بازطراحی بزرگ فایرفاکس خبر داد

نوشته شده توسط سید محمد برازنده
2 خرداد 1405 - به‌روزشده در 3 خرداد 1405
خبر بعدی
بلندترین ساختمان آفریقا در ساحل عاج افتتاح می‌ شود

بلندترین ساختمان آفریقا در ساحل عاج افتتاح می‌ شود + تصویر

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

سامسونگ در رضایت مشتریان تلفن همراه از اپل پیشی گرفت

سامسونگ در رضایت مشتریان تلفن همراه از اپل پیشی گرفت

31 اردیبهشت 1405
تصویر تبلیغاتی Lenovo Legion Y70 در دو رنگ مشکی و سفید، با نمایش طراحی بدنه و تصویر گیمینگ روی نمایشگر گوشی.

لنوو با عرضه این گوشی جدید به بازار موبایل بازگشت

30 اردیبهشت 1405

داغ‌ترین‌های روز

مایکروسافت فایل‌های ISO جدید ویندوز ۱۱ را منتشر کرد

مایکروسافت فایل‌های ISO جدید ویندوز ۱۱ را منتشر کرد

30 اردیبهشت 1405

راهنمای کامل استفاده از میرورهای داخلی برای توسعه‌دهندگان در شرایط اختلال اینترنت

18 اردیبهشت 1405 - به‌روزشده در 19 اردیبهشت 1405
اپلیکیشن بله چگونه یکی از پرکاربرترین اپلیکیشن‌های ایرانی شد؟

بله چگونه یکی از پرکاربرترین اپلیکیشن‌های ایرانی شد؟

2 خرداد 1405 - به‌روزشده در 3 خرداد 1405
فاجعه امنیتی در گیت‌هاب؛ نصب یک پلاگین، هزاران ریپازیتوری را لو داد

فاجعه امنیتی در گیت‌هاب؛ نصب یک پلاگین، هزاران ریپازیتوری را لو داد

31 اردیبهشت 1405
برنامه Google Earth با قابلیت‌ های متنوع و جذاب خود، امکانات وسیعی را برای مشاهده اماکن و نقشه‌ های قدیمی برای کاربران به ارمغان می‌آورد.

سفر به گذشته با Google Earth

17 فروردین 1403 - به‌روزشده در 27 مهر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

آیفون 17 بازارهای جهانی را تسخیر کرد

آیفون ۱۷ بازارهای جهانی را تسخیر کرد

3 خرداد 1405
همکاری گوگل و کپ‌کات در جمینای

ابزارهای ویرایش ویدیو کپ‌کات به هوش مصنوعی جمینای می‌آیند

3 خرداد 1405
اپل در آستانه کنفرانس WWDC یک زیردامنه جدید ثبت کرد

اپل در آستانه کنفرانس WWDC یک زیردامنه جدید ثبت کرد

3 خرداد 1405
موتور فوتونیک لیزری، فناوری جدید چین برای اینترنت 6G

فناوری جدید چین برای اینترنت 6G معرفی شد

3 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir