شرکت گوگل در جریان کنفرانس Google I/O 2026 از مدل هوش مصنوعی جدید خود با نام Gemini Omni Flash رونمایی کرد.
به گزارش سرویس هوش مصنوعی تکناک، این شرکت با تکیه بر موفقیت مدل تولید تصویر Nano Banana (که تاکنون بیش از ۵۰ میلیارد خروجی تصویری تولید کرده است) از نسل جدید مدلهای Gemini Omni رونمایی کرده است؛ سیستمی که قادر است از انواع ورودیها، بهویژه ویدیو، محتوای تولیدی باکیفیت خلق کند. Gemini Omni Flash، نخستین عضو این خانواده، یک مدل هوش مصنوعی است که امکان ترکیب ورودیهای تصویر، صوت، ویدیو و متن را فراهم میکند و خروجیهایی در قالب ویدیوهای پیشرفته یا ویرایش تعاملی مبتنی بر دستور زبان طبیعی ارائه میدهد. گوگل اعلام کرده است که در مراحل بعدی، پشتیبانی از خروجیهای بیشتر از جمله تصویر و صدا نیز به این سیستم اضافه خواهد شد.
بیشتر بخوانید: گوگل برای رقابت با Mythos آنتروپیک وارد میدان شد
این شرکت در جریان کنفرانس Google I/O 2026، قابلیتهای کلیدی مدل Gemini Omni Flash از جمله حفظ انسجام شخصیتها و صحنهها در فرایند ویرایش ویدیو و امکان اعمال تغییرات پیچیده از طریق دستورات متنی مانند افزودن یا حذف عناصر، تغییر زوایای دوربین یا بازطراحی کامل صحنه را تشریح کرد. کاربران میتوانند ویدیوهای واقعی خود را به مدل وارد کنند و تغییراتی نظیر افزودن شخصیتهای جدید، عناصر CGI، یا تغییر کامل محیط و سبک بصری را اعمال نمایند، بدون آنکه ساختار روایی اصلی ویدیو دچار اختلال شود.

گوگل تاکید کرده است که Gemini Omni Flash از درک پیشرفتهای از قوانین فیزیک و زمینههای دانشی مبتنی بر جمنای در حوزههای تاریخ، علوم و فرهنگ برخوردار است؛ قابلیتی که به بهبود واقعگرایی و کیفیت روایت بصری کمک میکند. همچنین این مدل توانایی تولید ویدیوهای آموزشی و توضیحی را تنها از یک دستور کوتاه، همراه با روایت صوتی هوش مصنوعی دارد. مدل Gemini Omni Flash از ورودیهای متنوع شامل تصاویر شخصیتها، صحنهها و طرحهای دستی پشتیبانی میکند، هرچند در فاز اولیه تنها از ارجاعات صوتی برای دادههای صوتی پشتیبانی خواهد شد و سایر انواع صوت در بهروزرسانیهای بعدی اضافه میشوند.
مرتبط: از جستوجو تا پرداخت؛ گوگل کل فرایند خرید آنلاین شما را دنبال می کند
تمام خروجیهای تولیدشده با این مدل دارای واترمارک SynthID هستند که از طریق جمنای، کروم و سرچ گوگل قابل راستیآزمایی است. همچنین کاربران میتوانند آواتارهای دیجیتال شخصیسازیشده ایجاد کنند که قادر هستند در ویدیوهای تولیدی ظاهر شوند و صدایی مشابه کاربر داشته باشند. هماکنون Gemini Omni Flash در حال انتشار برای اپلیکیشن جمنای و پلتفرم Google Flow است و در اختیار مشترکان طرحهای AI Plus، پرو و اولترا قرار گرفته است. همچنین این مدل به صورت رایگان برای کاربران YouTube Shorts و اپلیکیشن YouTube Create عرضه شده است. این مدل همزمان با Gemini 3.5 Flash (قدرتمندترین مدل کدنویسی گوگل تا به امروز) معرفی شده است.

















