شرکت گوگل دو مدل جدید هوش مصنوعی با نامهای Nano Banana 2 Lite و Gemini Omni Flash با هدف افزایش سرعت تولید محتوای چندرسانهای، کاهش هزینه و بهبود فرایند توسعه معرفی کرد.
به گزارش سرویس هوش مصنوعی تکناک، گوگل این مدلها را همزمان در Google AI Studio، Gemini API، Gemini Enterprise Agent Platform، همچنین محصولات مصرفی خود از جمله Gemini، AI Mode در جستوجوی گوگل و Google Flow عرضه کرده است.
مدل Nano Banana 2 Lite سریعترین و مقرونبهصرفهترین عضو خانواده Nano Banana محسوب میشود. گوگل این مدل را برای پروژههایی طراحی کرده است که به تولید انبوه تصویر، تأخیر بسیار کم و هزینه پایین نیاز دارند. این مدل اکنون به عنوان جایگزین پیشنهادی Nano Banana یا همان Gemini 2.5 Flash Image معرفی شده است و توسعهدهندگان میتوانند بدون تغییرات پیچیده به آن مهاجرت کنند.
شرکت گوگل اعلام کرد که هوش مصنوعی Nano Banana 2 Lite با شناسه Gemini 3.1 Flash Lite Image قادر است تصاویر را تنها در حدود چهار ثانیه تولید کند. این سرعت، آن را به گزینهای مناسب برای نمونهسازی سریع، طراحی اولیه و گردشکارهای تعاملی تبدیل میکند.
هزینه استفاده از این مدل نیز بسیار پایین است. گوگل قیمت آن را ۰٫۰۳۴ دلار برای هر هزار تصویر اعلام کرده است. به همین دلیل، توسعهدهندگانی که پروژههای بزرگ یا بودجه محدود دارند، میتوانند با هزینه کمتر حجم بالایی از تصاویر را تولید کنند.
با وجود تمرکز بر سرعت، گوگل اعلام کرد که Nano Banana 2 Lite همچنان دقت مناسبی در اجرای دستورهای متنی، حفظ یکپارچگی شخصیتها و تولید متن خوانا در داخل تصاویر ارائه میدهد.
این شرکت همزمان ساختار جدید خانواده Nano Banana را نیز معرفی کرد. در این خانواده، Nano Banana 2 Lite برای پردازشهای سریع و حجم کاری بالا طراحی شده است. Nano Banana 2 با نام Gemini 3.1 Flash Image نقش مدل عمومی را ایفا میکند و میان کیفیت، سرعت و هزینه تعادل برقرار میسازد. Nano Banana Pro یا Gemini 3 Pro Image نیز برای کاربردهای حرفهای و پروژههایی توسعه یافته است که دقت و استدلال اهمیت بیشتری نسبت به سرعت دارند. در مقابل، Nano Banana مبتنی بر Gemini 2.5 Flash Image اکنون به عنوان مدل قدیمی شناخته میشود و گوگل ارتقا به نسخه Nano Banana 2 Lite را توصیه میکند.

در کنار این مدل تصویری، گوگل مدل هوش مصنوعی Gemini Omni Flash را نیز برای نخستین بار در اختیار توسعهدهندگان قرار داده است. این مدل برای تولید و ویرایش ویدیو و ویرایش مکالمهمحور طراحی شده و اکنون از طریق Google AI Studio، Gemini API و Gemini Enterprise Agent Platform در دسترس قرار دارد. کاربران عادی نیز میتوانند از آن در برنامه Gemini و سرویس Google Flow استفاده کنند.
شرکت گوگل بیان کرد که ترکیب Nano Banana 2 Lite و Gemini Omni Flash امکان ایجاد زنجیره کامل تولید محتوای چندرسانهای را فراهم میکند. توسعهدهندگان میتوانند ابتدا تصاویر را با سرعت بالا تولید کنند و سپس همان محتوا را برای ساخت یا ویرایش ویدیو به کار بگیرند. این فرایند، سرعت توسعه پروژههای مبتنی بر هوش مصنوعی را افزایش میدهد و امکان تکرار سریع ایدههای خلاقانه را فراهم میکند.

علاوه بر پلتفرمهای توسعه، مدل هوش مصنوعی Nano Banana 2 Lite به تدریج در محصولات مختلف گوگل از جمله AI Mode در جستوجوی گوگل، Gemini، NotebookLM، Google Photos، Stitch، Google Flow و Google Ads نیز در دسترس کاربران قرار میگیرد.
شرکت گوگل نسخه پیشنمایش Gemini Omni Flash را برای توسعهدهندگان منتشر کرد. این مدل که نخستینبار در رویداد Google I/O معرفی شد، قابلیت تولید و ویرایش ویدیو را با استفاده از متن، تصویر و ویدیو به صورت همزمان در اختیار کاربران قرار میدهد. توسعهدهندگان اکنون میتوانند از این مدل در Gemini API و Google AI Studio استفاده کنند.
مدل Gemini Omni Flash با شناسه gemini-omni-flash-preview بر پایه تواناییهای چندوجهی Gemini توسعه یافته است و میتواند با درک همزمان ورودیهای مختلف، ویدیوهای باکیفیت تولید کند یا آنها را از طریق دستورهای متنی ویرایش نماید. گوگل هزینه استفاده از این مدل را ۰٫۱۰ دلار برای هر ثانیه ویدیوی خروجی اعلام کرده است. این قیمت با مدل Veo 3.1 Fast برابر است.
یکی از مهمترین قابلیتهای Gemini Omni Flash، ویرایش مکالمهمحور ویدیو است. کاربران میتوانند تنها با استفاده از زبان طبیعی، تغییرات مورد نظر خود را روی ویدیو اعمال کنند. همچنین این مدل از ورودیهای چندوجهی پشتیبانی میکند و میتواند متن، تصویر و ویدیو را به صورت همزمان پردازش کند تا صحنهها از نظر سبک و جزئیات، هماهنگی خود را حفظ کنند.
گوگل اعلام کرد که این مدل هوش مصنوعی از دانش عمومی Gemini در حوزههایی مانند تاریخ، زیستشناسی و منطق روایت نیز بهره میگیرد تا ویدیوهایی طبیعیتر و منسجمتر تولید کند. همچنین Gemini Omni Flash میتواند متن و عناصر گرافیکی را با حرکات و رویدادهای داخل ویدیو هماهنگ کند.
با وجود این، نسخه فعلی این مدل چند محدودیت نیز دارد. در حال حاضر، حداکثر مدت ویدیوهای تولیدشده ۱۰ ثانیه است و گوگل وعده داده است که در آینده از ویدیوهای طولانیتر نیز پشتیبانی خواهد کرد.

در نسخه کنونی، امکان بارگذاری فایلهای صوتی مرجع و قابلیت گسترش صحنهها از طریق Gemini API وجود ندارد. همچنین اگرچه رابط برنامهنویسی از ویدیوهای مرجع تا سه ثانیه پشتیبانی میکند، مدل هنوز نمیتواند این ویدیوها را به درستی پردازش کند. همچنین گوگل اعلام کرده است که حفظ یکپارچگی شخصیتها هنگام تغییر صحنه یا حرکت دوربین هنوز به بهبود نیاز دارد.
گوگل تأکید کرد که بیشترین کارایی زمانی حاصل میشود که Gemini Omni Flash در کنار Nano Banana 2 Lite استفاده شود. در این روش، ابتدا تصویر با سرعت بالا توسط Nano Banana 2 Lite تولید میشود و سپس همان تصویر به عنوان مرجع به Gemini Omni Flash ارسال میشود تا به یک ویدیوی متحرک تبدیل شود.
همچنین این شرکت از Interactions API برای این گردشکار پشتیبانی میکند. این رابط برنامهنویسی، تاریخچه مکالمه و زمینه پروژه را حفظ میکند و به کاربران اجازه میدهد تا حداکثر سه مرحله ویرایش متوالی را روی یک پروژه انجام دهند.
شرکت گوگل برای نمایش تواناییهای این دو مدل هوش مصنوعی، سه برنامه آزمایشی نیز منتشر کرده است. برنامه Anywhere با استفاده از Nano Banana 2 Lite تصویر کاربر را در مکانهای مشهور جهان قرار میدهد و سپس Gemini Omni Flash همان تصویر را به یک ویدیوی متحرک تبدیل میکند.
برنامه Space Lift نیز برای طراحی داخلی توسعه یافته است. کاربران با بارگذاری عکس یک اتاق میتوانند طرحهای مختلف دکوراسیون را دریافت کنند و سپس با کمک Gemini Omni Flash پیشنمایش ویدیویی و سینمایی از فضای بازطراحیشده را مشاهده کنند.
نمونه سوم با نام Omni Product Studio تصاویر ثابت محصولات را که توسط Nano Banana 2 Lite تولید شدهاند، به ویدیوهای تبلیغاتی مناسب فروشگاههای اینترنتی تبدیل میکند. این برنامه نشان میدهد که چگونه میتوان با ترکیب قابلیتهای چندوجهی، فرایند تولید محتوای تصویری و ویدیویی را به صورت یکپارچه انجام داد.

















