• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » گوگل مدل زبان-تصویر PaliGemma 2 را معرفی کرد

گوگل مدل زبان-تصویر PaliGemma 2 را معرفی کرد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
جمعه 16 آذر 1403 - 10:30
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
گوگل مدل زبان-تصویر PaliGemma 2 را معرفی کرد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

گوگل مدل جدید زبان-تصویر به نام PaliGemma 2 را معرفی کرد. این مدل ترکیبی از قابلیت‌های پردازش تصویر و زبان است که با استفاده از هوش مصنوعی پیشرفته، امکان درک و تفسیر همزمان تصاویر و متون را فراهم می‌کند.

به گزارش تکناک، این مدل در زمینه‌هایی مانند توصیف تصاویر، پاسخ به سوالات مرتبط با محتوای بصری و تحلیل داده‌های چندرسانه‌ای کاربرد دارد و بهبودهای قابل‌توجهی در دقت و عملکرد نسبت به نسخه‌های قبلی ارائه می‌دهد.

پس از معرفی مدل زبان-تصویر Gemma 2 در رویداد I/O 2024 در ماه می، گوگل امروز از جدیدترین مدل خود با نام PaliGemma 2 پرده برداشت. این مدل به‌عنوان یک مدل باز زبان-تصویر (VLM) عرضه شده و قابلیت‌های پیشرفته‌ای را در زمینه پردازش و تحلیل تصاویر و ویدیوها ارائه می‌دهد.

9to5google می‌نویسد که نسخه اول PaliGemma که در ماه مه معرفی شد، برای کاربردهایی مانند زیرنویس تصاویر و ویدیوهای کوتاه، درک متن در تصاویر، شناسایی اشیاء، تقسیم‌بندی اشیاء و پاسخ به سوالات بصری توسعه یافته بود. اما مدل جدید، PaliGemma 2، علاوه بر حفظ این ویژگی‌ها، چندین قابلیت جدید و بهبود یافته را نیز شامل می‌شود.

یکی از مهم‌ترین ویژگی‌های جدید این مدل، قابلیت “زیرنویس طولانی” است که به آن امکان تولید “زیرنویس‌های دقیق و مرتبط با متن” برای تصاویر را می‌دهد. این مدل قادر است فراتر از شناسایی ساده اشیاء، به توصیف اقدامات، احساسات و روایت کلی صحنه بپردازد. در واقع، PaliGemma 2 توانسته است که تصاویر را به‌طور عمیق‌تر و با جزئیات بیشتری تحلیل کرده و تصویر کلی‌تری از آنچه در حال وقوع است، ارائه دهد.

PaliGemma 2 می تواند که تصاویر را به‌طور عمیق‌تر و با جزئیات بیشتری تحلیل کند

مدل جدید در اندازه‌های مختلف با 3B، 10B و 28B پارامتر و همچنین وضوح‌های 224px، 448px و 896px در دسترس قرار دارد. علاوه بر این، PaliGemma 2 به‌طور ویژه در زمینه‌هایی چون شناسایی دقیق کاراکترهای نوری (OCR)، درک ساختار و محتوای جداول در اسناد و شناسایی فرمول‌های شیمیایی و نت‌های موسیقی عملکرد برجسته‌ای از خود نشان داده است. همچنین، این مدل در تولید گزارش‌های رادیوگرافی قفسه سینه نیز توانسته است نتایج قابل توجهی را ارائه دهد.

گوگل اعلام کرده است که PaliGemma 2 به‌گونه‌ای طراحی شده که به‌عنوان یک جایگزین فوری برای کاربران مدل قبلی عمل کند. از آنجا که این مدل برای بیشتر وظایف بدون نیاز به تغییرات عمده در کد، عملکرد بهتری دارد، توسعه‌دهندگان می‌توانند از بهبودهای فوری در عملکرد بهره‌مند شوند. یکی دیگر از ویژگی‌های جذاب PaliGemma 2، سهولت در تنظیم دقیق مدل برای استفاده‌های خاص است.

مدل‌های از پیش‌آموزش‌دیده شده و کدهای مربوط به PaliGemma 2 هم‌اکنون از طریق پلتفرم‌های Kaggle، Hugging Face و Ollama در دسترس عموم قرار گرفته‌اند. این مدل جدید نه تنها به توسعه‌دهندگان ابزارهای پیشرفته‌تری برای پردازش زبان و تصویر ارائه می‌دهد، بلکه به‌عنوان یک ابزار کاربردی برای بسیاری از صنایع و زمینه‌های تحقیقاتی مختلف نیز مورد استفاده قرار خواهد گرفت.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

یک زوج جوان در حال عکاسی سلفی با دوربین دیجیتال سفید رنگ لنوو X1 در فضای باز.
دوربین دیجیتال

لنوو از دوربین دیجیتال X1 با حسگر ۱۲ مگاپیکسلی سونی رونمایی کرد

نوشته شده توسط اسما کلهر
28 آذر 1404
پنجره نصب نرم‌افزار ادوبی فتوشاپ در محیط فروشگاه مایکروسافت (Microsoft Store) در ویندوز ۱۱
پیشنهاد سردبیر

همهٔ قابلیت‌های جدیدی که در سال ۲۰۲۵ به فروشگاه مایکروسافت اضافه شد

نوشته شده توسط امیرحسین یونس
28 آذر 1404
سم آلتمن (مدیرعامل OpenAI) در حال نشان دادن علامت لایک (شست رو به بالا).
اخبار هوش مصنوعی

اپلیکیشن موبایل ChatGPT به رکورد جدید ۳ میلیارد دلار هزینهٔ مصرف‌کنندگان رسید

نوشته شده توسط امیرحسین یونس
28 آذر 1404
نیچر شاخص‌ترین تصاویر علمی سال ۲۰۲۵ را منتشر کرد؛ از اعماق فضا تا زیست‌پزشکی و بحران اقلیم.
پیشنهاد سردبیر

نیچر برترین تصاویر علمی سال ۲۰۲۵ را منتشر کرد

نوشته شده توسط اسما کلهر
27 آذر 1404
Gemini با Nano Banana و تشخیص SynthID
اخبار هوش مصنوعی

افزایش قابلیت‌های اپلیکیشن جمنای

نوشته شده توسط اسما کلهر
27 آذر 1404
خبر بعدی
OpenAI مدل o1 را از پیش‌نمایش خارج کرد و پشتیبانی از آپلود تصاویر را اضافه کرد

شرکت OpenAI مدل هوش مصنوعی o1 جدید خود را به شکل عمومی منتشر کرد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

بهترین مینی‌ کیس ها

بهترین کیس‌های مینی تاور و Small Form Factor در ایران + راهنمای خرید کامل

23 آذر 1404
ChatGPT پردانلودترین اپلیکیشن اپل در سال 2025 در ایالات متحده است

ChatGPT پربازدیدترین اپلیکیشن رایگان آیفون در ۲۰۲۵؛ بالاتر از تیک‌تاک و واتساپ

19 آذر 1404

داغ‌ترین‌های روز

نمای نزدیک از ساعت هوشمند Huawei Watch نسخه دهمین سالگرد با بدنه فلزی، تاج چرخان و صفحه نمایش دایره‌ای حاوی ویجت‌ های سلامت و زمان، تمرکز بر طراحی پریمیوم و رابط کاربری پیشرفته

هواوی نسخه دهمین سالگرد هواوی واچ را هم‌زمان با نوا ۱۵ معرفی می‌کند

26 آذر 1404
پوستر تبلیغاتی ساعت Rogbid در طبیعت که قابلیت چراغ‌قوه جانبی و مسیریابی روی صفحه آن فعال است.

ساعت هوشمند راگبید Enduro با باتری ۱۱۰۰ میلی‌آمپر ساعتی عرضه شد

24 آذر 1404 - به‌روزشده در 25 آذر 1404
شیائومی شروع به انتشار به‌روزرسانی امنیتی دسامبر ۲۰۲۵ کرد

شیائومی انتشار به‌روزرسانی امنیتی دسامبر ۲۰۲۵ HyperOS را آغاز کرد

24 آذر 1404 - به‌روزشده در 25 آذر 1404
تصویر یک تولیدکننده محتوای نگران را نشان می‌دهد که مقابل مانیتور با نمودار درآمد در حال سقوط و لوگوی یوتیوب نشسته است و کاهش شدید درآمد تبلیغاتی را به‌صورت نمادین نمایش می‌دهد.

زلزله در یوتیوب فارسی؛ سقوط ۹۰ درصدی درآمد تولیدکنندگان محتوا

26 آذر 1404
اپل برای عرضه هشت آیفون جدید آماده می‌ شود

اپل برای عرضه هشت آیفون جدید آماده می‌ شود

26 آذر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

گوشی تاشوی سامسونگ که صفحه برنامه Link to Windows را نمایش می‌دهد.

امکان قفل‌کردن کامپیوتر با گوشی‌های اندرویدی

28 آذر 1404
تصویر تبلیغاتی چیپست سامسونگ Exynos 2600 روی برد الکترونیکی.

سامسونگ از اگزینوس ۲۶۰۰ پرده‌برداری کرد؛ نخستین تراشه ۲ نانومتری موبایل جهان

28 آذر 1404
یک زوج جوان در حال عکاسی سلفی با دوربین دیجیتال سفید رنگ لنوو X1 در فضای باز.

لنوو از دوربین دیجیتال X1 با حسگر ۱۲ مگاپیکسلی سونی رونمایی کرد

28 آذر 1404
پنجره نصب نرم‌افزار ادوبی فتوشاپ در محیط فروشگاه مایکروسافت (Microsoft Store) در ویندوز ۱۱

همهٔ قابلیت‌های جدیدی که در سال ۲۰۲۵ به فروشگاه مایکروسافت اضافه شد

28 آذر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir