• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » گوگل مدل زبان-تصویر PaliGemma 2 را معرفی کرد

گوگل مدل زبان-تصویر PaliGemma 2 را معرفی کرد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
جمعه 16 آذر 1403 - 10:30
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
گوگل مدل زبان-تصویر PaliGemma 2 را معرفی کرد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

گوگل مدل جدید زبان-تصویر به نام PaliGemma 2 را معرفی کرد. این مدل ترکیبی از قابلیت‌های پردازش تصویر و زبان است که با استفاده از هوش مصنوعی پیشرفته، امکان درک و تفسیر همزمان تصاویر و متون را فراهم می‌کند.

به گزارش تکناک، این مدل در زمینه‌هایی مانند توصیف تصاویر، پاسخ به سوالات مرتبط با محتوای بصری و تحلیل داده‌های چندرسانه‌ای کاربرد دارد و بهبودهای قابل‌توجهی در دقت و عملکرد نسبت به نسخه‌های قبلی ارائه می‌دهد.

پس از معرفی مدل زبان-تصویر Gemma 2 در رویداد I/O 2024 در ماه می، گوگل امروز از جدیدترین مدل خود با نام PaliGemma 2 پرده برداشت. این مدل به‌عنوان یک مدل باز زبان-تصویر (VLM) عرضه شده و قابلیت‌های پیشرفته‌ای را در زمینه پردازش و تحلیل تصاویر و ویدیوها ارائه می‌دهد.

9to5google می‌نویسد که نسخه اول PaliGemma که در ماه مه معرفی شد، برای کاربردهایی مانند زیرنویس تصاویر و ویدیوهای کوتاه، درک متن در تصاویر، شناسایی اشیاء، تقسیم‌بندی اشیاء و پاسخ به سوالات بصری توسعه یافته بود. اما مدل جدید، PaliGemma 2، علاوه بر حفظ این ویژگی‌ها، چندین قابلیت جدید و بهبود یافته را نیز شامل می‌شود.

یکی از مهم‌ترین ویژگی‌های جدید این مدل، قابلیت “زیرنویس طولانی” است که به آن امکان تولید “زیرنویس‌های دقیق و مرتبط با متن” برای تصاویر را می‌دهد. این مدل قادر است فراتر از شناسایی ساده اشیاء، به توصیف اقدامات، احساسات و روایت کلی صحنه بپردازد. در واقع، PaliGemma 2 توانسته است که تصاویر را به‌طور عمیق‌تر و با جزئیات بیشتری تحلیل کرده و تصویر کلی‌تری از آنچه در حال وقوع است، ارائه دهد.

PaliGemma 2 می تواند که تصاویر را به‌طور عمیق‌تر و با جزئیات بیشتری تحلیل کند

مدل جدید در اندازه‌های مختلف با 3B، 10B و 28B پارامتر و همچنین وضوح‌های 224px، 448px و 896px در دسترس قرار دارد. علاوه بر این، PaliGemma 2 به‌طور ویژه در زمینه‌هایی چون شناسایی دقیق کاراکترهای نوری (OCR)، درک ساختار و محتوای جداول در اسناد و شناسایی فرمول‌های شیمیایی و نت‌های موسیقی عملکرد برجسته‌ای از خود نشان داده است. همچنین، این مدل در تولید گزارش‌های رادیوگرافی قفسه سینه نیز توانسته است نتایج قابل توجهی را ارائه دهد.

گوگل اعلام کرده است که PaliGemma 2 به‌گونه‌ای طراحی شده که به‌عنوان یک جایگزین فوری برای کاربران مدل قبلی عمل کند. از آنجا که این مدل برای بیشتر وظایف بدون نیاز به تغییرات عمده در کد، عملکرد بهتری دارد، توسعه‌دهندگان می‌توانند از بهبودهای فوری در عملکرد بهره‌مند شوند. یکی دیگر از ویژگی‌های جذاب PaliGemma 2، سهولت در تنظیم دقیق مدل برای استفاده‌های خاص است.

مدل‌های از پیش‌آموزش‌دیده شده و کدهای مربوط به PaliGemma 2 هم‌اکنون از طریق پلتفرم‌های Kaggle، Hugging Face و Ollama در دسترس عموم قرار گرفته‌اند. این مدل جدید نه تنها به توسعه‌دهندگان ابزارهای پیشرفته‌تری برای پردازش زبان و تصویر ارائه می‌دهد، بلکه به‌عنوان یک ابزار کاربردی برای بسیاری از صنایع و زمینه‌های تحقیقاتی مختلف نیز مورد استفاده قرار خواهد گرفت.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

گوشی هوشمند در دست کاربر با نمایش لوگوی شبکه اجتماعی Threads روی صفحه، پس‌زمینه گرافیکی با رنگ‌های گرادیانی و تکرار نام Threads
پیشنهاد سردبیر

اشتراک پست تردز در استوری اینستاگرام بدون خروج از اپلیکیشن ممکن شد

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
لوگوی OpenAI با طراحی مینیمال به رنگ سبز، نمایش هویت بصری OpenAI و فناوری هوش مصنوعی
اخبار هوش مصنوعی

اولین محصول سخت افزاری OpenAI مشخص شد

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
لوگوی Amazon نصب‌شده روی نمای بیرونی ساختمان، نمایش برند آمازون در محیط شهری
اخبار هوش مصنوعی

عامل قطعی ۱۳ ساعته سرویس AWS مشخص شد

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
تصویر گرافیکی اندروید ۱۷ در کنار لوگوی شیائومی، اشاره به دریافت به‌روزرسانی Android 17 برای دستگاه‌های Xiaomi
رویداد ها

آپدیت اندروید ۱۷ شیائومی هم‌زمان با برگزاری رویداد Google I/O منتشر می‌شود

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
تصویر مفهومی از ارتباط ماهواره‌ای اپل که در آن یک آیفون سیگنال نوری را به یک ماهواره در فضا ارسال می‌کند
اینترنت و شبکه

اپل در حال تولید قابی ویژه برای تقویت اتصال ماهواره‌ای آیفون است

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
خبر بعدی
OpenAI مدل o1 را از پیش‌نمایش خارج کرد و پشتیبانی از آپلود تصاویر را اضافه کرد

شرکت OpenAI مدل هوش مصنوعی o1 جدید خود را به شکل عمومی منتشر کرد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

سه گوشی هوشمند اینفینیکس نوت اج 5G در رنگ‌های نقره‌ای، سبز و آبی در کنار نمای جلوی گوشی با صفحه نمایش خمیده.

گوشی نوت اج 5G اینفینیکس با تراشه دیمنسیتی ۷۱۰۰ رونمایی شد

29 بهمن 1404 - به‌روزشده در 30 بهمن 1404
خط و نشان اپل برای سامسونگ؛ آیفون تاشو در راه است

خط و نشان اپل برای سامسونگ؛ آیفون تاشو در راه است

27 بهمن 1404

داغ‌ترین‌های روز

مایکروسافت دسترسی به فایل‌های ISO ویندوز ۱۱ را مسدود کرد

مایکروسافت دسترسی به فایل‌های ISO ویندوز ۱۱ را مسدود کرد

28 بهمن 1404 - به‌روزشده در 29 بهمن 1404
بحران کمبود رم

خطر ورشکستگی گسترده در صنعت فناوری؛ بحران کمبود رم قربانی می‌گیرد

28 بهمن 1404
بهترین گوشی های کارکرده

این گوشی‌های کارکرده هنوز ارزش خرید دارند!

26 بهمن 1404 - به‌روزشده در 27 بهمن 1404
تصویر تبلیغاتی و مفهومی از تراشه Exynos 2600 سامسونگ با درخششی آبی‌رنگ در پس‌زمینه تاریک. ذرات نور و جلوه‌های گرافیکی به‌صورت موج‌دار در اطراف تراشه پخش شده‌اند تا قدرت گرافیکی و معماری پردازشی پیشرفته را نمایش دهند. لوگوی 5G روی تراشه و نور مرکزی آن، حس انرژی و فناوری سطح بالا را منتقل می‌کند.

پادشاه جدید گرافیک موبایل؛ درخشش خیره‌کننده تراشه اگزینوس ۲۶۰۰ در رهگیری پرتو

28 بهمن 1404
Coyote Block 3 با سلاح الکترومغناطیسی، دسته پهپادی را در آزمایش ارتش آمریکا سرنگون کر

پهپاد کایوت دسته‌های پهپادی را با سلاح الکترومغناطیسی رهگیری و نابود می‌کند

28 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

گوشی هوشمند در دست کاربر با نمایش لوگوی شبکه اجتماعی Threads روی صفحه، پس‌زمینه گرافیکی با رنگ‌های گرادیانی و تکرار نام Threads

اشتراک پست تردز در استوری اینستاگرام بدون خروج از اپلیکیشن ممکن شد

1 اسفند 1404
لوگوی OpenAI با طراحی مینیمال به رنگ سبز، نمایش هویت بصری OpenAI و فناوری هوش مصنوعی

اولین محصول سخت افزاری OpenAI مشخص شد

1 اسفند 1404
لوگوی Amazon نصب‌شده روی نمای بیرونی ساختمان، نمایش برند آمازون در محیط شهری

عامل قطعی ۱۳ ساعته سرویس AWS مشخص شد

1 اسفند 1404
نمای محیط Notepad جدید در ویندوز با نوار ابزار قالب‌بندی، امکان افزودن تصویر، جدول و متن غنی در ویرایشگر

مایکروسافت پشتیبانی از تصاویر را به نوت پد ویندوز اضافه می‌کند

1 اسفند 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir