• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » گوگل مدل زبان-تصویر PaliGemma 2 را معرفی کرد

گوگل مدل زبان-تصویر PaliGemma 2 را معرفی کرد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
جمعه 16 آذر 1403 - 10:30
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
گوگل مدل زبان-تصویر PaliGemma 2 را معرفی کرد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

گوگل مدل جدید زبان-تصویر به نام PaliGemma 2 را معرفی کرد. این مدل ترکیبی از قابلیت‌های پردازش تصویر و زبان است که با استفاده از هوش مصنوعی پیشرفته، امکان درک و تفسیر همزمان تصاویر و متون را فراهم می‌کند.

به گزارش تکناک، این مدل در زمینه‌هایی مانند توصیف تصاویر، پاسخ به سوالات مرتبط با محتوای بصری و تحلیل داده‌های چندرسانه‌ای کاربرد دارد و بهبودهای قابل‌توجهی در دقت و عملکرد نسبت به نسخه‌های قبلی ارائه می‌دهد.

پس از معرفی مدل زبان-تصویر Gemma 2 در رویداد I/O 2024 در ماه می، گوگل امروز از جدیدترین مدل خود با نام PaliGemma 2 پرده برداشت. این مدل به‌عنوان یک مدل باز زبان-تصویر (VLM) عرضه شده و قابلیت‌های پیشرفته‌ای را در زمینه پردازش و تحلیل تصاویر و ویدیوها ارائه می‌دهد.

9to5google می‌نویسد که نسخه اول PaliGemma که در ماه مه معرفی شد، برای کاربردهایی مانند زیرنویس تصاویر و ویدیوهای کوتاه، درک متن در تصاویر، شناسایی اشیاء، تقسیم‌بندی اشیاء و پاسخ به سوالات بصری توسعه یافته بود. اما مدل جدید، PaliGemma 2، علاوه بر حفظ این ویژگی‌ها، چندین قابلیت جدید و بهبود یافته را نیز شامل می‌شود.

یکی از مهم‌ترین ویژگی‌های جدید این مدل، قابلیت “زیرنویس طولانی” است که به آن امکان تولید “زیرنویس‌های دقیق و مرتبط با متن” برای تصاویر را می‌دهد. این مدل قادر است فراتر از شناسایی ساده اشیاء، به توصیف اقدامات، احساسات و روایت کلی صحنه بپردازد. در واقع، PaliGemma 2 توانسته است که تصاویر را به‌طور عمیق‌تر و با جزئیات بیشتری تحلیل کرده و تصویر کلی‌تری از آنچه در حال وقوع است، ارائه دهد.

PaliGemma 2 می تواند که تصاویر را به‌طور عمیق‌تر و با جزئیات بیشتری تحلیل کند

مدل جدید در اندازه‌های مختلف با 3B، 10B و 28B پارامتر و همچنین وضوح‌های 224px، 448px و 896px در دسترس قرار دارد. علاوه بر این، PaliGemma 2 به‌طور ویژه در زمینه‌هایی چون شناسایی دقیق کاراکترهای نوری (OCR)، درک ساختار و محتوای جداول در اسناد و شناسایی فرمول‌های شیمیایی و نت‌های موسیقی عملکرد برجسته‌ای از خود نشان داده است. همچنین، این مدل در تولید گزارش‌های رادیوگرافی قفسه سینه نیز توانسته است نتایج قابل توجهی را ارائه دهد.

گوگل اعلام کرده است که PaliGemma 2 به‌گونه‌ای طراحی شده که به‌عنوان یک جایگزین فوری برای کاربران مدل قبلی عمل کند. از آنجا که این مدل برای بیشتر وظایف بدون نیاز به تغییرات عمده در کد، عملکرد بهتری دارد، توسعه‌دهندگان می‌توانند از بهبودهای فوری در عملکرد بهره‌مند شوند. یکی دیگر از ویژگی‌های جذاب PaliGemma 2، سهولت در تنظیم دقیق مدل برای استفاده‌های خاص است.

مدل‌های از پیش‌آموزش‌دیده شده و کدهای مربوط به PaliGemma 2 هم‌اکنون از طریق پلتفرم‌های Kaggle، Hugging Face و Ollama در دسترس عموم قرار گرفته‌اند. این مدل جدید نه تنها به توسعه‌دهندگان ابزارهای پیشرفته‌تری برای پردازش زبان و تصویر ارائه می‌دهد، بلکه به‌عنوان یک ابزار کاربردی برای بسیاری از صنایع و زمینه‌های تحقیقاتی مختلف نیز مورد استفاده قرار خواهد گرفت.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

سوسک سایبورگ جدید تا سه ساعت زیر آب ماموریت انجام می‌ دهد
رباتیک

سوسک سایبورگ جدید تا سه ساعت زیر آب ماموریت انجام می‌ دهد

نوشته شده توسط نرگس چالوک
13 تیر 1405
همکاری شیائومی با Kingsoft Cloud
اخبار هوش مصنوعی

شیائومی سرمایه‌گذاری هوش مصنوعی خود را به ۱.۴ میلیارد دلار افزایش داد

نوشته شده توسط مانی
13 تیر 1405
گزارش‌ها از آزمایش داخلی HyperOS 3.3 مبتنی بر اندروید ۱۷ خبر می‌دهند
سیستم عامل موبایل

شیائومی در حال توسعه HyperOS 3.3 مبتنی بر اندروید ۱۷ است

نوشته شده توسط ساینا چمنی
13 تیر 1405
دارالفنون ابوظبی با ظرفیت ۶ هزار نفر چهره فرهنگی ابوظبی را متحول می‌ کند
فناوری

دارالفنون ابوظبی با ظرفیت ۶ هزار نفر چهره فرهنگی ابوظبی را متحول می‌ کند + تصویر

نوشته شده توسط نرگس چالوک
13 تیر 1405
مدل Claude Fable
اخبار هوش مصنوعی

عرضه دوباره مدل Claude Fable؛ کاربران از اُفت عملکرد شکایت دارند

نوشته شده توسط مانی
13 تیر 1405
خبر بعدی
OpenAI مدل o1 را از پیش‌نمایش خارج کرد و پشتیبانی از آپلود تصاویر را اضافه کرد

شرکت OpenAI مدل هوش مصنوعی o1 جدید خود را به شکل عمومی منتشر کرد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

پیش‌بینی استاندارد چارترد

یک پیش‌بینی جنجالی؛ بیت‌کوین ۵۰۰ هزار دلاری می شود

27 خرداد 1405
مقایسه پوکو X8 Pro با گلکسی A57

مقایسه گوشی پوکو X8 Pro با گلکسی A57؛ کدام ارزش خرید بیشتری دارد؟

5 تیر 1405 - به‌روزشده در 6 تیر 1405

داغ‌ترین‌های روز

J-35A؛ آشنایی کامل با جنگنده نسل پنجم چین و رقیب جدید F-35

معرفی جنگنده نسل پنجم J-35A چین

12 تیر 1405 - به‌روزشده در 13 تیر 1405
راهنمای خرید آیفون دست دوم؛ چگونه از سرقتی نبودن آیفون مطمئن شویم؟

راهنمای خرید آیفون دست دوم؛ چگونه از سرقتی نبودن آیفون مطمئن شویم؟

12 تیر 1405 - به‌روزشده در 13 تیر 1405
برنامه Google Earth با قابلیت‌ های متنوع و جذاب خود، امکانات وسیعی را برای مشاهده اماکن و نقشه‌ های قدیمی برای کاربران به ارمغان می‌آورد.

سفر به گذشته با Google Earth

17 فروردین 1403 - به‌روزشده در 27 مهر 1404
بررسی لپ تاپ MSI Raider 18 HX AI

بررسی لپ تاپ MSI Raider 18 HX AI؛ هیولای گیمینگ MSI

12 تیر 1405 - به‌روزشده در 13 تیر 1405
نسخه بتای One UI 9 به گوشی‌های میان‌رده گلکسی رسید

نسخه بتای One UI 9 به گوشی‌های میان‌رده گلکسی رسید

7 تیر 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

حتی آیفون ۱۸ با ۹ گیگابایت رم هم این دو ویژگی را ندارد

حتی آیفون ۱۸ با ۹ گیگابایت رم هم این دو ویژگی را ندارد

13 تیر 1405
اپلیکیشن Signatures

گوگل اپلیکیشن جدید «Signatures» را برای پیکسل و اندروید منتشر می‌کند

13 تیر 1405
سوسک سایبورگ جدید تا سه ساعت زیر آب ماموریت انجام می‌ دهد

سوسک سایبورگ جدید تا سه ساعت زیر آب ماموریت انجام می‌ دهد

13 تیر 1405
همکاری شیائومی با Kingsoft Cloud

شیائومی سرمایه‌گذاری هوش مصنوعی خود را به ۱.۴ میلیارد دلار افزایش داد

13 تیر 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir