• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

گوگل مدل زبان-تصویر PaliGemma 2 را معرفی کرد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
جمعه 16 آذر 1403 - 10:30
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
گوگل مدل زبان-تصویر PaliGemma 2 را معرفی کرد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

گوگل مدل جدید زبان-تصویر به نام PaliGemma 2 را معرفی کرد. این مدل ترکیبی از قابلیت‌های پردازش تصویر و زبان است که با استفاده از هوش مصنوعی پیشرفته، امکان درک و تفسیر همزمان تصاویر و متون را فراهم می‌کند.

به گزارش تکناک، این مدل در زمینه‌هایی مانند توصیف تصاویر، پاسخ به سوالات مرتبط با محتوای بصری و تحلیل داده‌های چندرسانه‌ای کاربرد دارد و بهبودهای قابل‌توجهی در دقت و عملکرد نسبت به نسخه‌های قبلی ارائه می‌دهد.

پس از معرفی مدل زبان-تصویر Gemma 2 در رویداد I/O 2024 در ماه می، گوگل امروز از جدیدترین مدل خود با نام PaliGemma 2 پرده برداشت. این مدل به‌عنوان یک مدل باز زبان-تصویر (VLM) عرضه شده و قابلیت‌های پیشرفته‌ای را در زمینه پردازش و تحلیل تصاویر و ویدیوها ارائه می‌دهد.

9to5google می‌نویسد که نسخه اول PaliGemma که در ماه مه معرفی شد، برای کاربردهایی مانند زیرنویس تصاویر و ویدیوهای کوتاه، درک متن در تصاویر، شناسایی اشیاء، تقسیم‌بندی اشیاء و پاسخ به سوالات بصری توسعه یافته بود. اما مدل جدید، PaliGemma 2، علاوه بر حفظ این ویژگی‌ها، چندین قابلیت جدید و بهبود یافته را نیز شامل می‌شود.

یکی از مهم‌ترین ویژگی‌های جدید این مدل، قابلیت “زیرنویس طولانی” است که به آن امکان تولید “زیرنویس‌های دقیق و مرتبط با متن” برای تصاویر را می‌دهد. این مدل قادر است فراتر از شناسایی ساده اشیاء، به توصیف اقدامات، احساسات و روایت کلی صحنه بپردازد. در واقع، PaliGemma 2 توانسته است که تصاویر را به‌طور عمیق‌تر و با جزئیات بیشتری تحلیل کرده و تصویر کلی‌تری از آنچه در حال وقوع است، ارائه دهد.

PaliGemma 2 می تواند که تصاویر را به‌طور عمیق‌تر و با جزئیات بیشتری تحلیل کند

مدل جدید در اندازه‌های مختلف با 3B، 10B و 28B پارامتر و همچنین وضوح‌های 224px، 448px و 896px در دسترس قرار دارد. علاوه بر این، PaliGemma 2 به‌طور ویژه در زمینه‌هایی چون شناسایی دقیق کاراکترهای نوری (OCR)، درک ساختار و محتوای جداول در اسناد و شناسایی فرمول‌های شیمیایی و نت‌های موسیقی عملکرد برجسته‌ای از خود نشان داده است. همچنین، این مدل در تولید گزارش‌های رادیوگرافی قفسه سینه نیز توانسته است نتایج قابل توجهی را ارائه دهد.

گوگل اعلام کرده است که PaliGemma 2 به‌گونه‌ای طراحی شده که به‌عنوان یک جایگزین فوری برای کاربران مدل قبلی عمل کند. از آنجا که این مدل برای بیشتر وظایف بدون نیاز به تغییرات عمده در کد، عملکرد بهتری دارد، توسعه‌دهندگان می‌توانند از بهبودهای فوری در عملکرد بهره‌مند شوند. یکی دیگر از ویژگی‌های جذاب PaliGemma 2، سهولت در تنظیم دقیق مدل برای استفاده‌های خاص است.

مدل‌های از پیش‌آموزش‌دیده شده و کدهای مربوط به PaliGemma 2 هم‌اکنون از طریق پلتفرم‌های Kaggle، Hugging Face و Ollama در دسترس عموم قرار گرفته‌اند. این مدل جدید نه تنها به توسعه‌دهندگان ابزارهای پیشرفته‌تری برای پردازش زبان و تصویر ارائه می‌دهد، بلکه به‌عنوان یک ابزار کاربردی برای بسیاری از صنایع و زمینه‌های تحقیقاتی مختلف نیز مورد استفاده قرار خواهد گرفت.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

گوگل امکان برقراری تماس تلفنی با کسب‌وکارهای محلی را به هوش مصنوعی سپرد
اخبار هوش مصنوعی

گوگل از تماس خودکار هوش مصنوعی برای کسب‌وکارها پرده‌برداری کرد

نوشته شده توسط امیرحسین یونس
25 تیر 1404
هم‌بنیان‌گذار Waze: نسل آینده پشت فرمان نخواهد نشست
فناوری

هم‌بنیان‌گذار Waze: نسل آینده پشت فرمان نخواهد نشست

نوشته شده توسط اسما کلهر
25 تیر 1404
رقابت شدید در بازار دستیارهای هوش مصنوعی؛ Microsoft Copilot در سایه ChatGPT
اخبار هوش مصنوعی

مایکروسافت کوپایلت با سرمایه‌گذاری میلیاردی هنوز از ChatGPT عقب است

نوشته شده توسط امیرحسین یونس
25 تیر 1404
گوگل تاریخ برگزاری رویداد معرفی پیکسل 10 را اعلام کرد
پیشنهاد سردبیر

تاریخ معرفی گوشی پیکسل 10 اعلام شد

نوشته شده توسط امیرحسین یونس
25 تیر 1404
چرا مدل‌های زبانی هوش مصنوعی در انتخاب «عدد تصادفی» اغلب به سراغ عدد ۲۷ می‌روند؟
اخبار هوش مصنوعی

چرا مدل‌های زبانی در انتخاب «عدد تصادفی» اغلب به سراغ عدد ۲۷ می‌روند؟

نوشته شده توسط امیرحسین یونس
25 تیر 1404
خبر بعدی
OpenAI مدل o1 را از پیش‌نمایش خارج کرد و پشتیبانی از آپلود تصاویر را اضافه کرد

شرکت OpenAI مدل هوش مصنوعی o1 جدید خود را به شکل عمومی منتشر کرد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

khordad1404 khordad1404 khordad1404

پیشنهادی

رفع تدریجی محدودیت های اینترنتی در ایران

رفع تدریجی محدودیت های اینترنتی در ایران

4 تیر 1404
ساخت کیف پول اتریوم

راهنمای جامع و کامل ساخت کیف پول اتریوم

13 تیر 1404

داغ‌ترین‌های روز

مقایسه شیائومی نوت 13 و نوت 14

مقایسه شیائومی نوت 13 و نوت 14 ؛ اقتصادی‌ترین میان‌رده‌های شیائومی

22 تیر 1404
ارتقاء جنگنده میگ‑۲۹ در ایران؛ بازگشت پرقدرت به میدان نبرد

ارتقاء جنگنده میگ‑۲۹ در ایران؛ بازگشت پرقدرت به میدان نبرد

21 تیر 1404
۳۱ گوشی شیائومی به‌روزرسانی Android 16 را دریافت نخواهند کرد

31 گوشی شیائومی به‌روزرسانی اندروید 16 را دریافت نخواهند کرد

24 تیر 1404
تحلیلگران: جهش قیمت ریپل تا ۶ دلار در صورت حفظ حمایت کلیدی قطعی است

تحلیلگران: جهش قیمت ریپل تا ۶ دلار در صورت حفظ حمایت کلیدی قطعی است

23 تیر 1404
پیش‌بینی صعودی پیتر برنت برای ریپل: بالا، بالا و فقط بالا

پیش‌بینی صعودی پیتر برنت برای ریپل: بالا، بالا و فقط بالا

21 تیر 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

رنگ مدل های آیفون ۱۷ لو رفت

رنگ‌های جدید آیفون ۱۷: از مشکی تا آبی روشن، کدام‌یک شایسته شماست؟

25 تیر 1404
گوگل امکان برقراری تماس تلفنی با کسب‌وکارهای محلی را به هوش مصنوعی سپرد

گوگل از تماس خودکار هوش مصنوعی برای کسب‌وکارها پرده‌برداری کرد

25 تیر 1404
عرضه جهانی تبلت گیمینگ RedMagic Astra به‌عنوان رقیب مستقیم Legion Y700 Gen 4

ردمجیک تبلت گیمینگ رقیب Legion Y700 Gen 4 را معرفی کرد

25 تیر 1404
هم‌بنیان‌گذار Waze: نسل آینده پشت فرمان نخواهد نشست

هم‌بنیان‌گذار Waze: نسل آینده پشت فرمان نخواهد نشست

25 تیر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir