• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » جهش بزرگ اپل در هوش مصنوعی با مدل زبان بزرگ چند رسانه ای MM1

جهش بزرگ اپل در هوش مصنوعی با مدل زبان بزرگ چند رسانه ای MM1

صمد کردی نوشته شده توسط صمد کردی
یکشنبه 27 اسفند 1402 - 21:30
در اخبار هوش مصنوعی, فناوری
پژوهشگران اپل با مدل زبان بزرگ چندرسانه‌ای جدید خود به نام MM1 روش‌های جدیدی برای آموزش مدل‌های زبان بزرگ بر اساس متن و تصویر توسعه داده‌اند که به دستیابی به سیستم‌های هوش مصنوعی قدرتمندتر و انعطاف‌پذیرتر منجر می‌شود. 
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

پژوهشگران اپل با مدل زبان بزرگ چندرسانه‌ای جدید خود به نام MM1 روش‌های جدیدی برای آموزش مدل‌های زبان بزرگ بر اساس متن و تصویر توسعه داده‌اند که به دستیابی به سیستم‌های هوش مصنوعی قدرتمندتر و انعطاف‌پذیرتر منجر می‌شود. 

به گزارش تک‌ناک این پژوهش که در مقاله تحقیقی‌ با عنوان «MM1: روش‌ها، تحلیل و بینش‌هایی از پیش-آموزش مدل‌های زبان بزرگ چندوجهی» که این هفته به طور ناگهانی در سایت arxiv.org منتشر شد، نشان می‌دهد که چگونه ترکیب دقیق انواع مختلف داده‌های آموزشی و ساختارهای مدل می‌تواند به عملکردی در سطح فناوری‌های پیشرفته در طیف وسیعی از معیارهای هوش مصنوعی منجر شود.

پژوهشگران توضیح می‌دهند: «ما نشان می‌دهیم که برای پیش‌آموزش چندوجهی در مقیاس بزرگ، استفاده از ترکیبی دقیق از شرح تصویر، متن و تصویر درهم‌آمیخته و داده‌های صرفا متنی برای دستیابی به نتایج برتر در چند نمونه بر روی معیارهای مختلف بسیار مهم است.» با آموزش مدل‌ها روی مجموعه‌ی داده‌های متنوعی که اطلاعات بصری و زبانی را در بر می‌گیرد، مدل‌های MM1 توانستند در کارهایی مانند شرح تصویر، پاسخ به پرسش‌های تصویری و استنتاج زبان طبیعی عملکرد فوق‌العاده‌ای داشته باشند.

مقیاس‌گذاری مؤلفه‌های بصری کلیدی است پژوهشگران همچنین دریافتند که انتخاب کدگذار تصویر و رزولوشن تصاویر ورودی تأثیر چشمگیری بر عملکرد مدل دارد. آن‌ها گفتند: «ما نشان می‌دهیم که کدگذار تصویر به همراه رزولوشن تصویر و تعداد نشانه‌های تصویر تأثیر قابل توجهی دارد، در حالی که طراحی اتصال زبان-بینایی از اهمیت نسبتاً ناچیزی برخوردار است.» این نشان می‌دهد که مقیاس‌گذاری و بهبود مستمر مؤلفه‌های بصری این مدل‌های چندوجهی برای دستیابی به پیشرفت‌های بیشتر کلیدی خواهد بود.

این مدل در اندازه‌های ۳ میلیارد، ۷ میلیارد و ۳۰ میلیارد پارامتری ارائه می‌شود. محققان از این مدل‌ها برای انجام آزمایش‌ها استفاده کردند و عوامل کلیدی تأثیرگذار بر عملکرد را مشخص کردند. جالب اینجاست که وضوح تصویر و تعداد تگ‌های تصویر تأثیر بیشتری نسبت به اتصال‌دهنده‌های زبان بصری دارند و مجموعه داده‌های پیش‌آموزش متفاوت می‌توانند تأثیر قابل توجهی بر اثربخشی مدل داشته باشند.

تیم تحقیقاتی با استفاده از معماری «Mixture of Experts» و روش «گیت‌زنی ۲تایی»، MM1 را با دقت ساخته‌اند. این رویکرد نه تنها در معیارهای پیش‌آموزش نتایج عالی به دست آورد، بلکه به عملکرد قوی در معیارهای چندرسانه‌ای موجود نیز ترجمه شد. حتی پس از تنظیم دقیق برای وظایف خاص، مدل‌های MM1 همچنان عملکرد رقابتی را حفظ کردند.

Mixture of Experts (MoE) یک مدل یادگیری ماشینی است که بر اساس ایده ترکیب چندین مدل کارشناس (expert) مختلف برای حل یک مسئله خاص طراحی شده است. در این روش، هر کارشناس مسئول حل بخشی از مسئله است و یک گیت‌زن (gating network) وجود دارد که تعیین می‌کند کدام کارشناس باید برای هر نمونه داده‌ای فعال شود.

روش گیت‌زنی ۲تایی (Binary Gating) یک روش در زمینه پردازش سیگنال‌های دیجیتال و شبکه‌های عصبی مصنوعی است که برای کنترل جریان اطلاعات در یک سیستم استفاده می‌شود. این روش از گیت‌هایی استفاده می‌کند که می‌توانند به دو حالت ۰ (بسته) یا ۱ (باز) باشند. این گیت‌ها به گونه‌ای طراحی شده‌اند که بتوانند جریان اطلاعات را بر اساس نیاز سیستم مدیریت کنند.

آزمایش‌ها نشان داد که مدل‌های MM1-3B-Chat و MM1-7B-Chat از اکثر رقبای هم‌اندازه خود در بازار عملکرد بهتری دارند. این مدل‌ها به طور خاص در کارهایی مانند VQAv2 (پاسخ به سوال بر اساس تصویر و متن)، TextVQA (پاسخ به سوال متنی درباره یک تصویر) و ScienceQA (پاسخ به سوال علمی) درخشش دارند. با این حال، عملکرد کلی MM1 هنوز از مدل‌های Gemini گوگل یا GPT-4V OpenAI (هنوز) فراتر نمی‌رود. در حالی که MM1 ممکن است هنوز رهبر مطلق نباشد، همچنان جهشی قابل توجه برای اپل در زمینه هوش مصنوعی است. این شرکت همچنین اخیراً DarwinAI را به دست آورده است، برای اطلاعات بیشتر در این مورد اینجا را بخوانید.

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

فناوری

اسپیس‌ایکس شبکه ماهواره‌ای شناسایی موشک‌ برای گنبد طلایی آمریکا می‌سازد

نوشته شده توسط نرگس چالوک
9 خرداد 1405
پیشنهاد سردبیر

فیفا از کارت هواداری Fan ID جام جهانی ۲۰۲۶ رونمایی کرد

نوشته شده توسط نرگس چالوک
9 خرداد 1405
عینک‌های هوش مصنوعی متا
فناوری

نسل جدید عینک‌های هوشمند متا در راه است

نوشته شده توسط مانی
9 خرداد 1405
پهپادهای DJI
فناوری

ادعای وجود تهدید امنیتی در پهپادهای DJI رد شد

نوشته شده توسط مانی
9 خرداد 1405
نمای نزدیک از صفحه‌نمایش گوشی هوشمند با لوگوی Google که شیشه آن از مرکز ترک خورده و شکستگی‌های شعاعی روی کل صفحه پخش شده‌اند
امنیت سایبری

حساب‌های غیرفعال جیمیل حذف می‌شود

نوشته شده توسط تارخ ترهنده
9 خرداد 1405
خبر بعدی

برتری نمایشگر گوشی‌های گلکسی A35 و A55 در بین میان رده ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

مستندهای جعلی هوش مصنوعی دردسرساز شدند

مستندهای جعلی هوش مصنوعی دردسرساز شدند

23 اردیبهشت 1405

کلیدهای بلااستفاده کیبورد؛ از Scroll Lock تا Pause چرا هنوز روی کیبورد هستند؟

8 خرداد 1405 - به‌روزشده در 9 خرداد 1405

داغ‌ترین‌های روز

قدرت پردازشی معماری Zen 6 کلید اجرای بومی بازی‌های کنسول PS3 روی PS6

قدرت پردازشی معماری Zen 6 کلید اجرای بومی بازی‌های کنسول PS3 روی PS6

5 خرداد 1405
بهترین گوشی بازار ایران

راهنمای خرید بهترین گوشی موبایل + اقتصادی تا پرچمدار

6 خرداد 1405 - به‌روزشده در 7 خرداد 1405
فناوری جدید BFId کاربران را بدون گوشی و اتصال به شبکه ردیابی می‌ کند

فناوری جدید BFId کاربران را بدون گوشی و اتصال به شبکه ردیابی می‌ کند

5 خرداد 1405
گوشی گیمینگ خنک‌شونده جدید ردمجیک نوبیا

گوشی گیمینگ Redmagic 11S Pro رونمایی شد

7 خرداد 1405 - به‌روزشده در 9 خرداد 1405
برنامه Google Earth با قابلیت‌ های متنوع و جذاب خود، امکانات وسیعی را برای مشاهده اماکن و نقشه‌ های قدیمی برای کاربران به ارمغان می‌آورد.

سفر به گذشته با Google Earth

17 فروردین 1403 - به‌روزشده در 27 مهر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

آیا احداث نیروگاه‌های خورشیدی سودآور است؟

آیا احداث نیروگاه‌های خورشیدی سودآور است؟

9 خرداد 1405

اسپیس‌ایکس شبکه ماهواره‌ای شناسایی موشک‌ برای گنبد طلایی آمریکا می‌سازد

9 خرداد 1405
مایکروسافت در رویداد Xbox Games Showcase روی چند پلتفرمی بودن بازی‌ها تاکید می‌کند

مایکروسافت در رویداد Xbox Games Showcase روی چند پلتفرمی بودن بازی‌ها تاکید می‌کند

9 خرداد 1405

فیفا از کارت هواداری Fan ID جام جهانی ۲۰۲۶ رونمایی کرد

9 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir