• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » جهش بزرگ اپل در هوش مصنوعی با مدل زبان بزرگ چند رسانه ای MM1

جهش بزرگ اپل در هوش مصنوعی با مدل زبان بزرگ چند رسانه ای MM1

صمد کردی نوشته شده توسط صمد کردی
یکشنبه 27 اسفند 1402 - 21:30
در اخبار هوش مصنوعی, فناوری
پژوهشگران اپل با مدل زبان بزرگ چندرسانه‌ای جدید خود به نام MM1 روش‌های جدیدی برای آموزش مدل‌های زبان بزرگ بر اساس متن و تصویر توسعه داده‌اند که به دستیابی به سیستم‌های هوش مصنوعی قدرتمندتر و انعطاف‌پذیرتر منجر می‌شود. 
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

پژوهشگران اپل با مدل زبان بزرگ چندرسانه‌ای جدید خود به نام MM1 روش‌های جدیدی برای آموزش مدل‌های زبان بزرگ بر اساس متن و تصویر توسعه داده‌اند که به دستیابی به سیستم‌های هوش مصنوعی قدرتمندتر و انعطاف‌پذیرتر منجر می‌شود. 

به گزارش تک‌ناک این پژوهش که در مقاله تحقیقی‌ با عنوان «MM1: روش‌ها، تحلیل و بینش‌هایی از پیش-آموزش مدل‌های زبان بزرگ چندوجهی» که این هفته به طور ناگهانی در سایت arxiv.org منتشر شد، نشان می‌دهد که چگونه ترکیب دقیق انواع مختلف داده‌های آموزشی و ساختارهای مدل می‌تواند به عملکردی در سطح فناوری‌های پیشرفته در طیف وسیعی از معیارهای هوش مصنوعی منجر شود.

پژوهشگران توضیح می‌دهند: «ما نشان می‌دهیم که برای پیش‌آموزش چندوجهی در مقیاس بزرگ، استفاده از ترکیبی دقیق از شرح تصویر، متن و تصویر درهم‌آمیخته و داده‌های صرفا متنی برای دستیابی به نتایج برتر در چند نمونه بر روی معیارهای مختلف بسیار مهم است.» با آموزش مدل‌ها روی مجموعه‌ی داده‌های متنوعی که اطلاعات بصری و زبانی را در بر می‌گیرد، مدل‌های MM1 توانستند در کارهایی مانند شرح تصویر، پاسخ به پرسش‌های تصویری و استنتاج زبان طبیعی عملکرد فوق‌العاده‌ای داشته باشند.

مقیاس‌گذاری مؤلفه‌های بصری کلیدی است پژوهشگران همچنین دریافتند که انتخاب کدگذار تصویر و رزولوشن تصاویر ورودی تأثیر چشمگیری بر عملکرد مدل دارد. آن‌ها گفتند: «ما نشان می‌دهیم که کدگذار تصویر به همراه رزولوشن تصویر و تعداد نشانه‌های تصویر تأثیر قابل توجهی دارد، در حالی که طراحی اتصال زبان-بینایی از اهمیت نسبتاً ناچیزی برخوردار است.» این نشان می‌دهد که مقیاس‌گذاری و بهبود مستمر مؤلفه‌های بصری این مدل‌های چندوجهی برای دستیابی به پیشرفت‌های بیشتر کلیدی خواهد بود.

این مدل در اندازه‌های ۳ میلیارد، ۷ میلیارد و ۳۰ میلیارد پارامتری ارائه می‌شود. محققان از این مدل‌ها برای انجام آزمایش‌ها استفاده کردند و عوامل کلیدی تأثیرگذار بر عملکرد را مشخص کردند. جالب اینجاست که وضوح تصویر و تعداد تگ‌های تصویر تأثیر بیشتری نسبت به اتصال‌دهنده‌های زبان بصری دارند و مجموعه داده‌های پیش‌آموزش متفاوت می‌توانند تأثیر قابل توجهی بر اثربخشی مدل داشته باشند.

تیم تحقیقاتی با استفاده از معماری «Mixture of Experts» و روش «گیت‌زنی ۲تایی»، MM1 را با دقت ساخته‌اند. این رویکرد نه تنها در معیارهای پیش‌آموزش نتایج عالی به دست آورد، بلکه به عملکرد قوی در معیارهای چندرسانه‌ای موجود نیز ترجمه شد. حتی پس از تنظیم دقیق برای وظایف خاص، مدل‌های MM1 همچنان عملکرد رقابتی را حفظ کردند.

Mixture of Experts (MoE) یک مدل یادگیری ماشینی است که بر اساس ایده ترکیب چندین مدل کارشناس (expert) مختلف برای حل یک مسئله خاص طراحی شده است. در این روش، هر کارشناس مسئول حل بخشی از مسئله است و یک گیت‌زن (gating network) وجود دارد که تعیین می‌کند کدام کارشناس باید برای هر نمونه داده‌ای فعال شود.

روش گیت‌زنی ۲تایی (Binary Gating) یک روش در زمینه پردازش سیگنال‌های دیجیتال و شبکه‌های عصبی مصنوعی است که برای کنترل جریان اطلاعات در یک سیستم استفاده می‌شود. این روش از گیت‌هایی استفاده می‌کند که می‌توانند به دو حالت ۰ (بسته) یا ۱ (باز) باشند. این گیت‌ها به گونه‌ای طراحی شده‌اند که بتوانند جریان اطلاعات را بر اساس نیاز سیستم مدیریت کنند.

آزمایش‌ها نشان داد که مدل‌های MM1-3B-Chat و MM1-7B-Chat از اکثر رقبای هم‌اندازه خود در بازار عملکرد بهتری دارند. این مدل‌ها به طور خاص در کارهایی مانند VQAv2 (پاسخ به سوال بر اساس تصویر و متن)، TextVQA (پاسخ به سوال متنی درباره یک تصویر) و ScienceQA (پاسخ به سوال علمی) درخشش دارند. با این حال، عملکرد کلی MM1 هنوز از مدل‌های Gemini گوگل یا GPT-4V OpenAI (هنوز) فراتر نمی‌رود. در حالی که MM1 ممکن است هنوز رهبر مطلق نباشد، همچنان جهشی قابل توجه برای اپل در زمینه هوش مصنوعی است. این شرکت همچنین اخیراً DarwinAI را به دست آورده است، برای اطلاعات بیشتر در این مورد اینجا را بخوانید.

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

رباتیک

لگد ربات انسان‌نمای چینی در نمایش عمومی به یک کودک

نوشته شده توسط نرگس چالوک
16 خرداد 1405
عرضه جهانی ابزار Meta Business Agent آغاز شد
اخبار هوش مصنوعی

عرضه جهانی ابزار Meta Business Agent آغاز شد

نوشته شده توسط سید محمد برازنده
16 خرداد 1405
چین بزرگ‌ترین ابرمنطقه شهری جهان را با ۸۶ میلیون نفر جمعیت می‌ سازد
پیشنهاد سردبیر

چین بزرگ‌ترین ابرمنطقه شهری جهان را با ۸۶ میلیون نفر جمعیت می‌ سازد

نوشته شده توسط نرگس چالوک
16 خرداد 1405
نظارت دولت آمریکا بر هوش مصنوعی
اخبار هوش مصنوعی

آیا نظارت دولت آمریکا بر OpenAI مسیر توسعه هوش مصنوعی را تغییر می‌دهد؟

نوشته شده توسط مانی
16 خرداد 1405
مدل امنیت سایبری Mythos
اخبار هوش مصنوعی

آمریکا هوش مصنوعی را وارد جنگ سایبری کرد

نوشته شده توسط مانی
16 خرداد 1405
خبر بعدی

برتری نمایشگر گوشی‌های گلکسی A35 و A55 در بین میان رده ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

آسیب‌پذیری ردیابی در تلگرام؛ امکان شناسایی کاربران بدون دسترسی به پیام‌ها

افشای حفره‌ امنیتی جدید در زیرساخت تلگرام

11 خرداد 1405

ایجاد بینایی مصنوعی برای نابینایان با ایمپلنت مغزی جدید

19 اردیبهشت 1405

داغ‌ترین‌های روز

جنگنده یوروفایتر Tranche 4 اسپانیا در باند فرودگاه

اسپانیا پیشرفته‌ترین جنگنده یوروفایتر خود را رونمایی کرد

13 خرداد 1405
طلا یا ملک؛ کدام گزینه برای سرمایه‌گذاری سودآورتر است؟

طلا یا ملک؛ کدام گزینه برای سرمایه‌گذاری سودآورتر است؟

14 خرداد 1405 - به‌روزشده در 16 خرداد 1405
تارا بهتر است یا دنا پلاس؟ مقایسه کامل مشخصات، مزایا، معایب و ارزش خرید

تارا بهتر است یا دنا پلاس؟ + مزایا، معایب و ارزش خرید

14 خرداد 1405 - به‌روزشده در 16 خرداد 1405
نصب موتور Pratt & Whitney F135 روی نخستین جنگنده رادارگریز F-35A آلمان در خط مونتاژ نهایی شرکت Lockheed Martin

نخستین جنگنده F-35A آلمان وارد مرحله نهایی تولید شد

16 خرداد 1405
بررسی Nothing Phone (4a) Pro

بررسی گوشی Nothing Phone (4a) Pro ؛ قوی‌ترین میان‌رده ناتینگ با طراحی جدید

14 خرداد 1405 - به‌روزشده در 16 خرداد 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

روسیه ساخت هواپیمای مسافربری مافوق صوت جدید را آغاز کرد

روسیه ساخت هواپیمای مسافربری مافوق صوت جدید را آغاز کرد

16 خرداد 1405
آیفون 17 پرو مکس سفارشی کاویار با طراحی الهام‌گرفته از ساعت‌های نجومی لوکس در جعبه اختصاصی آبی‌رنگ.

آیفون ۱۷ پرومکس کاویار با محفظه اختصاصی ساعت سوئیسی رونمایی شد

16 خرداد 1405
نخستین واکسن طراحی‌شده با هوش مصنوعی در آزمایش انسانی موفق ظاهر شد

موفقیت نخستین واکسن طراحی‌شده با هوش مصنوعی

16 خرداد 1405
گریپ شارژ بلکین زمان بازی کنسول نینتندو سوییچ ۲ را افزایش می‌ دهد

گریپ شارژ بلکین زمان بازی کنسول نینتندو سوییچ ۲ را افزایش می‌ دهد

16 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir