• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

جهش بزرگ اپل در هوش مصنوعی با مدل زبان بزرگ چند رسانه ای MM1

صمد کردی نوشته شده توسط صمد کردی
یکشنبه 27 اسفند 1402 - 21:30
در اخبار هوش مصنوعی, فناوری
پژوهشگران اپل با مدل زبان بزرگ چندرسانه‌ای جدید خود به نام MM1 روش‌های جدیدی برای آموزش مدل‌های زبان بزرگ بر اساس متن و تصویر توسعه داده‌اند که به دستیابی به سیستم‌های هوش مصنوعی قدرتمندتر و انعطاف‌پذیرتر منجر می‌شود. 
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

پژوهشگران اپل با مدل زبان بزرگ چندرسانه‌ای جدید خود به نام MM1 روش‌های جدیدی برای آموزش مدل‌های زبان بزرگ بر اساس متن و تصویر توسعه داده‌اند که به دستیابی به سیستم‌های هوش مصنوعی قدرتمندتر و انعطاف‌پذیرتر منجر می‌شود. 

به گزارش تک‌ناک این پژوهش که در مقاله تحقیقی‌ با عنوان «MM1: روش‌ها، تحلیل و بینش‌هایی از پیش-آموزش مدل‌های زبان بزرگ چندوجهی» که این هفته به طور ناگهانی در سایت arxiv.org منتشر شد، نشان می‌دهد که چگونه ترکیب دقیق انواع مختلف داده‌های آموزشی و ساختارهای مدل می‌تواند به عملکردی در سطح فناوری‌های پیشرفته در طیف وسیعی از معیارهای هوش مصنوعی منجر شود.

پژوهشگران توضیح می‌دهند: «ما نشان می‌دهیم که برای پیش‌آموزش چندوجهی در مقیاس بزرگ، استفاده از ترکیبی دقیق از شرح تصویر، متن و تصویر درهم‌آمیخته و داده‌های صرفا متنی برای دستیابی به نتایج برتر در چند نمونه بر روی معیارهای مختلف بسیار مهم است.» با آموزش مدل‌ها روی مجموعه‌ی داده‌های متنوعی که اطلاعات بصری و زبانی را در بر می‌گیرد، مدل‌های MM1 توانستند در کارهایی مانند شرح تصویر، پاسخ به پرسش‌های تصویری و استنتاج زبان طبیعی عملکرد فوق‌العاده‌ای داشته باشند.

مقیاس‌گذاری مؤلفه‌های بصری کلیدی است پژوهشگران همچنین دریافتند که انتخاب کدگذار تصویر و رزولوشن تصاویر ورودی تأثیر چشمگیری بر عملکرد مدل دارد. آن‌ها گفتند: «ما نشان می‌دهیم که کدگذار تصویر به همراه رزولوشن تصویر و تعداد نشانه‌های تصویر تأثیر قابل توجهی دارد، در حالی که طراحی اتصال زبان-بینایی از اهمیت نسبتاً ناچیزی برخوردار است.» این نشان می‌دهد که مقیاس‌گذاری و بهبود مستمر مؤلفه‌های بصری این مدل‌های چندوجهی برای دستیابی به پیشرفت‌های بیشتر کلیدی خواهد بود.

این مدل در اندازه‌های ۳ میلیارد، ۷ میلیارد و ۳۰ میلیارد پارامتری ارائه می‌شود. محققان از این مدل‌ها برای انجام آزمایش‌ها استفاده کردند و عوامل کلیدی تأثیرگذار بر عملکرد را مشخص کردند. جالب اینجاست که وضوح تصویر و تعداد تگ‌های تصویر تأثیر بیشتری نسبت به اتصال‌دهنده‌های زبان بصری دارند و مجموعه داده‌های پیش‌آموزش متفاوت می‌توانند تأثیر قابل توجهی بر اثربخشی مدل داشته باشند.

تیم تحقیقاتی با استفاده از معماری «Mixture of Experts» و روش «گیت‌زنی ۲تایی»، MM1 را با دقت ساخته‌اند. این رویکرد نه تنها در معیارهای پیش‌آموزش نتایج عالی به دست آورد، بلکه به عملکرد قوی در معیارهای چندرسانه‌ای موجود نیز ترجمه شد. حتی پس از تنظیم دقیق برای وظایف خاص، مدل‌های MM1 همچنان عملکرد رقابتی را حفظ کردند.

Mixture of Experts (MoE) یک مدل یادگیری ماشینی است که بر اساس ایده ترکیب چندین مدل کارشناس (expert) مختلف برای حل یک مسئله خاص طراحی شده است. در این روش، هر کارشناس مسئول حل بخشی از مسئله است و یک گیت‌زن (gating network) وجود دارد که تعیین می‌کند کدام کارشناس باید برای هر نمونه داده‌ای فعال شود.

روش گیت‌زنی ۲تایی (Binary Gating) یک روش در زمینه پردازش سیگنال‌های دیجیتال و شبکه‌های عصبی مصنوعی است که برای کنترل جریان اطلاعات در یک سیستم استفاده می‌شود. این روش از گیت‌هایی استفاده می‌کند که می‌توانند به دو حالت ۰ (بسته) یا ۱ (باز) باشند. این گیت‌ها به گونه‌ای طراحی شده‌اند که بتوانند جریان اطلاعات را بر اساس نیاز سیستم مدیریت کنند.

آزمایش‌ها نشان داد که مدل‌های MM1-3B-Chat و MM1-7B-Chat از اکثر رقبای هم‌اندازه خود در بازار عملکرد بهتری دارند. این مدل‌ها به طور خاص در کارهایی مانند VQAv2 (پاسخ به سوال بر اساس تصویر و متن)، TextVQA (پاسخ به سوال متنی درباره یک تصویر) و ScienceQA (پاسخ به سوال علمی) درخشش دارند. با این حال، عملکرد کلی MM1 هنوز از مدل‌های Gemini گوگل یا GPT-4V OpenAI (هنوز) فراتر نمی‌رود. در حالی که MM1 ممکن است هنوز رهبر مطلق نباشد، همچنان جهشی قابل توجه برای اپل در زمینه هوش مصنوعی است. این شرکت همچنین اخیراً DarwinAI را به دست آورده است، برای اطلاعات بیشتر در این مورد اینجا را بخوانید.

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

کوپایلت و مدیریت فایل‌ها
اخبار هوش مصنوعی

چگونه از کوپایلت ویندوز برای جست‌وجو و مدیریت فایل‌ها استفاده کنیم؟

نوشته شده توسط امیرحسین یونس
13 تیر 1404
ابزاری شبیه به Operator در راه است؟ شواهد جدید از قابلیت‌های پیشرفته در آستانه معرفی GPT-5
اخبار هوش مصنوعی

ChatGPT در آستانه رونمایی ابزار جدید مشابه Operator برای مرورگرهای مجازی

نوشته شده توسط اسما کلهر
13 تیر 1404
Character.AI با مدل جدید TalkingMachines تعامل تصویری زنده با شخصیت‌های هوش مصنوعی را ممکن می‌کند
اخبار هوش مصنوعی

تعامل تصویری زنده با شخصیت‌های هوش مصنوعی با مدل جدید TalkingMachines

نوشته شده توسط اسما کلهر
13 تیر 1404
E Ink تاچ‌پد لپ‌تاپ‌ها را به کتاب‌خوان الکترونیکی برای برنامه‌های هوش مصنوعی تبدیل می‌کند
فناوری

تاچ‌پد E Ink با نمایشگر رنگی معرفی شد؛ رابطی تازه برای مکالمه با چت‌بات‌ها

نوشته شده توسط اسما کلهر
13 تیر 1404
10 سیستم برتر دفاع پدافندی دنیا
پیشنهاد سردبیر

۱۰ سیستم برتر دفاع پدافندی دنیا

نوشته شده توسط آرمین ثنایی سرشت
13 تیر 1404
خبر بعدی
برتری نمایشگر گوشی‌های گلکسی A35 و A55 در بین میان رده ها

برتری نمایشگر گوشی‌های گلکسی A35 و A55 در بین میان رده ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

khordad1404 khordad1404 khordad1404

پیشنهادی

HKC نخستین مانیتور گیمینگ با نرخ نوسازی ذاتی ۸۰۰ هرتز جهان را رونمایی کرد

اولین مانیتور گیمینگ 800 هرتزی جهان رونمایی شد

27 خرداد 1404
رونمایی قریب‌الوقوع از کنسول دستی جدید پلی‌استیشن با هوش مصنوعی و رم ۱۶ گیگابایتی

رونمایی قریب‌الوقوع از کنسول دستی جدید پلی‌استیشن با هوش مصنوعی و رم 16 گیگابایتی

22 خرداد 1404

داغ‌ترین‌های روز

اضافه شدن قابلیت پرتاب پهپاد به هواپیمای سوخت‌رسان KC-135

اضافه شدن قابلیت پرتاب پهپاد به هواپیمای سوخت‌رسان KC-135

11 تیر 1404
تأیید ETF ریپل توسط SEC؛ آیا قیمت به ۲.۶۹ دلار می‌رسد؟

تأیید ETF ریپل توسط SEC؛ آیا قیمت به ۲.۶۹ دلار می‌رسد؟

11 تیر 1404
10 سیستم برتر دفاع پدافندی دنیا

۱۰ سیستم برتر دفاع پدافندی دنیا

13 تیر 1404
رکود تورمی در بازار موبایل؛ خریدار نیست، گوشی هم نیست!

رکود تورمی در بازار موبایل؛ خریدار نیست، گوشی هم نیست!

11 تیر 1404
گوشی شیائومی میکس فلیپ ۲

شیائومی میکس فلیپ 2 با پردازنده اسنپدراگون 8 الیت و لولای بادوام معرفی شد

5 تیر 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

کوپایلت و مدیریت فایل‌ها

چگونه از کوپایلت ویندوز برای جست‌وجو و مدیریت فایل‌ها استفاده کنیم؟

13 تیر 1404
معرفی مفهوم جدید Windows Classic Remastered – تلفیقی نوستالژیک از نسخه‌های محبوب ویندوز

Windows Classic Remastered؛ ترکیبی از نوستالژی و نوآوری در طراحی سیستم‌عامل

13 تیر 1404
رکوردشکنی AMD با پردازنده جدید Ryzen Threadripper 9980X؛ سریع‌ترین پردازنده دسکتاپ در عملکرد چندرشته‌ای

پردازنده Ryzen Threadripper 9980X رکورد جدیدی در آزمون چندرشته‌ای ثبت کرد

13 تیر 1404
ویژگی‌های امنیتی HyperOS

با این ویژگی‌های امنیتی HyperOS از اطلاعات شخصی‌تان در فضای کاری محافظت کنید

13 تیر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir