• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

مدل زبان بزرگ LLaVA-o1 چینی برای رقابت با OpenAI معرفی شد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
یکشنبه 4 آذر 1403 - 09:19
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
مدل زبان بزرگ LLaVA-o1 چینی برای رقابت با OpenAI معرفی شد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

محققان چینی مدل زبانی بزرگ LLaVA-o1 را معرفی کرده‌اند که به عنوان رقیب مدل o1 شرکت OpenAI مطرح شده است.

به گزارش تک‌ناک، این مدل جدید با هدف بهبود توانایی‌های استدلال و حل مسئله در مدل‌های زبانی بزرگ طراحی شده است و تلاش می‌کند تا در آزمون‌های پیچیده مانند المپیاد ریاضی بین‌المللی عملکرد بهتری نسبت به مدل‌های قبل از خود نشان دهد.

ونچربیت می‌نویسد که مدل o1 شرکت OpenAI پیش‌تر نشان داده بود که افزایش قدرت محاسباتی در زمان استنتاج می‌تواند توانایی‌های استدلالی مدل‌های زبانی را به طور قابل توجهی بهبود بخشد. اکنون پژوهشگران چینی این ایده را در مدل زبان بزرگ LLaVA-o1 پیاده‌سازی کرده‌اند تا استدلال منطقی و ساختاریافته در مدل‌های متن‌باز را ارتقا دهند.

فهرست مطالب

  • مشکلات مدل‌های تصویری متن‌باز
  • رویکرد مدل زبان بزرگ LLaVA-o1 برای استدلال مرحله‌ای
  • عملکرد و نتایج مدل زبان بزرگ LLaVA-o1
  • گام بعدی در استدلال چندرسانه‌ای

مشکلات مدل‌های تصویری متن‌باز

مدل‌های تصویری متن‌باز اولیه، اغلب با استفاده از روش پیش‌بینی مستقیم، پاسخ‌هایی تولید می‌کردند که فاقد استدلال درباره پرسش یا مراحل مورد نیاز برای حل آن بودند.

این ضعف باعث می‌شد که این مدل‌ها در وظایفی که نیاز به استدلال منطقی دارند، عملکرد ضعیفی داشته باشند.

تکنیک‌های پیشرفته‌تر مانند Chain-of-Thought (CoT) که مدل‌ها را به تولید مراحل میانی استدلال تشویق می‌کنند، تنها بهبودهای جزئی ایجاد کردند.

پژوهشگران چینی مشاهده کردند که یکی از مشکلات اصلی این مدل‌ها، نبود فرایند استدلال سیستماتیک و ساختاریافته است.

مدل‌های موجود نمی‌توانند زنجیره‌های منطقی استدلالی ایجاد کنند و اغلب در مسیری گیر می‌کنند، که مشخص نیست در کدام مرحله قرار دارند و چه مشکلی را باید حل کنند.

چینی ها مدل زبان بزرگ LLaVA-o1 را برای رقابت با OpenAI معرفی کردند

رویکرد مدل زبان بزرگ LLaVA-o1 برای استدلال مرحله‌ای

پژوهشگران برای حل این مشکلات، مدل LLaVA-o1 را به گونه‌ای طراحی کردند که فرایند استدلال را به چهار مرحله مجزا تقسیم کند:

  1. خلاصه‌سازی: مدل ابتدا خلاصه‌ای کلی از پرسش ارائه می‌دهد و مشکل اصلی را مشخص می‌کند.
  2. توصیف تصویر: اگر تصویری وجود داشته باشد، مدل بخش‌های مرتبط با پرسش را توصیف می‌کند.
  3. استدلال: با تکیه بر خلاصه‌سازی، مدل استدلالی منطقی و ساختاریافته انجام می‌دهد تا به پاسخ اولیه دست یابد.
  4. نتیجه‌گیری: در نهایت، مدل خلاصه‌ای نهایی از پاسخ را ارائه می‌کند.

در این رویکرد، تنها مرحله «نتیجه‌گیری» برای کاربر قابل مشاهده است و سه مرحله دیگر فرایند داخلی مدل را تشکیل می‌دهند. این ساختار باعث می‌شود که مدل بتواند فرایند استدلال خود را به صورت مستقل مدیریت کند و عملکرد آن در وظایف پیچیده بهبود یابد.

علاوه بر این، مدل زبان بزرگ LLaVA-o1 از تکنیک جدیدی به نام جست‌وجوی پرتوی مرحله‌ای استفاده می‌کند، که در هر مرحله چندین پاسخ کاندید تولید و بهترین گزینه را برای ادامه انتخاب می‌کند.

این رویکرد برخلاف روش‌های کلاسیک، امکان بررسی دقیق‌تر و کارآمدتر را در هر مرحله فراهم می‌کند.

معرفی مدل زبان بزرگ LLaVA-o1 چینی برای رقابت با OpenAI

عملکرد و نتایج مدل زبان بزرگ LLaVA-o1

پژوهشگران برای آموزش LLaVA-o1، یک مجموعه داده جدید شامل حدود ۱۰۰ هزار جفت سؤال-پاسخ تصویری ایجاد کردند، که از چندین مجموعه داده مشهور VQA گردآوری شده است.

این مجموعه داده شامل وظایفی همچون پرسش و پاسخ چندمرحله‌ای، تفسیر نمودارها و استدلال‌های هندسی بود.

مدل LLaVA-o1 با وجود آموزش روی تنها ۱۰۰ هزار نمونه، عملکرد قابل توجهی در چندین معیار استدلال چندرسانه‌ای نشان داد و امتیاز معیارها را به طور متوسط ۶.۹ درصد افزایش داد.

علاوه بر این، استفاده از تکنیک جست‌وجوی پرتوی مرحله‌ای نیز باعث بهبود عملکرد مدل شد.

پژوهشگران با توجه به محدودیت منابع محاسباتی، این روش را تنها با اندازه پرتو ۲ آزمایش کردند و معتقد هستند که با افزایش اندازه پرتو، بهبودهای بیشتری حاصل خواهد شد.

نکته قابل توجه این است که مدل زبان بزرگ LLaVA-o1 نه تنها از سایر مدل‌های متن‌باز هم‌اندازه یا بزرگ‌تر پیشی گرفت، بلکه توانست عملکردی بهتر از برخی مدل‌های بسته مانند GPT-4-o-mini و Gemini 1.5 Pro ارائه دهد.

پژوهشگران چینی مدل زبان بزرگ LLaVA-o1 را برای رقابت با OpenAI معرفی کردند

گام بعدی در استدلال چندرسانه‌ای

پژوهشگران در گزارش خود نوشتند: «مدل زبان بزرگ LLaVA-o1 استاندارد جدیدی برای استدلال چندرسانه‌ای در مدل‌های تصویری ارائه می‌دهد و عملکرد و مقیاس‌پذیری قوی به ویژه در زمان استنتاج ارائه می‌کند. این پژوهش، مسیر را برای تحقیقات آینده در زمینه استدلال ساختاریافته در مدل‌های تصویری، از جمله استفاده از تأییدکنندگان خارجی و بهره‌گیری از یادگیری تقویتی برای بهبود توانایی‌های استدلالی پیچیده، باز می‌نماید.»

اگرچه مدل LLaVA-o1 هنوز به صورت عمومی منتشر نشده است، اما پژوهشگران اعلام کرده‌اند که مجموعه داده مورد استفاده در آموزش این مدل، با نام LLaVA-o1-100k، به زودی در دسترس قرار خواهد گرفت.

برچسب‌ها: p6
امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

شکایت ایلان ماسک علیه اپل و OpenAI
فناوری

ایلان ماسک از اپل و OpenAI به اتهام نقض قوانین انحصارطلبی شکایت کرد

نوشته شده توسط اسما کلهر
3 شهریور 1404
به‌روزرسانی‌ ۷ ساله سامسونگ
فناوری

لوازم خانگی سامسونگ هم به‌روزرسانی‌ ۷ ساله دریافت می کنند

نوشته شده توسط اسما کلهر
3 شهریور 1404
حذف ۷۷ اپلیکیشن مخرب گوگل پلی
امنیت سایبری

گوگل ۷۷ اپلیکیشن مخرب را با ۱۹ میلیون نصب به‌دلیل کلاهبرداری و سرقت اطلاعات حذف کرد

نوشته شده توسط امیرحسین یونس
3 شهریور 1404
اپلیکیشن استخراج رمزارز IOTA Miner
اپلیکیشن موبایل

با این اپلیکیشن با موبایلتان رمزارز استخراج کنید

نوشته شده توسط امیرحسین یونس
3 شهریور 1404
Mirage 2؛ موتور هوش مصنوعی دینامیکس لب برای ساخت دنیای سه‌بعدی
اخبار هوش مصنوعی

میراژ ۲؛ موتور هوش مصنوعی دینامیکس لب برای ساخت دنیای سه‌بعدی

نوشته شده توسط امیرحسین یونس
3 شهریور 1404
خبر بعدی
بازی Silent Hill 2 Remake

پیام مخفی و ترسناک بازی Silent Hill 2 Remake کشف شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

اختلال در فیسبوک و اینستاگرام؛ گزارش کاربران از مشکلات بارگذاری

اختلال در فیسبوک و اینستاگرام؛ گزارش کاربران از مشکلات بارگذاری

17 مرداد 1404
قابلیت‌های جدید هوش مصنوعی فتوشاپ

قابلیت‌های جدید هوش مصنوعی فتوشاپ، ویرایش عکس را متحول می‌کنند

7 مرداد 1404

داغ‌ترین‌های روز

گوشی پوکو M7 نسخه 4G با باتری ۷۰۰۰ میلی‌آمپری معرفی شد

گوشی پوکو M7 نسخه 4G با باتری 7000 میلی‌آمپری معرفی شد

26 مرداد 1404
بررسی Redmi 15C 4G

بررسی Redmi 15C 4G ؛ گوشی اقتصادی جذاب ردمی با قیمت رقابتی

2 شهریور 1404
ساخت نخستین توربین بادی سیمانی جهان در ایران

ساخت نخستین توربین بادی سیمانی جهان در ایران+ ویدئو

29 مرداد 1404
بهترین گوشی برای عکاسی

بهترین گوشی برای عکاسی در ایران (تابستان 1404)

2 شهریور 1404 - به‌روزشده در 3 شهریور 1404
این گوشی های سامسونگ در ماه آینده آپدیت بتای One UI 8 را دریافت می‌کنند

این گوشی‌های سامسونگ ماه آینده آپدیت بتای One UI 8 را دریافت می‌کنند

28 مرداد 1404 - به‌روزشده در 29 مرداد 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

گوشی هوشمند آینده ریلمی با سیستم خنک‌کننده داخلی، دمای دستگاه را تا ۲۴ درجه سانتی‌گراد کاهش می‌دهد

گوشی آینده ریلمی با سیستم خنک‌کننده داخلی قدرتمند عرضه می شود

3 شهریور 1404
شکایت ایلان ماسک علیه اپل و OpenAI

ایلان ماسک از اپل و OpenAI به اتهام نقض قوانین انحصارطلبی شکایت کرد

3 شهریور 1404
به‌روزرسانی‌ ۷ ساله سامسونگ

لوازم خانگی سامسونگ هم به‌روزرسانی‌ ۷ ساله دریافت می کنند

3 شهریور 1404
حذف ۷۷ اپلیکیشن مخرب گوگل پلی

گوگل ۷۷ اپلیکیشن مخرب را با ۱۹ میلیون نصب به‌دلیل کلاهبرداری و سرقت اطلاعات حذف کرد

3 شهریور 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir