• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » مدل زبان بزرگ LLaVA-o1 چینی برای رقابت با OpenAI معرفی شد

مدل زبان بزرگ LLaVA-o1 چینی برای رقابت با OpenAI معرفی شد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
یکشنبه 4 آذر 1403 - 09:19
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
مدل زبان بزرگ LLaVA-o1 چینی برای رقابت با OpenAI معرفی شد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. مشکلات مدل‌های تصویری متن‌باز
  • 2. رویکرد مدل زبان بزرگ LLaVA-o1 برای استدلال مرحله‌ای
  • 3. عملکرد و نتایج مدل زبان بزرگ LLaVA-o1
  • 4. گام بعدی در استدلال چندرسانه‌ای

محققان چینی مدل زبانی بزرگ LLaVA-o1 را معرفی کرده‌اند که به عنوان رقیب مدل o1 شرکت OpenAI مطرح شده است.

به گزارش تک‌ناک، این مدل جدید با هدف بهبود توانایی‌های استدلال و حل مسئله در مدل‌های زبانی بزرگ طراحی شده است و تلاش می‌کند تا در آزمون‌های پیچیده مانند المپیاد ریاضی بین‌المللی عملکرد بهتری نسبت به مدل‌های قبل از خود نشان دهد.

ونچربیت می‌نویسد که مدل o1 شرکت OpenAI پیش‌تر نشان داده بود که افزایش قدرت محاسباتی در زمان استنتاج می‌تواند توانایی‌های استدلالی مدل‌های زبانی را به طور قابل توجهی بهبود بخشد. اکنون پژوهشگران چینی این ایده را در مدل زبان بزرگ LLaVA-o1 پیاده‌سازی کرده‌اند تا استدلال منطقی و ساختاریافته در مدل‌های متن‌باز را ارتقا دهند.

01
از 04
مشکلات مدل‌های تصویری متن‌باز

مدل‌های تصویری متن‌باز اولیه، اغلب با استفاده از روش پیش‌بینی مستقیم، پاسخ‌هایی تولید می‌کردند که فاقد استدلال درباره پرسش یا مراحل مورد نیاز برای حل آن بودند.

این ضعف باعث می‌شد که این مدل‌ها در وظایفی که نیاز به استدلال منطقی دارند، عملکرد ضعیفی داشته باشند.

تکنیک‌های پیشرفته‌تر مانند Chain-of-Thought (CoT) که مدل‌ها را به تولید مراحل میانی استدلال تشویق می‌کنند، تنها بهبودهای جزئی ایجاد کردند.

پژوهشگران چینی مشاهده کردند که یکی از مشکلات اصلی این مدل‌ها، نبود فرایند استدلال سیستماتیک و ساختاریافته است.

مدل‌های موجود نمی‌توانند زنجیره‌های منطقی استدلالی ایجاد کنند و اغلب در مسیری گیر می‌کنند، که مشخص نیست در کدام مرحله قرار دارند و چه مشکلی را باید حل کنند.

چینی ها مدل زبان بزرگ LLaVA-o1 را برای رقابت با OpenAI معرفی کردند

02
از 04
رویکرد مدل زبان بزرگ LLaVA-o1 برای استدلال مرحله‌ای

پژوهشگران برای حل این مشکلات، مدل LLaVA-o1 را به گونه‌ای طراحی کردند که فرایند استدلال را به چهار مرحله مجزا تقسیم کند:

  1. خلاصه‌سازی: مدل ابتدا خلاصه‌ای کلی از پرسش ارائه می‌دهد و مشکل اصلی را مشخص می‌کند.
  2. توصیف تصویر: اگر تصویری وجود داشته باشد، مدل بخش‌های مرتبط با پرسش را توصیف می‌کند.
  3. استدلال: با تکیه بر خلاصه‌سازی، مدل استدلالی منطقی و ساختاریافته انجام می‌دهد تا به پاسخ اولیه دست یابد.
  4. نتیجه‌گیری: در نهایت، مدل خلاصه‌ای نهایی از پاسخ را ارائه می‌کند.

در این رویکرد، تنها مرحله «نتیجه‌گیری» برای کاربر قابل مشاهده است و سه مرحله دیگر فرایند داخلی مدل را تشکیل می‌دهند. این ساختار باعث می‌شود که مدل بتواند فرایند استدلال خود را به صورت مستقل مدیریت کند و عملکرد آن در وظایف پیچیده بهبود یابد.

علاوه بر این، مدل زبان بزرگ LLaVA-o1 از تکنیک جدیدی به نام جست‌وجوی پرتوی مرحله‌ای استفاده می‌کند، که در هر مرحله چندین پاسخ کاندید تولید و بهترین گزینه را برای ادامه انتخاب می‌کند.

این رویکرد برخلاف روش‌های کلاسیک، امکان بررسی دقیق‌تر و کارآمدتر را در هر مرحله فراهم می‌کند.

معرفی مدل زبان بزرگ LLaVA-o1 چینی برای رقابت با OpenAI

03
از 04
عملکرد و نتایج مدل زبان بزرگ LLaVA-o1

پژوهشگران برای آموزش LLaVA-o1، یک مجموعه داده جدید شامل حدود ۱۰۰ هزار جفت سؤال-پاسخ تصویری ایجاد کردند، که از چندین مجموعه داده مشهور VQA گردآوری شده است.

این مجموعه داده شامل وظایفی همچون پرسش و پاسخ چندمرحله‌ای، تفسیر نمودارها و استدلال‌های هندسی بود.

مدل LLaVA-o1 با وجود آموزش روی تنها ۱۰۰ هزار نمونه، عملکرد قابل توجهی در چندین معیار استدلال چندرسانه‌ای نشان داد و امتیاز معیارها را به طور متوسط ۶.۹ درصد افزایش داد.

علاوه بر این، استفاده از تکنیک جست‌وجوی پرتوی مرحله‌ای نیز باعث بهبود عملکرد مدل شد.

پژوهشگران با توجه به محدودیت منابع محاسباتی، این روش را تنها با اندازه پرتو ۲ آزمایش کردند و معتقد هستند که با افزایش اندازه پرتو، بهبودهای بیشتری حاصل خواهد شد.

نکته قابل توجه این است که مدل زبان بزرگ LLaVA-o1 نه تنها از سایر مدل‌های متن‌باز هم‌اندازه یا بزرگ‌تر پیشی گرفت، بلکه توانست عملکردی بهتر از برخی مدل‌های بسته مانند GPT-4-o-mini و Gemini 1.5 Pro ارائه دهد.

پژوهشگران چینی مدل زبان بزرگ LLaVA-o1 را برای رقابت با OpenAI معرفی کردند

04
از 04
گام بعدی در استدلال چندرسانه‌ای

پژوهشگران در گزارش خود نوشتند: «مدل زبان بزرگ LLaVA-o1 استاندارد جدیدی برای استدلال چندرسانه‌ای در مدل‌های تصویری ارائه می‌دهد و عملکرد و مقیاس‌پذیری قوی به ویژه در زمان استنتاج ارائه می‌کند. این پژوهش، مسیر را برای تحقیقات آینده در زمینه استدلال ساختاریافته در مدل‌های تصویری، از جمله استفاده از تأییدکنندگان خارجی و بهره‌گیری از یادگیری تقویتی برای بهبود توانایی‌های استدلالی پیچیده، باز می‌نماید.»

اگرچه مدل LLaVA-o1 هنوز به صورت عمومی منتشر نشده است، اما پژوهشگران اعلام کرده‌اند که مجموعه داده مورد استفاده در آموزش این مدل، با نام LLaVA-o1-100k، به زودی در دسترس قرار خواهد گرفت.

برچسب‌ها: p6
امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

دستگاه پایش قند خون Isaac در کنار پایه شارژ و اپلیکیشن موبایل مربوطه که نمودار سطح گلوکز را نشان می‌دهد.
فناوری

پایش قند خون با بازدم؛ کلید ورود فناوری «گلوکومتر» به اپل‌واچ

نوشته شده توسط اسما کلهر
18 دی 1404
یک توالت فرنگی مجهز به سنسور هوشمند پایش سلامت نصب شده بر روی لبه کاسه.
فناوری

مرز میان نبوغ و دیوانگی؛ نگاهی به عجیب‌ترین و جنجالی‌ترین گجت‌های نمایشگاه CES 2026

نوشته شده توسط اسما کلهر
18 دی 1404
نمای نزدیک از داخل یک حلقه هوشمند سامسونگ (Galaxy Ring) که دچار تورم باتری و تغییر شکل بدنه شده است.
فناوری

پایان تحقیقات سامسونگ در پرونده جنجالی گلکسی رینگ؛ نقص فنی در بدنه، نه انفجار باتری!

نوشته شده توسط اسما کلهر
18 دی 1404
نمای رابط کاربری Gmail با قابلیت AI Overview که جستجوی زبان طبیعی در صندوق ورودی را نمایش می‌دهد؛ پرسش متنی درباره دریافت قیمت بازسازی حمام در نوار جستجو وارد شده و خلاصه هوشمند شامل تعداد پیشنهادها، نام شرکت‌ها، شماره پیش‌فاکتور، مبالغ دلاری و تاریخ ارسال ایمیل‌ها به‌صورت ساختاریافته نمایش داده شده است.
اخبار هوش مصنوعی

جیمیل با تمرکز گسترده بر هوش مصنوعی جمنای بازطراحی می‌شود

نوشته شده توسط تارخ ترهنده
18 دی 1404
آیکون پازل رنگی گوگل پلی روی صفحه نمایش یک گوشی هوشمند.
فناوری

نقشه راه گوگل برای سال ۲۰۲۶؛ انتشار جزئیات به‌روزرسانی بزرگ سیستم گوگل در ژانویه

نوشته شده توسط امیرحسین یونس
18 دی 1404
خبر بعدی
بازی Silent Hill 2 Remake

پیام مخفی و ترسناک بازی Silent Hill 2 Remake کشف شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

نرخ بهره ژاپن

به این دلیل شاید قیمت بیت‌کوین به زیر ۷۰ هزار دلار سقوط کند

24 آذر 1404
فردی که یک لپ‌تاپ ۱۶ اینچی بسیار نازک را تنها با سه انگشت خود از لبه نگه داشته است.

ایسوس با Zenbook A16 مرزهای طراحی لپ‌تاپ‌های فوق‌سبک را جابه‌جا کرد

16 دی 1404 - به‌روزشده در 18 دی 1404

داغ‌ترین‌های روز

نمای نزدیک از پنل پشتی یک گوشی هوشمند خاکستری رنگ (احتمالاً سری شیائومی ۱۲) که ماژول دوربین سه‌گانه و عبارت 50MP روی آن دیده می‌شود.

این ۶ دستگاه شیائومی از دریافت به‌روزرسانی‌ها سال ۲۰۲۶ محروم خواهند شد

13 دی 1404 - به‌روزشده در 14 دی 1404
سریع ترین گوشی های بازار

سریع‌ترین گوشی‌های بازار ایران + مقایسه عملکرد CPU و GPU

14 دی 1404 - به‌روزشده در 15 دی 1404
خودنمایی HP با لپ‌تاپ‌های گیمینگ جدید در CES 2026

خودنمایی HP با لپ‌تاپ‌های گیمینگ جدید در CES 2026 + تصاویر

17 دی 1404 - به‌روزشده در 18 دی 1404

سرقت ۱.۲ میلیون دلاری با ابزار فعالسازی ویندوز

17 دی 1404
مایکرون نخستین SSD نسل پنجم دنیا را معرفی کرد

مایکرون نخستین SSD نسل پنجم دنیا را معرفی کرد

17 دی 1404 - به‌روزشده در 18 دی 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

عینک هوشمند IXI با فریم مشکی و پل نیمه‌شفاف که اجزای داخلی و مدارهای الکترونیکی آن قابل مشاهده است.

این عینک هوشمند نمره چشمتان را تغییر می‌دهد

18 دی 1404
نمای پانوراما از خط افق شهر شانگهای چین در هنگام غروب با ساختمان‌های بلند و بزرگراه‌های پرنور زیر لایه‌ای از مه.

هر جعبه‌ ۱۰۰ تایی حافظه DDR5 به قیمت ملک در شانگهای رسید

18 دی 1404
دستگاه پایش قند خون Isaac در کنار پایه شارژ و اپلیکیشن موبایل مربوطه که نمودار سطح گلوکز را نشان می‌دهد.

پایش قند خون با بازدم؛ کلید ورود فناوری «گلوکومتر» به اپل‌واچ

18 دی 1404
مقایسه رابط کاربری و ویجت‌های یک آی‌پد در کنار یک آیفون که نشان‌دهنده شباهت‌های نرم‌افزاری احتمالی برای آیفون تاشو است.

آیفون فولد یا آیپد جیبی؟؛ افشاگری‌های جدید از استراتژی متفاوت اپل در بازار گوشی‌های تاشو

18 دی 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir