• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » اپل مدل زبان بزرگ جدیدی برای تحلیل و درک ویدئوهای طولانی توسعه داد

اپل مدل زبان بزرگ جدیدی برای تحلیل و درک ویدئوهای طولانی توسعه داد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
شنبه 1 شهریور 1404 - 20:35 - به‌روزشده در دوشنبه 3 شهریور 1404 - 05:38
در اخبار هوش مصنوعی, فناوری
اپل مدل زبان بزرگ جدیدی برای تحلیل و درک ویدیوهای بلند توسعه داد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل زبان بزرگ SlowFast-LLaVA-1.5 اپل ویدئوهای بلند را با دو جریان پردازش هم‌زمان تحلیل می‌کند و دقت تصویر و ویدئو را به حداکثر می‌رساند.


به گزارش تک‌ناک، محققان اپل با معرفی مدل زبان بزرگ جدید SlowFast-LLaVA-1.5، گام بزرگی در مسیر تحلیل و درک ویدئوهای بلند برداشته‌اند. این مدل به‌طور خاص برای درک و تحلیل ویدیوهای بلند طراحی شده است. مدل SlowFast-LLaVA-1.5 از ترکیب دو جریان مختلف برای پردازش ویدئو استفاده می‌کند: جریان کُند که به تعداد کمتری از فریم‌ها نگاه و جزئیات بیشتری را استخراج می‌کند و جریان سریع که به فریم‌های بیشتری با جزئیات کمتری توجه دارد. این طراحی باعث می‌شود تا مدل بتواند به‌طور بهینه و کارآمدتر اطلاعات ویدیویی را پردازش کند.

9to5mac می‌نویسد که در مقایسه با مدل‌های بزرگ‌تر و پیچیده‌تر، مدل SlowFast-LLaVA-1.5 توانسته است نتایج بهتری در پردازش و تحلیل ویدئوهای بلند ارائه دهد. محققان اپل گزارش داده‌اند که این مدل حتی در نسخه‌های کوچک‌تر خود مانند مدل 1B (با یک میلیارد پارامتر)، توانسته است مدل‌های بزرگ‌تر را پشت‌سر بگذارد و در ارزیابی‌های استاندارد ویدئویی مانند LongVideoBench و MLVU رکوردهای جدیدی ثبت کند.

یکی از مزیت‌های اصلی مدل SlowFast-LLaVA-1.5 اپل این است که نه‌تنها می‌تواند ویدئوها را پردازش کند؛ بلکه در تحلیل تصاویر نیز عملکرد موفقی از خود نشان داده است. این مدل می‌تواند وظایف مختلفی ازجمله استدلال ریاضی و تشخیص متن در تصاویر (OCR) و تحلیل‌های متنی پیچیده را انجام دهد. این ویژگی مدل اپل را به مدلی چندمنظوره تبدیل کرده است که می‌تواند به‌طور مؤثر در تحلیل و پردازش انواع داده‌ها استفاده شود.

مدل SlowFast-LLaVA-1.5 اپل
مدل SlowFast-LLaVA-1.5 اپل
مدل SlowFast-LLaVA-1.5 اپل

یکی از ویژگی‌ها مهم مدل SlowFast-LLaVA-1.5 این است که اپل از داده‌های عمومی برای آموزش آن استفاده کرده است. این امر به اپل امکان داده است تا مدلی توسعه دهد که بتواند به‌طور عمومی در دسترس باشد و محققان و توسعه‌دهندگان دیگر به‌راحتی بتوانند از آن استفاده کنند. به‌علاوه، مدل یادشده به‌طور خاص برای انجام تحلیل‌های ویدئویی و تصویری بهینه شده است و توانسته است عملکرد عالی در هر دو زمینه ارائه دهد.

با وجود پیشرفت‌های چشمگیر، SlowFast-LLaVA-1.5 هنوز محدودیت‌هایی دارد که باید برطرف شود. یکی از محدودیت‌های مهم حداکثر طول فریم ورودی مدل است که به ۱۲۸ فریم محدود می‌شود. این محدودیت ممکن است باعث شود تا برخی از فریم‌های مهم در ویدئوهای بلند از دست بروند یا مدل نتواند به‌درستی سرعت پخش ویدئو را تشخیص دهد. به‌علاوه، محققان اپل به این نکته اشاره کرده‌اند که بهبود عملکرد مدل نیازمند تنظیمات پیچیده‌ای است که به حافظه GPU زیاد نیاز دارد.

پژوهشگران اپل اعلام کرده‌اند که SlowFast-LLaVA-1.5 هنوز قابلیت‌های زیادی برای بهبود دارد. یکی از این قابلیت‌ها تنظیم پارامترهای مختلف برای افزایش دقت مدل و بهبود عملکرد آن در پردازش ویدئوهای بلند است. افزون‌بر این، پژوهشگران اپل پیشنهاد کرده‌اند که می‌توان از شیوه‌های صرفه‌جویی در حافظه مانند Stochastic BP برای کاهش هزینه‌های حافظه GPU استفاده کرد.

مدل SlowFast-LLaVA-1.5 اپل
مدل SlowFast-LLaVA-1.5 اپل
مدل SlowFast-LLaVA-1.5 اپل

مدل SlowFast-LLaVA-1.5 اپل به‌عنوان مدلی منبع باز در دسترس عموم قرار گرفته است. این مدل اکنون از‌طریق گیت‌هاب و Hugging Face در دسترس است و محققان و توسعه‌دهندگان می‌توانند از آن برای پروژه‌های خود استفاده کنند. این دسترس‌پذیری بدین‌معناست که دیگران نیز می‌توانند از پیشرفت‌های این مدل بهره‌برداری کنند و آن را برای تحلیل و پردازش ویدئوهای بلند و تصاویر به کار گیرند.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

طرح مفهومی تغییرات جدید مرورگر فایرفاکس
اینترنت و شبکه

موزیلا از بازطراحی بزرگ فایرفاکس خبر داد

نوشته شده توسط سید محمد برازنده
2 خرداد 1405
خلاصه‌های گوگل
اخبار هوش مصنوعی

چرا واژه Disregard از گوگل حذف شد؟

نوشته شده توسط مانی
2 خرداد 1405
دسترسی رایگان به هوش مصنوعی
اخبار هوش مصنوعی

هوش مصنوعی دیگر رایگان نیست

نوشته شده توسط مانی
2 خرداد 1405
ایرباس از جنگنده یوروفایتر ترانش ۴ رونمایی کرد
پیشنهاد سردبیر

ایرباس از جنگنده یوروفایتر ترانش ۴ رونمایی کرد

نوشته شده توسط نرگس چالوک
2 خرداد 1405
قرارداد ۱۵ میلیارد دلاری آنتروپیک با دیتاسنترهای ایلان ماسک امضا شد
اخبار هوش مصنوعی

قرارداد ۱۵ میلیارد دلاری آنتروپیک با دیتاسنترهای ایلان ماسک امضا شد

نوشته شده توسط مانی
2 خرداد 1405
خبر بعدی
اندروید ۱۶، آخرین به‌روزرسانی این گوشی‌های ریلمی خواهد بود

اندروید ۱۶ آخرین به‌روزرسانی این گوشی‌های ریلمی خواهد بود

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

بهترین کارت گرافیک بازار ایران

بهترین کارت گرافیک کامپیوتر در بازار ایران + راهنمای خرید

18 اردیبهشت 1405 - به‌روزشده در 19 اردیبهشت 1405
شیائومی از مچ‌بند هوشمند Band 10 Pro رونمایی کرد

شیائومی از مچ‌بند هوشمند Band 10 Pro رونمایی کرد + تصویر

2 خرداد 1405

داغ‌ترین‌های روز

مایکروسافت فایل‌های ISO جدید ویندوز ۱۱ را منتشر کرد

مایکروسافت فایل‌های ISO جدید ویندوز ۱۱ را منتشر کرد

30 اردیبهشت 1405
فاجعه امنیتی در گیت‌هاب؛ نصب یک پلاگین، هزاران ریپازیتوری را لو داد

فاجعه امنیتی در گیت‌هاب؛ نصب یک پلاگین، هزاران ریپازیتوری را لو داد

31 اردیبهشت 1405
موتورسیکلت مفهومی جدید BMW با ظاهری شبیه هواپیماهای مافوق صوت معرفی شد

موتورسیکلت مفهومی جدید BMW با ظاهری شبیه هواپیماهای مافوق صوت معرفی شد + تصویر

30 اردیبهشت 1405

راهنمای کامل استفاده از میرورهای داخلی برای توسعه‌دهندگان در شرایط اختلال اینترنت

18 اردیبهشت 1405 - به‌روزشده در 19 اردیبهشت 1405
هوش مصنوعی Gemini 3.5 Flash گوگل می‌تواند یک سیستم‌عامل کامل بسازد

هوش مصنوعی Gemini 3.5 Flash گوگل می‌تواند یک سیستم‌عامل کامل بسازد

30 اردیبهشت 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

اپلیکیشن بله چگونه یکی از پرکاربرترین اپلیکیشن‌های ایرانی شد؟

بله چگونه یکی از پرکاربرترین اپلیکیشن‌های ایرانی شد؟

2 خرداد 1405
ساخت نخستین کارخانه ویفر کوانتومی با همکاری IBM

ساخت نخستین کارخانه ویفر کوانتومی با همکاری IBM

2 خرداد 1405
طرح مفهومی تغییرات جدید مرورگر فایرفاکس

موزیلا از بازطراحی بزرگ فایرفاکس خبر داد

2 خرداد 1405
حمله تند وزیر ارتباطات به مخالفان اینترنت آزاد

حمله تند وزیر ارتباطات به مخالفان اینترنت آزاد

2 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir