• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » اپل مدل زبان بزرگ جدیدی برای تحلیل و درک ویدئوهای طولانی توسعه داد

اپل مدل زبان بزرگ جدیدی برای تحلیل و درک ویدئوهای طولانی توسعه داد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
شنبه 1 شهریور 1404 - 20:35 - به‌روزشده در دوشنبه 3 شهریور 1404 - 05:38
در اخبار هوش مصنوعی, فناوری
اپل مدل زبان بزرگ جدیدی برای تحلیل و درک ویدیوهای بلند توسعه داد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل زبان بزرگ SlowFast-LLaVA-1.5 اپل ویدئوهای بلند را با دو جریان پردازش هم‌زمان تحلیل می‌کند و دقت تصویر و ویدئو را به حداکثر می‌رساند.


به گزارش تک‌ناک، محققان اپل با معرفی مدل زبان بزرگ جدید SlowFast-LLaVA-1.5، گام بزرگی در مسیر تحلیل و درک ویدئوهای بلند برداشته‌اند. این مدل به‌طور خاص برای درک و تحلیل ویدیوهای بلند طراحی شده است. مدل SlowFast-LLaVA-1.5 از ترکیب دو جریان مختلف برای پردازش ویدئو استفاده می‌کند: جریان کُند که به تعداد کمتری از فریم‌ها نگاه و جزئیات بیشتری را استخراج می‌کند و جریان سریع که به فریم‌های بیشتری با جزئیات کمتری توجه دارد. این طراحی باعث می‌شود تا مدل بتواند به‌طور بهینه و کارآمدتر اطلاعات ویدیویی را پردازش کند.

9to5mac می‌نویسد که در مقایسه با مدل‌های بزرگ‌تر و پیچیده‌تر، مدل SlowFast-LLaVA-1.5 توانسته است نتایج بهتری در پردازش و تحلیل ویدئوهای بلند ارائه دهد. محققان اپل گزارش داده‌اند که این مدل حتی در نسخه‌های کوچک‌تر خود مانند مدل 1B (با یک میلیارد پارامتر)، توانسته است مدل‌های بزرگ‌تر را پشت‌سر بگذارد و در ارزیابی‌های استاندارد ویدئویی مانند LongVideoBench و MLVU رکوردهای جدیدی ثبت کند.

یکی از مزیت‌های اصلی مدل SlowFast-LLaVA-1.5 اپل این است که نه‌تنها می‌تواند ویدئوها را پردازش کند؛ بلکه در تحلیل تصاویر نیز عملکرد موفقی از خود نشان داده است. این مدل می‌تواند وظایف مختلفی ازجمله استدلال ریاضی و تشخیص متن در تصاویر (OCR) و تحلیل‌های متنی پیچیده را انجام دهد. این ویژگی مدل اپل را به مدلی چندمنظوره تبدیل کرده است که می‌تواند به‌طور مؤثر در تحلیل و پردازش انواع داده‌ها استفاده شود.

مدل SlowFast-LLaVA-1.5 اپل
مدل SlowFast-LLaVA-1.5 اپل
مدل SlowFast-LLaVA-1.5 اپل

یکی از ویژگی‌ها مهم مدل SlowFast-LLaVA-1.5 این است که اپل از داده‌های عمومی برای آموزش آن استفاده کرده است. این امر به اپل امکان داده است تا مدلی توسعه دهد که بتواند به‌طور عمومی در دسترس باشد و محققان و توسعه‌دهندگان دیگر به‌راحتی بتوانند از آن استفاده کنند. به‌علاوه، مدل یادشده به‌طور خاص برای انجام تحلیل‌های ویدئویی و تصویری بهینه شده است و توانسته است عملکرد عالی در هر دو زمینه ارائه دهد.

با وجود پیشرفت‌های چشمگیر، SlowFast-LLaVA-1.5 هنوز محدودیت‌هایی دارد که باید برطرف شود. یکی از محدودیت‌های مهم حداکثر طول فریم ورودی مدل است که به ۱۲۸ فریم محدود می‌شود. این محدودیت ممکن است باعث شود تا برخی از فریم‌های مهم در ویدئوهای بلند از دست بروند یا مدل نتواند به‌درستی سرعت پخش ویدئو را تشخیص دهد. به‌علاوه، محققان اپل به این نکته اشاره کرده‌اند که بهبود عملکرد مدل نیازمند تنظیمات پیچیده‌ای است که به حافظه GPU زیاد نیاز دارد.

پژوهشگران اپل اعلام کرده‌اند که SlowFast-LLaVA-1.5 هنوز قابلیت‌های زیادی برای بهبود دارد. یکی از این قابلیت‌ها تنظیم پارامترهای مختلف برای افزایش دقت مدل و بهبود عملکرد آن در پردازش ویدئوهای بلند است. افزون‌بر این، پژوهشگران اپل پیشنهاد کرده‌اند که می‌توان از شیوه‌های صرفه‌جویی در حافظه مانند Stochastic BP برای کاهش هزینه‌های حافظه GPU استفاده کرد.

مدل SlowFast-LLaVA-1.5 اپل
مدل SlowFast-LLaVA-1.5 اپل
مدل SlowFast-LLaVA-1.5 اپل

مدل SlowFast-LLaVA-1.5 اپل به‌عنوان مدلی منبع باز در دسترس عموم قرار گرفته است. این مدل اکنون از‌طریق گیت‌هاب و Hugging Face در دسترس است و محققان و توسعه‌دهندگان می‌توانند از آن برای پروژه‌های خود استفاده کنند. این دسترس‌پذیری بدین‌معناست که دیگران نیز می‌توانند از پیشرفت‌های این مدل بهره‌برداری کنند و آن را برای تحلیل و پردازش ویدئوهای بلند و تصاویر به کار گیرند.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

یازدهمین پرتاب استارشیپ با موفقیت انجام شد
فناوری

یازدهمین پرتاب استارشیپ با موفقیت انجام شد

نوشته شده توسط نرگس چالوک
23 مهر 1404
خالق ردیت: بخش بزرگی از اینترنت امروز مرده است
پیشنهاد سردبیر

خالق ردیت: بخش بزرگی از اینترنت امروز مرده است

نوشته شده توسط سید محمد برازنده
23 مهر 1404
موتور جستجوی هوش مصنوعی Perplexity به‌ سرویس جستجوی موزیلا اضافه می‌شود
فناوری

موتور جستجوی هوش مصنوعی پرپلکسیتی به‌ موزیلا اضافه می‌شود

نوشته شده توسط تارخ ترهنده
22 مهر 1404
ثروتمندان برای پایان جهان آماده می‌شوند؛ ساخت پناهگاه برای فرار از هرج‌ومرج هوش‌مصنوعی عمومی
اخبار هوش مصنوعی

ثروتمندان برای پایان جهان آماده می‌شوند؛ ساخت پناهگاه برای فرار از هرج‌ومرج هوش‌مصنوعی

نوشته شده توسط تارخ ترهنده
22 مهر 1404
همگام‌سازی لب با هوش مصنوعی در یوتیوب
شبکه های اجتماعی

پس‌از دوبله خودکار، یوتیوب هم‌گام‌سازی خودکار صدا با لب‌ها را آزمایش می‌کند + ویدئو

نوشته شده توسط اسما کلهر
22 مهر 1404
خبر بعدی
اندروید ۱۶، آخرین به‌روزرسانی این گوشی‌های ریلمی خواهد بود

اندروید ۱۶ آخرین به‌روزرسانی این گوشی‌های ریلمی خواهد بود

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

این شرکت ایرانی جز۲۰استارتاپ برتر دنیا در هوش مصنوعی است

این شرکت ایرانی جز ۲۰ استارتاپ برتر دنیا در هوش مصنوعی است

13 مهر 1404
سقوط بیت‌کوین به ۱۰۲ هزار دلار هم‌زمان با اعلام تعرفه‌های ۱۰۰ درصدی ترامپ بر چین

سقوط بیت‌کوین به ۱۰۲ هزار دلار هم‌زمان با اعلام تعرفه‌های ۱۰۰ درصدی ترامپ بر چین

19 مهر 1404

داغ‌ترین‌های روز

۱۰ موشک ویرانگر دنیا بر اساس بُرد و قدرت تخریب

۱۰ موشک ویرانگر دنیا بر اساس بُرد و قدرت تخریب

20 مهر 1404 - به‌روزشده در 21 مهر 1404
نیسان پاترول ۲۰۲۵؛ بازگشت لوکس ژاپنی با قیمت نجومی به ایران

نیسان پاترول ۲۰۲۵؛ بازگشت لوکس ژاپنی با قیمت نجومی به ایران

17 مهر 1404 - به‌روزشده در 19 مهر 1404
بررسی Xiaomi 15T

بررسی Xiaomi 15T ؛ بالارده جدید شیائومی با پردازنده پوکو ایکس ۷ پرو!

20 مهر 1404 - به‌روزشده در 21 مهر 1404
لیست گوشی‌ های شیائومی که این ماه HyperOS 3 را دریافت می‌ کنند

لیست گوشی‌ های شیائومی که این ماه HyperOS 3 را دریافت می‌ کنند

21 مهر 1404
عرضه به‌روزرسانی HyperOS 3 بدون ویژگی HyperIsland برای کاربران REDMI Note

عرضه به‌روزرسانی HyperOS 3 بدون ویژگی HyperIsland برای کاربران REDMI Note + تصویر

20 مهر 1404 - به‌روزشده در 21 مهر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

نتفلیکس وارد دنیای ویدیوپادکست‌ها شد

نتفلیکس وارد دنیای ویدیوپادکست‌ها شد

23 مهر 1404
رونمایی مرسدس‌بنز از خودروی مفهومی Vision Iconic؛ شاهکار تازه در عصر طراحی نمادین

رونمایی مرسدس‌بنز از خودروی مفهومی Vision Iconic؛ شاهکار تازه در عصر طراحی نمادین + تصویر

23 مهر 1404
اپل با همکاری BYD در ویتنام خط تولید جدیدی برای محصولات خانگی هوشمند خود راه‌اندازی می‌ کند

اپل با همکاری BYD خط تولید محصولات خانگی هوشمند در ویتنام راه‌اندازی می‌ کند

23 مهر 1404
اپل با تیزری رمزآلود، معرفی مک‌بوک جدید خود را با تراشه M5 تایید کرد

اپل با تیزری رمزآلود، معرفی مک‌بوک جدید خود را با تراشه M5 تایید کرد

23 مهر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir