• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » استفاده از صدا برای مدل سازی جهان

استفاده از صدا برای مدل سازی جهان

صمد کردی نوشته شده توسط صمد کردی
سه شنبه 10 آبان 1401 - 12:15 - به‌روزشده در چهارشنبه 23 مهر 1404 - 13:53
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
یک مدل یادگیری ماشینی می تواند انتشار هر صدایی در اتاق را در فضا ثبت کند و مدل میتواند با استفاده از صدا برای مدل سازی مکانی استفاده کند.
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. استفاده از صدا در واقعیت مجازی
  • 2. چگونه مدل‌های هوش مصنوعی از صدا برای درک فضا استفاده می‌کنند؟
  • 3. چرا ترکیب صدا و تصویر دقت درک ماشین را افزایش می‌دهد؟

محققان یک مدل یادگیری ماشینی ایجاد کردند که می تواند نحوه انتشار هر صدایی در اتاق را در فضا ثبت کند و این سیستم میتواند با استفاده از صدا برای مدل سازی هر فصایی را مدل سازی کند.

به گزارش تکناک، صدایی که یک بازدیدکننده کلیسای جامع می شنود تحت تأثیر عوامل زیادی قرار می گیرد، از جمله مکان ارگ، جایی که شنونده در آن ایستاده است، ستون ها، نیمکت ها یا موانع دیگری بین آنها قرار گرفته است، دیوارها از چه چیزی ساخته شده اند، مکان ها پنجره ها یا درها و غیره. شنیدن صدا می تواند به فرد کمک کند تا محیط خود را تصور کند.

محققان MIT و آزمایشگاه هوش مصنوعی واتسون MIT-IBM در حال بررسی استفاده از اطلاعات صوتی فضایی برای کمک به ماشین‌ها برای تجسم بهتر محیط خود هستند.

با مدل‌سازی دقیق آکوستیک یک صحنه، سیستم می‌تواند هندسه سه‌بعدی زیربنای یک اتاق را از ضبط صدا یاد بگیرد. محققان می توانند از اطلاعات صوتی گرفته شده توسط سیستم خود برای ساختن رندرهای بصری دقیق از یک اتاق استفاده کنند، مشابه نحوه استفاده انسان از صدا در هنگام تخمین ویژگی های محیط فیزیکی خود.

ییلون دو، دانشجوی مقطع کارشناسی ارشد در دپارتمان مهندسی برق و علوم کامپیوتر EECS و یکی از نویسندگان مقاله ای که مدل را توصیف می کند می گوید این تکنیک علاوه بر کاربردهای بالقوه‌اش در واقعیت مجازی و واقعیت افزوده، می‌تواند به عوامل هوش مصنوعی کمک کند تا درک بهتری از دنیای اطراف خود داشته باشند.

به عنوان مثال، یک ربات کاوشگر زیر آب با مدل‌سازی ویژگی‌های آکوستیک صدا در محیط خود، می‌تواند چیزهایی را که دورتر از آن تنها با بینایی است، حس کند.

دو اضافه می کند: بیشتر محققان تاکنون تنها بر روی مدل‌سازی بینایی تمرکز کرده‌اند. اما ما به عنوان انسان، ادراک چندوجهی داریم. نه تنها بینایی مهم است، صدا نیز مهم است. من فکر می‌کنم این کار یک مسیر تحقیقاتی هیجان‌انگیز را در مورد استفاده بهتر از صدا برای مدل‌سازی جهان باز می‌کند.

01
از 03
استفاده از صدا در واقعیت مجازی

در تحقیقات بینایی کامپیوتری، یک نوع مدل یادگیری ماشینی به نام مدل نمایش عصبی ضمنی برای ایجاد بازسازی های صاف و پیوسته صحنه های سه بعدی از تصاویر استفاده شده است. این مدل‌ها از شبکه‌های عصبی استفاده می‌کنند که حاوی لایه‌هایی از گره‌های به هم پیوسته یا نورون‌ها هستند که داده‌ها را برای تکمیل یک کار پردازش می‌کنند.

02
از 03
چگونه مدل‌های هوش مصنوعی از صدا برای درک فضا استفاده می‌کنند؟

محققان MIT از همین نوع مدل برای ثبت چگونگی حرکت مداوم صدا در یک صحنه استفاده کردند.داما آن‌ها دریافتند که مدل‌های بینایی از خاصیتی به نام سازگاری فتومتریک سود می‌برند که برای صدا اعمال نمی‌شود. اگر کسی از دو مکان مختلف به یک شی نگاه کند، آن شی تقریباً یکسان به نظر می رسد. اما با صدا، مکان را تغییر دهید و صدایی که می شنود می تواند به دلیل موانع، فاصله و غیره کاملاً متفاوت باشد. این امر پیش بینی صدا را بسیار دشوار می کند.

محققان با وارد کردن دو ویژگی آکوستیک در مدل خود بر این مشکل غلبه کردند: ماهیت متقابل صدا و تأثیر ویژگی‌های هندسی محلی.

صدا متقابل است، به این معنی که اگر منبع صدا و شنونده جای خود را عوض کنند، چیزی که شخص می شنود تغییری نمی کند. علاوه بر این، آنچه در یک منطقه خاص می شنود به شدت تحت تأثیر ویژگی های محلی است، مانند مانعی بین شنونده و منبع صدا.

برای گنجاندن این دو عامل در مدل خود، به نام میدان صوتی عصبی (NAF)، شبکه عصبی را با شبکه‌ای تقویت می‌کنند که اشیاء و ویژگی‌های معماری را در صحنه، مانند درها یا دیوارها، ثبت می‌کند. مدل به طور تصادفی از نقاط آن شبکه نمونه برداری می کند تا ویژگی ها را در مکان های خاص یاد بگیرد.

اگر تصور می‌کنید نزدیک دری ایستاده‌اید، آنچه که به شدت بر آنچه می‌شنوید تأثیر می‌گذارد وجود آن در است، نه لزوماً ویژگی‌های هندسی دور از شما در آن سوی اتاق. ما متوجه شدیم که این اطلاعات تعمیم بهتری را نسبت به یک شبکه کاملاً متصل ساده امکان پذیر می کند.

03
از 03
چرا ترکیب صدا و تصویر دقت درک ماشین را افزایش می‌دهد؟

محققان می‌توانند اطلاعات بصری NAF را در مورد یک صحنه و چند طیف‌نگار که نشان می‌دهند وقتی فرستنده و شنونده در مکان‌های مورد نظر در اطراف اتاق قرار دارند، صدای یک قطعه صدا را به NAF ارائه دهند. سپس مدل پیش‌بینی می‌کند که اگر شنونده به هر نقطه‌ای از صحنه حرکت کند، صدا چگونه خواهد بود.

NAF یک پاسخ ضربتی تولید می کند که نحوه تغییر صدا را در حین انتشار در صحنه نشان می دهد. سپس محققان این پاسخ ضربتی را به صداهای مختلف اعمال می کنند تا بشنوند که چگونه این صداها وقتی یک فرد در اتاقی قدم می زند تغییر کنند.

به عنوان مثال، اگر آهنگی از یک بلندگو در مرکز اتاق پخش می‌شود، مدل آن‌ها نشان می‌دهد که چگونه وقتی فردی به بلندگو نزدیک می‌شود، این صدا بلندتر می‌شود و سپس هنگام خروج به راهروی مجاور خاموش می‌شود.

وقتی محققان تکنیک خود را با روش‌های دیگری که اطلاعات صوتی را مدل‌سازی می‌کنند مقایسه کردند، تکنیک آنها در همه حالت ها مدل صوتی دقیق‌تری تولید کرد و چون اطلاعات هندسی محلی را یاد گرفت، مدل آنها توانست خیلی بهتر از روش های دیگر در مکان های جدید مورد استفاده قرار گیرد.

علاوه بر این، آنها دریافتند که استفاده از اطلاعات آکوستیکی آنها در یک مدل کامپیوتری تصویری می تواند منجر به بازسازی بصری بهتر صحنه شود.

برای مثال، وقتی شما فقط مجموعه‌ای از تصاویر کمی دارید، استفاده از صدا برای مدل سازی به شما امکان می‌دهد تا مرزها را با وضوح بیشتری ثبت کنید. و شاید به این دلیل باشد که برای ارائه دقیق آکوستیک یک صحنه، باید هندسه سه بعدی زیربنایی آن صحنه را ثبت کنید.

محققان قصد دارند به بهبود این مدل ادامه دهند تا بتواند به صحنه های کاملاً جدید تعمیم یابد. آنها همچنین می‌خواهند این تکنیک را برای پاسخ‌های ضربتی پیچیده‌تر و صحنه‌های بزرگ‌تر، مانند کل ساختمان‌ها یا حتی یک شهر یا شهر، به کار ببرند.

این تکنیک جدید ممکن است فرصت های جدیدی را برای ایجاد یک تجربه همهجانبه چندوجهی در برنامه متاورس ایجاد کند.

دینش منوچا، پروفسوراستاد علوم کامپیوتر و مهندسی برق و کامپیوتر در دانشگاه مریلند، که در این زمینه دخالتی نداشت، می‌گوید: این گروه کارهای زیادی روی استفاده از روش‌های یادگیری ماشینی برای تسریع شبیه‌سازی آکوستیک یا مدل‌سازی آکوستیک صحنه‌های دنیای واقعی انجام داده و نویسندگان این مقاله شامل چوانگ گان و همکارانش به وضوح یک گام به جلو در این مسیر برداشته اند.

این مقاله یک نمایش ضمنی خوب با استفاده از صدا برای مدل سازی را معرفی می‌کند که می‌تواند نحوه انتشار صدا در صحنه‌های دنیای واقعی را با مدل‌سازی آن با استفاده از یک سیستم خطی زمان ناپذیر، به تصویر بکشد. این اثر می تواند کاربردهای زیادی در AR/VR و همچنین درک صحنه های دنیای واقعی داشته باشد.

بخشی از این تحقیق توسط آزمایشگاه هوش مصنوعی MIT-IBM Watson و موسسه Tianqiao و Chrissy Chen پشتیبانی می‌شود.

برای مشاهده منبع اینجا کلیک کنید.

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

دستگاه پایش قند خون Isaac در کنار پایه شارژ و اپلیکیشن موبایل مربوطه که نمودار سطح گلوکز را نشان می‌دهد.
فناوری

پایش قند خون با بازدم؛ کلید ورود فناوری «گلوکومتر» به اپل‌واچ

نوشته شده توسط اسما کلهر
18 دی 1404
یک توالت فرنگی مجهز به سنسور هوشمند پایش سلامت نصب شده بر روی لبه کاسه.
فناوری

مرز میان نبوغ و دیوانگی؛ نگاهی به عجیب‌ترین و جنجالی‌ترین گجت‌های نمایشگاه CES 2026

نوشته شده توسط اسما کلهر
18 دی 1404
نمای نزدیک از داخل یک حلقه هوشمند سامسونگ (Galaxy Ring) که دچار تورم باتری و تغییر شکل بدنه شده است.
فناوری

پایان تحقیقات سامسونگ در پرونده جنجالی گلکسی رینگ؛ نقص فنی در بدنه، نه انفجار باتری!

نوشته شده توسط اسما کلهر
18 دی 1404
نمای رابط کاربری Gmail با قابلیت AI Overview که جستجوی زبان طبیعی در صندوق ورودی را نمایش می‌دهد؛ پرسش متنی درباره دریافت قیمت بازسازی حمام در نوار جستجو وارد شده و خلاصه هوشمند شامل تعداد پیشنهادها، نام شرکت‌ها، شماره پیش‌فاکتور، مبالغ دلاری و تاریخ ارسال ایمیل‌ها به‌صورت ساختاریافته نمایش داده شده است.
اخبار هوش مصنوعی

جیمیل با تمرکز گسترده بر هوش مصنوعی جمنای بازطراحی می‌شود

نوشته شده توسط تارخ ترهنده
18 دی 1404
آیکون پازل رنگی گوگل پلی روی صفحه نمایش یک گوشی هوشمند.
فناوری

نقشه راه گوگل برای سال ۲۰۲۶؛ انتشار جزئیات به‌روزرسانی بزرگ سیستم گوگل در ژانویه

نوشته شده توسط امیرحسین یونس
18 دی 1404
خبر بعدی
انسان‌ها یک قدم به صحبت با حیوانات نزدیک‌تر شده‌اند، زیرا فناوری‌های جدید به روبات‌های اجازه می‌دهند با گونه‌های مختلف صحبت کنند.

انسان یک گام دیگر به صحبت با حیوانات نزدیک شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

دستبند هوشمند فلزی ظریف با بند مشبک رزگلد و نمایشگر دیجیتال که زمان و تاریخ را نشان می‌دهد.

باریک‌ترین مچ‌بند فلزی هوشمند جهان رونمایی شد

1 دی 1404 - به‌روزشده در 2 دی 1404
پوستر تبلیغاتی پردازنده‌های جدید Intel Core Ultra Series 3 (مدل‌های X7 و X9) مجهز به گرافیک مجتمع Intel Arc B390.

زلزله اینتل در بازار سخت‌افزار با معرفی Panther Lake و گرافیک انقلابی Arc B390

16 دی 1404

داغ‌ترین‌های روز

نمای نزدیک از پنل پشتی یک گوشی هوشمند خاکستری رنگ (احتمالاً سری شیائومی ۱۲) که ماژول دوربین سه‌گانه و عبارت 50MP روی آن دیده می‌شود.

این ۶ دستگاه شیائومی از دریافت به‌روزرسانی‌ها سال ۲۰۲۶ محروم خواهند شد

13 دی 1404 - به‌روزشده در 14 دی 1404
سریع ترین گوشی های بازار

سریع‌ترین گوشی‌های بازار ایران + مقایسه عملکرد CPU و GPU

14 دی 1404 - به‌روزشده در 15 دی 1404
خودنمایی HP با لپ‌تاپ‌های گیمینگ جدید در CES 2026

خودنمایی HP با لپ‌تاپ‌های گیمینگ جدید در CES 2026 + تصاویر

17 دی 1404 - به‌روزشده در 18 دی 1404

سرقت ۱.۲ میلیون دلاری با ابزار فعالسازی ویندوز

17 دی 1404
مایکرون نخستین SSD نسل پنجم دنیا را معرفی کرد

مایکرون نخستین SSD نسل پنجم دنیا را معرفی کرد

17 دی 1404 - به‌روزشده در 18 دی 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

عینک هوشمند IXI با فریم مشکی و پل نیمه‌شفاف که اجزای داخلی و مدارهای الکترونیکی آن قابل مشاهده است.

این عینک هوشمند نمره چشمتان را تغییر می‌دهد

18 دی 1404
نمای پانوراما از خط افق شهر شانگهای چین در هنگام غروب با ساختمان‌های بلند و بزرگراه‌های پرنور زیر لایه‌ای از مه.

هر جعبه‌ ۱۰۰ تایی حافظه DDR5 به قیمت ملک در شانگهای رسید

18 دی 1404
دستگاه پایش قند خون Isaac در کنار پایه شارژ و اپلیکیشن موبایل مربوطه که نمودار سطح گلوکز را نشان می‌دهد.

پایش قند خون با بازدم؛ کلید ورود فناوری «گلوکومتر» به اپل‌واچ

18 دی 1404
مقایسه رابط کاربری و ویجت‌های یک آی‌پد در کنار یک آیفون که نشان‌دهنده شباهت‌های نرم‌افزاری احتمالی برای آیفون تاشو است.

آیفون فولد یا آیپد جیبی؟؛ افشاگری‌های جدید از استراتژی متفاوت اپل در بازار گوشی‌های تاشو

18 دی 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir