• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » هوش مصنوعی جدید مایکروسافت صدای هرکسی را شبیه‌سازی می‌کند

هوش مصنوعی جدید مایکروسافت صدای هرکسی را شبیه‌سازی می‌کند

صمد کردی نوشته شده توسط صمد کردی
سه شنبه 20 دی 1401 - 11:29 - به‌روزشده در سه شنبه 21 شهریور 1402 - 12:23
در اخبار هوش مصنوعی, فناوری
مایکروسافت VALL-E
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

محققان مایکروسافت از طراحی یک مدل جدید هوش مصنوعی تبدیل متن به گفتار به نام VALL-E خبر دادند که می‌تواند صدای یک فرد را با استفاده از یک نمونه صوتی سه ثانیه‌ای شبیه‌سازی کند.

به گزارش تکناک، زمانی  که VALL-E صدای خاصی را یاد گرفت، می‌تواند صدای آن شخص را با حفظ لحن گوینده تقلید کند.

سازندگان آن حدس می‌زنند که VALL-E می‌تواند برای برنامه‌های کاربردی تبدیل متن به گفتار با کیفیت بالا، ویرایش صداهای ضبط شده و ایجاد محتوای صوتی در صورت ترکیب با سایر مدل‌های هوش مصنوعی مانند GPT-3 استفاده شود.

مایکروسافت Vall-E  را مدل زبان کدک عصبی می نامد و آن را از فناوری به نام EnCodec که متا در اکتبر 2022 عرضه  کرد، ساخته است.

برخلاف سایر روش های تبدیل متن به گفتار که معمولا گفتار را با دستکاری شکل موج ترکیب می کند، VALL-E کدک های صوتی گسسته را از متن و پیام های صوتی تولید می کند.

Vall-E اساسا صدای یک شخص را تجزیه تحلیل می کند، اطلاعات را به نشانه های صوتی  که توکن صوتی نامیده می شوند به لطف EnCodec تجزیه می کند، و از داده های آموزشی برای مطابقت با آنچه می داند برای تقلید صدا استفاده می کند .

نمودار بلوکی VALL-E مایکروسافت

Microsoft (American multinational technology corporation) در مقاله خود بیان می کند:VALL-E برای ترکیب گفتار شخصی شده (مثلاً  (zero-shot TTS توکن‌های صوتی مربوطه را مشروط به نشانه‌های صوتی ضبط ثبت‌شده 3 ثانیه‌ای از صدای سخنران  و اعلان واج ایجاد می‌کند .در نهایت، توکن های آکوستیک تولید شده برای سنتز شکل موج نهایی با رمزگشای کدک عصبی مربوطه استفاده می شود.

مایکروسافت قابلیت های سنتز گفتار VALL-E را بر روی یک کتابخانه صوتی که توسط متا مونتاژ شده بود، به نام LibriLight آموزش داد. این شامل 60هزار ساعت سخنرانی به زبان انگلیسی از بیش از 7000 سخنران است که عمدتاً از کتاب‌های صوتی عمومی LibriVox استخراج شده است. برای اینکه VALL-E نتیجه خوبی ایجاد کند، صدای نمونه سه ثانیه‌ای باید دقیقاً با صدای داده‌های آموزشی مطابقت داشته باشد.

در وب‌سایت نمونه VALL-E، مایکروسافت ده‌ها نمونه صوتی از مدل هوش مصنوعی در عمل ارائه می‌دهد. در بین نمونه‌ها، «Speaker Prompt» صدای سه ثانیه‌ای است که در اختیار VALL-E قرار گرفته و باید از آن تقلید کند.

” Ground Truth ” یک صدای ضبط شده از قبل موجود از همان گوینده است که یک عبارت خاص را برا مقایسه بیان می کند.

“Baseline” نمونه ای از سنتز است که با روش سنتز متن به گفتار مرسوم ارائه می شود و نمونه “VALL-E” خروجی از مدل VALL-E است.

محققان  در حالی که از VALL-E برای تولید آن نتایج استفاده می‌کردند، تنها نمونه سه ثانیه‌ای “Speaker Prompt” و یک رشته متن را به VALL-E وارد کردند. اگر نمونه « Ground Truth » را با نمونه «VALL-E» مقایسه کنید، در برخی موارد، این دو نمونه بسیار نزدیک هستند. برخی از نتایج VALL-E به نظر می‌رسد که توسط رایانه تولید شده‌اند، اما برخی دیگر به طور بالقوه می‌توانند با گفتار انسان اشتباه گرفته شوند، که هدف این مدل است.

VALL-E علاوه بر حفظ صدای صوتی و لحن احساسی گوینده، می تواند از نمونه صوتی “محیط آکوستیک” نیز تقلید کند. برای مثال، اگر نمونه از یک تماس تلفنی گرفته شده باشد، خروجی صدا ویژگی‌های صوتی و فرکانس یک تماس تلفنی را در خروجی ترکیبی خود شبیه‌سازی می‌کند .

محققان مایکروسافت شاید به دلیل قابلیت استفاده برای مقاصد بد ، کد VALL-E را برای آزمایش به دیگران ارائه نکرده است،و به نظر می رسد محققان سازنده آن  از آسیب اجتماعی بالقوه ای که این فناوری می تواند به همراه داشته باشد آگاه هستند.

 

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

تصاویری از محیط کاربری مروگر Comet
اخبار هوش مصنوعی

پرپلکسیتی ‌مرورگر ‌هوش ‌مصنوعی ‌کامت ‌را ‌برای ‌اندروید ‌عرضه ‌کرد

نوشته شده توسط تارخ ترهنده
29 آبان 1404
یک رندر از اسب تروجان (Trojan Horse) به رنگ قرمز روی صفحه گوشی هوشمند، که در مقابل صفحه‌ی یک کامپیوتر با هشدارهای بانکی و علامت خطر قرار گرفته است.
شبکه های اجتماعی

بدافزار «Eternidade» از طریق واتس‌اپ حساب‌های بانکی را هدف قرار می‌دهد

نوشته شده توسط اسما کلهر
29 آبان 1404
نمای نزدیک از یک گوشی هوشمند که لوگوی ویکی‌پدیا را در یک ذره‌بین روی صفحه نمایش خود نشان می‌دهد، در مقابل یک پس‌زمینه شبکه‌ای آبی.
اخبار هوش مصنوعی

ویکی‌پدیا راز شناسایی متون هوش مصنوعی را فاش کرد

نوشته شده توسط اسما کلهر
29 آبان 1404
نمایی از امکانات جدید Nano Banana Pro
اخبار هوش مصنوعی

گوگل نانو بنانا ۳ را به‌‌رایگان منتشر کرد

نوشته شده توسط تارخ ترهنده
29 آبان 1404
گوگل قابلیت تشخیص تصاویر ساخته‌شده با هوش مصنوعی را در جمینای فعال کرد
اخبار هوش مصنوعی

جمنای تصاویر ساخته‌شده با هوش مصنوعی را شناسایی می‌کند

نوشته شده توسط اسما کلهر
29 آبان 1404
خبر بعدی
شرکت سامسونگ در جدیدترین محصول خود یک پنل OLED جدید برای رایانه های شخصی قابل حمل با 70 درصد کاهش نور آبی مضر را به نمایش گذاشت.

کاهش 70درصدی نور آبی مضر در نمایشگر OLED جدید سامسونگ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

فناوری تازه چین برای مهار آلودگی هسته‌ای

فناوری تازه چین برای مهار آلودگی هسته‌ای

19 آبان 1404
کارخانه عامل های هوش مصنوعی Microsoft Agent ۳۶۵

با Agent 365 مایکروسافت مدیریت عامل‌های هوش مصنوعی مانند کارمندان می‌شود

27 آبان 1404

داغ‌ترین‌های روز

این سه دانشگاه ایرانی در بین برترین های آسیا قرار دارند

این سه دانشگاه ایرانی در بین برترین های آسیا قرار دارند

26 آبان 1404
مایکروسافت Windows را وارد عصر «agentic OS» کرد

مایکروسافت ویندوز را وارد عصر agentic OS کرد

28 آبان 1404
کاسیو سری تمام‌فلزی G-Shock GMW-BZ5000 را معرفی کرد

کاسیو سری تمام‌فلزی G-Shock GMW-BZ5000 را معرفی کرد

24 آبان 1404 - به‌روزشده در 25 آبان 1404
AMD و NVIDIA می‌توانند پردازنده‌های گرافیکی ارزان‌قیمت را از رده خارج کنند، زیرا کمبود حافظه باعث افزایش هزینه‌ها می‌شود و گیمرهای سطح پایین را با گزینه‌های کمی رها می‌کند.

توقف تولید GPUهای اقتصادی توسط AMD و انویدیا

28 آبان 1404 - به‌روزشده در 29 آبان 1404
بهترین کیبوردهای بی‌صدا بازار

تجربه تایپ آرام؛ معرفی بهترین کیبوردهای بی‌صدا در بازار

25 آبان 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

مایکروسافت افزونه اختصاصی Copilot را برای مرورگر کروم توسعه می‌دهد

مایکروسافت دستیار هوش مصنوعی کوپایلت را به مرورگر کروم می آورد

29 آبان 1404 - به‌روزشده در 30 آبان 1404
تصاویری از محیط کاربری مروگر Comet

پرپلکسیتی ‌مرورگر ‌هوش ‌مصنوعی ‌کامت ‌را ‌برای ‌اندروید ‌عرضه ‌کرد

29 آبان 1404
گوشی هوشمند که برنامه Quick Share اندروید در سمت چپ (با یک فایل انتخاب شده برای ارسال به iPhone) و گوشی iPhone که پاپ‌آپ AirDrop با درخواست دریافت فایل از Pixel را در سمت راست نشان می‌دهد.

گوگل دیوار بین اندروید و iOS را شکست؛ Quick Share با اپل سازگار شد

29 آبان 1404
یک رندر از اسب تروجان (Trojan Horse) به رنگ قرمز روی صفحه گوشی هوشمند، که در مقابل صفحه‌ی یک کامپیوتر با هشدارهای بانکی و علامت خطر قرار گرفته است.

بدافزار «Eternidade» از طریق واتس‌اپ حساب‌های بانکی را هدف قرار می‌دهد

29 آبان 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir