• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » هوش مصنوعی جدید مایکروسافت صدای هرکسی را شبیه‌سازی می‌کند

هوش مصنوعی جدید مایکروسافت صدای هرکسی را شبیه‌سازی می‌کند

صمد کردی نوشته شده توسط صمد کردی
سه شنبه 20 دی 1401 - 11:29 - به‌روزشده در سه شنبه 21 شهریور 1402 - 12:23
در اخبار هوش مصنوعی, فناوری
مایکروسافت VALL-E
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

محققان مایکروسافت از طراحی یک مدل جدید هوش مصنوعی تبدیل متن به گفتار به نام VALL-E خبر دادند که می‌تواند صدای یک فرد را با استفاده از یک نمونه صوتی سه ثانیه‌ای شبیه‌سازی کند.

به گزارش تکناک، زمانی  که VALL-E صدای خاصی را یاد گرفت، می‌تواند صدای آن شخص را با حفظ لحن گوینده تقلید کند.

سازندگان آن حدس می‌زنند که VALL-E می‌تواند برای برنامه‌های کاربردی تبدیل متن به گفتار با کیفیت بالا، ویرایش صداهای ضبط شده و ایجاد محتوای صوتی در صورت ترکیب با سایر مدل‌های هوش مصنوعی مانند GPT-3 استفاده شود.

مایکروسافت Vall-E  را مدل زبان کدک عصبی می نامد و آن را از فناوری به نام EnCodec که متا در اکتبر 2022 عرضه  کرد، ساخته است.

برخلاف سایر روش های تبدیل متن به گفتار که معمولا گفتار را با دستکاری شکل موج ترکیب می کند، VALL-E کدک های صوتی گسسته را از متن و پیام های صوتی تولید می کند.

Vall-E اساسا صدای یک شخص را تجزیه تحلیل می کند، اطلاعات را به نشانه های صوتی  که توکن صوتی نامیده می شوند به لطف EnCodec تجزیه می کند، و از داده های آموزشی برای مطابقت با آنچه می داند برای تقلید صدا استفاده می کند .

نمودار بلوکی VALL-E مایکروسافت

Microsoft (American multinational technology corporation) در مقاله خود بیان می کند:VALL-E برای ترکیب گفتار شخصی شده (مثلاً  (zero-shot TTS توکن‌های صوتی مربوطه را مشروط به نشانه‌های صوتی ضبط ثبت‌شده 3 ثانیه‌ای از صدای سخنران  و اعلان واج ایجاد می‌کند .در نهایت، توکن های آکوستیک تولید شده برای سنتز شکل موج نهایی با رمزگشای کدک عصبی مربوطه استفاده می شود.

مایکروسافت قابلیت های سنتز گفتار VALL-E را بر روی یک کتابخانه صوتی که توسط متا مونتاژ شده بود، به نام LibriLight آموزش داد. این شامل 60هزار ساعت سخنرانی به زبان انگلیسی از بیش از 7000 سخنران است که عمدتاً از کتاب‌های صوتی عمومی LibriVox استخراج شده است. برای اینکه VALL-E نتیجه خوبی ایجاد کند، صدای نمونه سه ثانیه‌ای باید دقیقاً با صدای داده‌های آموزشی مطابقت داشته باشد.

در وب‌سایت نمونه VALL-E، مایکروسافت ده‌ها نمونه صوتی از مدل هوش مصنوعی در عمل ارائه می‌دهد. در بین نمونه‌ها، «Speaker Prompt» صدای سه ثانیه‌ای است که در اختیار VALL-E قرار گرفته و باید از آن تقلید کند.

” Ground Truth ” یک صدای ضبط شده از قبل موجود از همان گوینده است که یک عبارت خاص را برا مقایسه بیان می کند.

“Baseline” نمونه ای از سنتز است که با روش سنتز متن به گفتار مرسوم ارائه می شود و نمونه “VALL-E” خروجی از مدل VALL-E است.

محققان  در حالی که از VALL-E برای تولید آن نتایج استفاده می‌کردند، تنها نمونه سه ثانیه‌ای “Speaker Prompt” و یک رشته متن را به VALL-E وارد کردند. اگر نمونه « Ground Truth » را با نمونه «VALL-E» مقایسه کنید، در برخی موارد، این دو نمونه بسیار نزدیک هستند. برخی از نتایج VALL-E به نظر می‌رسد که توسط رایانه تولید شده‌اند، اما برخی دیگر به طور بالقوه می‌توانند با گفتار انسان اشتباه گرفته شوند، که هدف این مدل است.

VALL-E علاوه بر حفظ صدای صوتی و لحن احساسی گوینده، می تواند از نمونه صوتی “محیط آکوستیک” نیز تقلید کند. برای مثال، اگر نمونه از یک تماس تلفنی گرفته شده باشد، خروجی صدا ویژگی‌های صوتی و فرکانس یک تماس تلفنی را در خروجی ترکیبی خود شبیه‌سازی می‌کند .

محققان مایکروسافت شاید به دلیل قابلیت استفاده برای مقاصد بد ، کد VALL-E را برای آزمایش به دیگران ارائه نکرده است،و به نظر می رسد محققان سازنده آن  از آسیب اجتماعی بالقوه ای که این فناوری می تواند به همراه داشته باشد آگاه هستند.

 

برچسب‌ها: مایکروسافت
صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

سوپرمموری
اخبار هوش مصنوعی

حمایت مدیران اجرایی گوگل از استارتاپ حافظه هوش مصنوعی جوان ۱۹ ساله

نوشته شده توسط اسما کلهر
14 مهر 1404
قابلیت نقشه اینستاگرام
شبکه های اجتماعی

اینستاگرام برای رفع سردرگمی کاربران نقشه را به‌روزرسانی کرد

نوشته شده توسط امیرحسین یونس
14 مهر 1404
خدمات ماهواره‌ای آیفون اپل
اینترنت و شبکه

اپل احتمالاً از سرویس ماهواره‌ای استارلینک در آیفون استفاده می‌کند

نوشته شده توسط امیرحسین یونس
14 مهر 1404
بیوکامپیوترهای انسانی FinalSpark
فناوری

ساخت کامپیوترهایی با قدرت مغزهای کوچک انسان در سوئیس + تصویر

نوشته شده توسط امیرحسین یونس
14 مهر 1404
قرارداد همکاری AMD و OpenAI
اخبار هوش مصنوعی

رقابت در بازار هوش مصنوعی داغ‌تر شد؛ AMD با OpenAI قرارداد همکاری امضا کرد

نوشته شده توسط امیرحسین یونس
14 مهر 1404
خبر بعدی
شرکت سامسونگ در جدیدترین محصول خود یک پنل OLED جدید برای رایانه های شخصی قابل حمل با 70 درصد کاهش نور آبی مضر را به نمایش گذاشت.

کاهش 70درصدی نور آبی مضر در نمایشگر OLED جدید سامسونگ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

اریک ترامپ: بیت‌کوین از طلا پیشی می‌گیرد و به یک میلیون دلار می‌رسد

اریک ترامپ: بیت‌کوین از طلا پیشی می‌گیرد و به یک میلیون دلار می‌رسد

9 مهر 1404
ویژگی‌های جدید رابط کاربری One UI 8.5 در یک ویدیو لو رفت

ویژگی‌های جدید رابط کاربری One UI 8.5 در یک ویدیو لو رفت + ویدیو

7 مهر 1404

داغ‌ترین‌های روز

ریپل

پیش‌بینی قیمت ریپل (XRP) با احتمال ورود ۱۰ میلیارد دلاری سرمایه به ETFها

14 مهر 1404
اروپا از نخستین جنگنده رزمی خودران خود با نام CA-1 Europa رونمایی کرد

اروپا از نخستین جنگنده رزمی خودران خود با نام CA-1 Europa رونمایی کرد

13 مهر 1404
بدترین برندهای موبایل از نظر خرابی کدام هستند؟

بدترین برندهای موبایل از نظر خرابی کدام هستند؟

12 مهر 1404
HyperOS 3 Xiaomi devices

این گوشی‌ها HyperOS 3 را دریافت نمی‌کنند

12 مهر 1404 - به‌روزشده در 13 مهر 1404
بهترین ردیاب خودرو ۲۰۲۵

بهترین ردیاب خودرو ۲۰۲۵؛ معرفی ۱۰ مدل برتر بازار

13 مهر 1404 - به‌روزشده در 14 مهر 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

سوپرمموری

حمایت مدیران اجرایی گوگل از استارتاپ حافظه هوش مصنوعی جوان ۱۹ ساله

14 مهر 1404
اکسپریا ۱۰ مارک ۷ سونی

اکسپریا ۱۰ مارک ۷ سونی بدون کابل USB عرضه شد؛ حذف بیشتر لوازم جانبی از جعبه گوشی‌ها

14 مهر 1404
گزارش‌دهی محاوره‌ای ویز

ویز گزارش‌ محاوره‌ای از ترافیک و خطرات جاده‌ای با زبان کاربران را راه‌اندازی کرد + ویدئو

14 مهر 1404
گلکسی M17 5G

تاریخ عرضه و ویژگی‌های گلکسی M17 5G اعلام شد + تصویر

14 مهر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir