• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » هوش مصنوعی جدید مایکروسافت صدای هرکسی را شبیه‌سازی می‌کند

هوش مصنوعی جدید مایکروسافت صدای هرکسی را شبیه‌سازی می‌کند

صمد کردی نوشته شده توسط صمد کردی
سه شنبه 20 دی 1401 - 11:29 - به‌روزشده در سه شنبه 21 شهریور 1402 - 12:23
در اخبار هوش مصنوعی, فناوری
مایکروسافت VALL-E
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

محققان مایکروسافت از طراحی یک مدل جدید هوش مصنوعی تبدیل متن به گفتار به نام VALL-E خبر دادند که می‌تواند صدای یک فرد را با استفاده از یک نمونه صوتی سه ثانیه‌ای شبیه‌سازی کند.

به گزارش تکناک، زمانی  که VALL-E صدای خاصی را یاد گرفت، می‌تواند صدای آن شخص را با حفظ لحن گوینده تقلید کند.

سازندگان آن حدس می‌زنند که VALL-E می‌تواند برای برنامه‌های کاربردی تبدیل متن به گفتار با کیفیت بالا، ویرایش صداهای ضبط شده و ایجاد محتوای صوتی در صورت ترکیب با سایر مدل‌های هوش مصنوعی مانند GPT-3 استفاده شود.

مایکروسافت Vall-E  را مدل زبان کدک عصبی می نامد و آن را از فناوری به نام EnCodec که متا در اکتبر 2022 عرضه  کرد، ساخته است.

برخلاف سایر روش های تبدیل متن به گفتار که معمولا گفتار را با دستکاری شکل موج ترکیب می کند، VALL-E کدک های صوتی گسسته را از متن و پیام های صوتی تولید می کند.

Vall-E اساسا صدای یک شخص را تجزیه تحلیل می کند، اطلاعات را به نشانه های صوتی  که توکن صوتی نامیده می شوند به لطف EnCodec تجزیه می کند، و از داده های آموزشی برای مطابقت با آنچه می داند برای تقلید صدا استفاده می کند .

نمودار بلوکی VALL-E مایکروسافت

Microsoft (American multinational technology corporation) در مقاله خود بیان می کند:VALL-E برای ترکیب گفتار شخصی شده (مثلاً  (zero-shot TTS توکن‌های صوتی مربوطه را مشروط به نشانه‌های صوتی ضبط ثبت‌شده 3 ثانیه‌ای از صدای سخنران  و اعلان واج ایجاد می‌کند .در نهایت، توکن های آکوستیک تولید شده برای سنتز شکل موج نهایی با رمزگشای کدک عصبی مربوطه استفاده می شود.

مایکروسافت قابلیت های سنتز گفتار VALL-E را بر روی یک کتابخانه صوتی که توسط متا مونتاژ شده بود، به نام LibriLight آموزش داد. این شامل 60هزار ساعت سخنرانی به زبان انگلیسی از بیش از 7000 سخنران است که عمدتاً از کتاب‌های صوتی عمومی LibriVox استخراج شده است. برای اینکه VALL-E نتیجه خوبی ایجاد کند، صدای نمونه سه ثانیه‌ای باید دقیقاً با صدای داده‌های آموزشی مطابقت داشته باشد.

در وب‌سایت نمونه VALL-E، مایکروسافت ده‌ها نمونه صوتی از مدل هوش مصنوعی در عمل ارائه می‌دهد. در بین نمونه‌ها، «Speaker Prompt» صدای سه ثانیه‌ای است که در اختیار VALL-E قرار گرفته و باید از آن تقلید کند.

” Ground Truth ” یک صدای ضبط شده از قبل موجود از همان گوینده است که یک عبارت خاص را برا مقایسه بیان می کند.

“Baseline” نمونه ای از سنتز است که با روش سنتز متن به گفتار مرسوم ارائه می شود و نمونه “VALL-E” خروجی از مدل VALL-E است.

محققان  در حالی که از VALL-E برای تولید آن نتایج استفاده می‌کردند، تنها نمونه سه ثانیه‌ای “Speaker Prompt” و یک رشته متن را به VALL-E وارد کردند. اگر نمونه « Ground Truth » را با نمونه «VALL-E» مقایسه کنید، در برخی موارد، این دو نمونه بسیار نزدیک هستند. برخی از نتایج VALL-E به نظر می‌رسد که توسط رایانه تولید شده‌اند، اما برخی دیگر به طور بالقوه می‌توانند با گفتار انسان اشتباه گرفته شوند، که هدف این مدل است.

VALL-E علاوه بر حفظ صدای صوتی و لحن احساسی گوینده، می تواند از نمونه صوتی “محیط آکوستیک” نیز تقلید کند. برای مثال، اگر نمونه از یک تماس تلفنی گرفته شده باشد، خروجی صدا ویژگی‌های صوتی و فرکانس یک تماس تلفنی را در خروجی ترکیبی خود شبیه‌سازی می‌کند .

محققان مایکروسافت شاید به دلیل قابلیت استفاده برای مقاصد بد ، کد VALL-E را برای آزمایش به دیگران ارائه نکرده است،و به نظر می رسد محققان سازنده آن  از آسیب اجتماعی بالقوه ای که این فناوری می تواند به همراه داشته باشد آگاه هستند.

 

صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

بهترین پروتکل خانه هوشمند: Zigbee در برابر Z-Wave در برابر Wi-Fi
اینترنت و شبکه

بهترین پروتکل خانه هوشمند؛ مقایسه کامل Zigbee، Z-Wave و Wi-Fi

نوشته شده توسط علی‌رضا فاتح دلجویی
26 بهمن 1404
رمزگشایی کیوبیت‌های مایورانا با تکنیکی جدید
فناوری

رمزگشایی کیوبیت‌های مایورانا با تکنیکی جدید

نوشته شده توسط مانی
26 بهمن 1404
گوگل با حالت Deep Think در Gemini 3، هوش مصنوعی را وارد چاپ سه‌بعدی می‌ کند
اخبار هوش مصنوعی

گوگل با حالت Deep Think در Gemini 3، هوش مصنوعی را وارد چاپ سه‌بعدی می‌ کند

نوشته شده توسط مانی
26 بهمن 1404
ساخت ایمپلنت مغزی نرم با الهام از سازوکارهای اوریگامی در چین
فناوری

ساخت ایمپلنت مغزی نرم با الهام از سازوکارهای اوریگامی در چین

نوشته شده توسط مانی
26 بهمن 1404
تحقق اینترنت کوانتومی با دستیابی به انتقال امن 100 کیلومتری
اینترنت و شبکه

تحقق اینترنت کوانتومی با دستیابی به انتقال امن ۱۰۰ کیلومتری

نوشته شده توسط نرگس چالوک
26 بهمن 1404
خبر بعدی
شرکت سامسونگ در جدیدترین محصول خود یک پنل OLED جدید برای رایانه های شخصی قابل حمل با 70 درصد کاهش نور آبی مضر را به نمایش گذاشت.

کاهش 70درصدی نور آبی مضر در نمایشگر OLED جدید سامسونگ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

نمای پشت یک گوشی آیفون به رنگ سبز روشن با دو لنز بزرگ دوربین که روی میز قرار دارد.

تاریخ عرضه مدل‌های استاندارد، پرچمدار و تاشو آیفون ۱۸ مشخص شد

11 بهمن 1404 - به‌روزشده در 12 بهمن 1404
«نمای نزدیک از بخش بالای صفحه نمایش یک گوشی هوشمند که دوربین سلفی حفره‌ای (Punch-hole) را نشان می‌دهد.»

پرچم‌داران اندرویدی با دوربین‌های سه‌گانه ۱۰۰ مگاپیکسلی و سلفی ۱۰۰ مگاپیکسلی در راه‌اند

21 بهمن 1404 - به‌روزشده در 23 بهمن 1404

داغ‌ترین‌های روز

پوستر تبلیغاتی One UI 8.5 روی پس‌زمینه بنفش با تصویر یک گوشی هوشمند.

لیست سیاه سامسونگ لو رفت؛ محرومیت میلیون‌ها کاربر از به‌روزرسانی One UI 8.5

20 بهمن 1404 - به‌روزشده در 21 بهمن 1404

ایران کجای نقشه جهانی هوش مصنوعی ایستاده است؟

25 بهمن 1404
سامسونگ قدرت عکاسی در شب گلکسی S26 اولترا را به رخ کشید

سامسونگ قدرت عکاسی در شب گلکسی S26 اولترا را به رخ کشید + جدول مشخصات

25 بهمن 1404
وقفه عملیاتی شیائومی

شیائومی ترمز به‌روزرسانی‌ها را کشید؛ آپدیت HyperOS تا ۳ مارس متوقف شد

24 بهمن 1404 - به‌روزشده در 25 بهمن 1404
لوگوی سفید ویندوز ۱۱ در کنار یک ایموجی لبخند روی پس‌زمینه مشکی.

قابلیت جدید ویندوز ۱۱ برای پایان دست‌اندازی اپلیکیشن‌ها به تنظیمات سیستم

24 بهمن 1404 - به‌روزشده در 25 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

اپل مک‌بوک ارزان‌قیمت خود را ماه آینده معرفی می‌ کند

اپل مک‌بوک ارزان‌قیمت خود را ماه آینده معرفی می‌ کند

27 بهمن 1404
بهترین پروتکل خانه هوشمند: Zigbee در برابر Z-Wave در برابر Wi-Fi

بهترین پروتکل خانه هوشمند؛ مقایسه کامل Zigbee، Z-Wave و Wi-Fi

26 بهمن 1404
بررسی MSI Vector 16

نقد و بررسی MSI Vector 16 HX (A2XWIG): قدرت هوش مصنوعی در گیمینگ

26 بهمن 1404
نقد و بررسی Redmi Note 15 5G

نقد و بررسی Redmi Note 15 5G؛ گوشی اقتصادی از شیائومی با قیمت میان‌رده

26 بهمن 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir