• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مایکروسافت با مدل صوتی جدید DragonV2.1 قواعد فناوری دیپ‌فیک را دگرگون می‌ کند

مایکروسافت با مدل صوتی جدید DragonV2.1 قواعد فناوری دیپ‌فیک را دگرگون می‌ کند

سید محمد برازنده نوشته شده توسط سید محمد برازنده
پنجشنبه 9 مرداد 1404 - 12:05
در اخبار هوش مصنوعی, فناوری
۱۵ میلیارد دلار باقی‌مانده نیز به پشتیبانی از فعالیت‌های جاری مایکروسافت در بریتانیا اختصاص می‌یابد. این شرکت هم‌اکنون حدود ۶ هزار کارمند در حوزه‌های تحقیق پیشرفته، توسعه مدل‌های هوش مصنوعی، توسعه محصولات و بازی‌های دیجیتال در بریتانیا دارد.
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. صدایی طبیعی‌تر، دقیق‌تر و قابل‌کنترل‌تر
  • 2. کاربردهای متنوع مدل صوتی جدید مایکروسافت
  • 3. نگرانی‌ها درباره دیپ‌فیک و تدابیر امنیتی
  • 4. دسترسی آزمایشی به مدل صوتی جدید مایکروسافت

شرکت مایکروسافت از نسخه جدید مدل صوتی خود با نام DragonV2.1Neural رونمایی کرد که قواعد فناوری دیپ‌فیک را دگرگون می‌ کند.

به گزارش تک‌ناک، این مدل جدید مایکروسافت می‌تواند تنها با چند ثانیه نمونه صدا، صدایی طبیعی، دقیق و قابل‌ کنترل را در بیش از ۱۰۰ زبان تولید کند.

این مدل که در قالب قابلیت Personal Voice از سرویس Azure AI Speech ارائه شده، به‌ عنوان یک مدل «صفر-نمونه‌ای» (Zero-Shot) طراحی شده است و تحولی چشمگیر در شخصی‌سازی صدا و تولید گفتار مصنوعی به حساب می‌آید.

01
از 04
صدایی طبیعی‌تر، دقیق‌تر و قابل‌کنترل‌تر

شرکت مایکروسافت اعلام کرده است که مدل صوتی جدید DragonV2.1 نسبت به نسخه قبلی خود یعنی DragonV1، بهبودهای چشمگیری در زمینه کیفیت تولید صدا ارائه می‌دهد. این مدل جدید توانسته است با کاهش میانگین ۱۲.۸ درصدی در نرخ خطای کلمات (WER)، صدایی با آهنگ گفتاری طبیعی‌تر (prosody)، تلفظ دقیق‌تر و پایداری بالاتر ارائه کند. همچنین کاربران با استفاده از برچسب‌های SSML و واژه‌نامه‌های سفارشی می‌توانند کنترل دقیقی بر نحوه تلفظ، لهجه و ویژگی‌های صوتی داشته باشند.

02
از 04
کاربردهای متنوع مدل صوتی جدید مایکروسافت

قابلیت‌های DragonV2.1 تنها محدود به تولید صدا نیست، بلکه این مدل امکان‌های جدیدی برای کاربردهای گسترده در اختیار کاربران قرار می‌دهد. از جمله مهم‌ترین استفاده‌ها می‌توان به شخصی‌سازی صدای چت‌بات‌ها، دوبله محتوای ویدیویی با صدای اصلی بازیگر در زبان‌های مختلف و تقلید لهجه‌ها یا افراد خاص اشاره کرد. شرکت مایکروسافت برای سهولت آزمایش این مدل، پروفایل‌های صوتی آماده‌ای با نام‌های Andrew، Ava و Brian ارائه داده است.

مایکروسافت مدل صوتی جدید DragonV2.1 را معرفی کرد

03
از 04
نگرانی‌ها درباره دیپ‌فیک و تدابیر امنیتی

با وجود قابلیت‌های پیشرفته، معرفی چنین مدلی نگرانی‌هایی را در خصوص سوءاستفاده برای تولید دیپ‌فیک‌های صوتی به همراه داشته است. مایکروسافت برای مقابله با این تهدیدها، تدابیر امنیتی سخت‌گیرانه‌ای را اعمال کرده است. کاربران برای استفاده از این مدل ملزم به پذیرش سیاست‌های مشخصی هستند، که شامل دریافت رضایت صریح از گوینده اصلی، افشای صراحت محتوای مصنوعی و ممنوعیت هرگونه تقلید یا فریب‌کاری می‌شود.

از سوی دیگر، این شرکت اعلام کرده است که تمام خروجی‌های صوتی تولیدشده توسط DragonV2.1 به‌ صورت خودکار دارای واترمارک دیجیتال نامرئی خواهند بود. به گفته مایکروسافت، این فناوری قادر است با دقت ۹۹.۷ درصدی حتی در صورت ویرایش‌های مختلف صوت، اصالت محتوای تولیدشده را تشخیص دهد.

04
از 04
دسترسی آزمایشی به مدل صوتی جدید مایکروسافت

قابلیت Personal Voice اکنون از طریق Speech Studio به‌ صورت آزمایشی در دسترس است. همچنین شرکت‌ها و توسعه‌دهندگان می‌توانند برای دریافت دسترسی کامل به API جهت استفاده تجاری اقدام کنند.

شرکت مایکروسافت با معرفی DragonV2.1، گام بلندی در مسیر تحول فناوری‌های گفتار مصنوعی و کاربردهای صوتی هوش مصنوعی برداشته است؛ گامی که در عین توانمندی بالا، چالش‌های اخلاقی و امنیتی جدیدی را نیز پیش روی توسعه‌دهندگان و کاربران قرار می‌دهد.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

گوشی هوشمند در دست کاربر با نمایش لوگوی شبکه اجتماعی Threads روی صفحه، پس‌زمینه گرافیکی با رنگ‌های گرادیانی و تکرار نام Threads
پیشنهاد سردبیر

اشتراک پست تردز در استوری اینستاگرام بدون خروج از اپلیکیشن ممکن شد

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
لوگوی OpenAI با طراحی مینیمال به رنگ سبز، نمایش هویت بصری OpenAI و فناوری هوش مصنوعی
اخبار هوش مصنوعی

اولین محصول سخت افزاری OpenAI مشخص شد

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
لوگوی Amazon نصب‌شده روی نمای بیرونی ساختمان، نمایش برند آمازون در محیط شهری
اخبار هوش مصنوعی

عامل قطعی ۱۳ ساعته سرویس AWS مشخص شد

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
تصویر گرافیکی اندروید ۱۷ در کنار لوگوی شیائومی، اشاره به دریافت به‌روزرسانی Android 17 برای دستگاه‌های Xiaomi
رویداد ها

آپدیت اندروید ۱۷ شیائومی هم‌زمان با برگزاری رویداد Google I/O منتشر می‌شود

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
تصویر مفهومی از ارتباط ماهواره‌ای اپل که در آن یک آیفون سیگنال نوری را به یک ماهواره در فضا ارسال می‌کند
اینترنت و شبکه

اپل در حال تولید قابی ویژه برای تقویت اتصال ماهواره‌ای آیفون است

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
خبر بعدی
پیشنهاد ۲۵ میلیون دلاری برای خرید نام کاربری crypto@ در تلگرام

پیشنهاد ۲۵ میلیون دلاری برای خرید نام کاربری crypto@ در تلگرام

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

بیت کوین اتریوم ریپل

چرا قیمت بیت‌کوین، اتریوم و ریپل ریزش سهمگینی را تجربه کردند؟

12 بهمن 1404
نمای نزدیک از گوشه مانیتور یک لپ‌تاپ که ویژگی جدید تب‌های عمودی (Vertical Tabs) در مرورگر کروم را نشان می‌دهد.

کروم با قابلیت «پروژه‌ها» وب‌گردی را متحول می‌کند

24 بهمن 1404

داغ‌ترین‌های روز

مایکروسافت دسترسی به فایل‌های ISO ویندوز ۱۱ را مسدود کرد

مایکروسافت دسترسی به فایل‌های ISO ویندوز ۱۱ را مسدود کرد

28 بهمن 1404 - به‌روزشده در 29 بهمن 1404
بحران کمبود رم

خطر ورشکستگی گسترده در صنعت فناوری؛ بحران کمبود رم قربانی می‌گیرد

28 بهمن 1404
بهترین گوشی های کارکرده

این گوشی‌های کارکرده هنوز ارزش خرید دارند!

26 بهمن 1404 - به‌روزشده در 27 بهمن 1404
تصویر تبلیغاتی و مفهومی از تراشه Exynos 2600 سامسونگ با درخششی آبی‌رنگ در پس‌زمینه تاریک. ذرات نور و جلوه‌های گرافیکی به‌صورت موج‌دار در اطراف تراشه پخش شده‌اند تا قدرت گرافیکی و معماری پردازشی پیشرفته را نمایش دهند. لوگوی 5G روی تراشه و نور مرکزی آن، حس انرژی و فناوری سطح بالا را منتقل می‌کند.

پادشاه جدید گرافیک موبایل؛ درخشش خیره‌کننده تراشه اگزینوس ۲۶۰۰ در رهگیری پرتو

28 بهمن 1404
Coyote Block 3 با سلاح الکترومغناطیسی، دسته پهپادی را در آزمایش ارتش آمریکا سرنگون کر

پهپاد کایوت دسته‌های پهپادی را با سلاح الکترومغناطیسی رهگیری و نابود می‌کند

28 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

گوشی هوشمند در دست کاربر با نمایش لوگوی شبکه اجتماعی Threads روی صفحه، پس‌زمینه گرافیکی با رنگ‌های گرادیانی و تکرار نام Threads

اشتراک پست تردز در استوری اینستاگرام بدون خروج از اپلیکیشن ممکن شد

1 اسفند 1404
لوگوی OpenAI با طراحی مینیمال به رنگ سبز، نمایش هویت بصری OpenAI و فناوری هوش مصنوعی

اولین محصول سخت افزاری OpenAI مشخص شد

1 اسفند 1404
لوگوی Amazon نصب‌شده روی نمای بیرونی ساختمان، نمایش برند آمازون در محیط شهری

عامل قطعی ۱۳ ساعته سرویس AWS مشخص شد

1 اسفند 1404
نمای محیط Notepad جدید در ویندوز با نوار ابزار قالب‌بندی، امکان افزودن تصویر، جدول و متن غنی در ویرایشگر

مایکروسافت پشتیبانی از تصاویر را به نوت پد ویندوز اضافه می‌کند

1 اسفند 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir