• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » شرکت OpenAI هوش مصنوعی Voice Engine را رونمایی کرد

شرکت OpenAI هوش مصنوعی Voice Engine را رونمایی کرد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
شنبه 11 فروردین 1403 - 14:14
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت OpenAI اعلام کرد دسترسی محدودی به یک پلتفرم تولید متن به گفتار به نام Voice Engine ارائه می‌دهد.

به گزارش تکناک، این پلتفرم می‌تواند با استفاده از یک کلیپ ۱۵ ثانیه‌ای از صدای فرد، یک صدای مصنوعی بسازد. صدای تولید‌شده توسط هوش مصنوعی قادر است بر اساس دستورات، متون را به همان زبانی که از آن فرد ضبط شده یا زبان‌های دیگر بخواند.

شرکت OpenAI در وبلاگ خود گفته‌است: «این استقرارهای محدود به ما کمک می‌کند تا رویکرد، ضمانت‌ها و تفکر خود را در مورد چگونگی استفاده از موتور صدا برای اهداف خوب در صنایع مختلف بهبود بخشیم.»

ورج گزارش می‌دهد که شرکت‌هایی که به این فناوری دسترسی دارند شامل شرکت فناوری آموزشی «عصر یادگیری»، پلتفرم داستان‌سرایی تصویری «HeyGen»، سازنده نرم‌افزار سلامت خط مقدم «Dimagi»، سازنده اپلیکیشن ارتباطی با هوش مصنوعی «Livox» و سیستم سلامت «Lifespan» هستند.

در نمونه‌های ارائه‌شده توسط OpenAI، می‌توانید بشنوید که «عصر یادگیری» چگونه از این فناوری برای تولید محتوای از پیش نوشته‌شده برای صداگذاری و همچنین خواندن «پاسخ‌های شخصی‌سازی‌شده در لحظه» برای دانش‌آموزان که توسط GPT-4 نوشته شده‌است، استفاده می‌کند.

ابتدا فایل صوتی مرجع به زبان انگلیسی:

صدای 1

https://technoc.ir/wp-content/uploads/2024/03/OpenAIs-voice-cloning-AI-model-only-needs-a-15-second-sample-to-work-The-Verge.mp3

و در اینجا سه ​​کلیپ صوتی تولید شده توسط هوش مصنوعی بر اساس آن نمونه وجود دارد،

https://technoc.ir/wp-content/uploads/2024/03/age_of_learning_rainforest.mp3 https://technoc.ir/wp-content/uploads/2024/03/age_of_learning_rainforest-1.mp3 https://technoc.ir/wp-content/uploads/2024/03/age_of_learning_reading.mp3

OpenAI اعلام کرد که توسعه « Voice Engine» را از اواخر سال ۲۰۲۲ آغاز کرده است و این فناوری از پیش برای صداهای از پیش تعیین‌شده در API تبدیل متن به گفتار و ویژگی «خواندن با صدای بلند» در ChatGPT مورد استفاده قرار گرفته است. جف هریس، یکی از اعضای تیم محصول OpenAI برای Voice Engine، در مصاحبه‌ای با TechCrunch گفت که این مدل روی «مجموعه‌ای از داده‌های مجوزدار و در دسترس عموم» آموزش دیده است. OpenAI به این نشریه گفت که این مدل فقط برای حدود ۱۰ توسعه‌دهنده در دسترس خواهد بود.

تولید متن به صدا با هوش مصنوعی، حوزه‌ای از هوش مصنوعی تولیدکننده است که همچنان در حال پیشرفت است. در حالی که اکثر آن‌ها روی صداهای سازی یا صداهای طبیعی تمرکز دارند، تعداد کمتری روی تولید صدا تمرکز کرده‌اند. برخی از نام‌های فعال در این زمینه شامل شرکت‌هایی مانند Podcastle و ElevenLabs هستند که فناوری شبیه‌سازی صدای هوش مصنوعی و ابزارهایی را ارائه می‌دهند که Vergecast سال گذشته به آن‌ها پرداخته است.

در همین حال، دولت ایالات متحده در تلاش است تا از کاربردهای غیر اخلاقی فناوری صدای هوش مصنوعی جلوگیری کند. ماه گذشته، کمیسیون ارتباطات فدرال پس از دریافت تماس‌های اسپم از صدای شبیه‌سازی‌شده هوش مصنوعی رئیس جمهور جو بایدن، تماس‌های خودکار با صدای هوش مصنوعی را ممنوع کرد.

بر اساس گفته‌های OpenAI، شرکای آن‌ها با خط‌مشی‌های استفاده‌ موافقت کرده‌اند که می‌گوید بدون رضایت افراد یا سازمان‌ها از Voice Generation برای جعل هویت آن‌ها استفاده نخواهند کرد. این شرایط همچنین نیازمند آن است که شرکا «رضایت صریح و آگاهانه» فرد اصلی را جلب کنند، نه اینکه راه‌هایی برای کاربران عادی برای ایجاد صدای خودشان ایجاد کنند و به شنوندگان اطلاع دهند که صداها توسط هوش مصنوعی تولید شده‌اند. OpenAI همچنین برای ردیابی منشأ صداها، از واترمارک در کلیپ‌های صوتی استفاده کرده و به طور فعال نحوه استفاده از صدا را کنترل می‌کند.

OpenAI چندین قدم را پیشنهاد کرد که فکر می‌کند می‌تواند ریسک‌های مرتبط با چنین ابزارهایی را محدود کند، از جمله حذف تدریجی احراز هویت مبتنی بر صدا برای دسترسی به حساب‌های بانکی، سیاست‌هایی برای محافظت از استفاده از صدای افراد در هوش مصنوعی، آموزش بیشتر در مورد دیپ‌فیک‌های هوش مصنوعی و توسعه سیستم‌های ردیابی محتوای هوش مصنوعی.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

شرکت OpenAI امکان تنظیم میزان صمیمیت و لحن ChatGPT را برای کاربران فعال کرد
اخبار هوش مصنوعی

شرکت OpenAI امکان تنظیم میزان صمیمیت و لحن ChatGPT را برای کاربران فعال کرد

نوشته شده توسط سید محمد برازنده
29 آذر 1404
جهش بزرگ در تعامل صوتی؛ مکالمه فارسی روان به چت‌بات گروک اضافه شد
اخبار هوش مصنوعی

جهش بزرگ در تعامل صوتی؛ مکالمه فارسی روان به چت‌بات گروک اضافه شد

نوشته شده توسط سید محمد برازنده
29 آذر 1404
درمان تنبلی چشم پس از کودکی ممکن شد
پیشنهاد سردبیر

درمان تنبلی چشم پس از کودکی ممکن شد

نوشته شده توسط مانی
29 آذر 1404
رهگیر الکتریکی ضدپهپاد Allag-E؛ سلاح جدید برای شکار پهپادها در آسمان
پیشنهاد سردبیر

رهگیر الکتریکی ضدپهپاد Allag-E رونمایی شد

نوشته شده توسط نرگس چالوک
29 آذر 1404
آزمایشگاه ۵ هزار متری شیائومی؛ گام تازه برای افزایش دقت پوشیدنی‌‌های هوشمند
فناوری

آزمایشگاه ۵ هزار متری شیائومی؛ گام تازه برای افزایش دقت پوشیدنی‌‌های هوشمند + تصویر

نوشته شده توسط سید محمد برازنده
29 آذر 1404
خبر بعدی

6 برنامه ضروری برای بازی در رایانه شخصی

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

تشخیص سیگنال کاذب

چطور سیگنال‌های اشتباه را در بازار کریپتو تشخیص دهیم؟

9 آذر 1404
عکس از گوشی آیفون که صفحه چت ChatGPT و تصویر نقاشی شده یک گربه را نشان می‌دهد.

نسخه جدید ابزار تولید تصویر ChatGPT Images منتشر شد

25 آذر 1404

داغ‌ترین‌های روز

پوستر تبلیغاتی ساعت Rogbid در طبیعت که قابلیت چراغ‌قوه جانبی و مسیریابی روی صفحه آن فعال است.

ساعت هوشمند راگبید Enduro با باتری ۱۱۰۰ میلی‌آمپر ساعتی عرضه شد

24 آذر 1404 - به‌روزشده در 25 آذر 1404
نمای نزدیک از ساعت هوشمند Huawei Watch نسخه دهمین سالگرد با بدنه فلزی، تاج چرخان و صفحه نمایش دایره‌ای حاوی ویجت‌ های سلامت و زمان، تمرکز بر طراحی پریمیوم و رابط کاربری پیشرفته

هواوی نسخه دهمین سالگرد هواوی واچ را هم‌زمان با نوا ۱۵ معرفی می‌کند

26 آذر 1404
تصویر یک تولیدکننده محتوای نگران را نشان می‌دهد که مقابل مانیتور با نمودار درآمد در حال سقوط و لوگوی یوتیوب نشسته است و کاهش شدید درآمد تبلیغاتی را به‌صورت نمادین نمایش می‌دهد.

زلزله در یوتیوب فارسی؛ سقوط ۹۰ درصدی درآمد تولیدکنندگان محتوا

26 آذر 1404
اگر ارزش صندوق‌های ETF ریپل (XRP) به ۱۰ میلیارد دلار برسند چه اتفاقی می‌افتد؟

اگر ارزش صندوق‌های ETF ریپل (XRP) به ۱۰ میلیارد دلار برسند چه اتفاقی می‌افتد؟

23 آذر 1404 - به‌روزشده در 24 آذر 1404
شیائومی شروع به انتشار به‌روزرسانی امنیتی دسامبر ۲۰۲۵ کرد

شیائومی انتشار به‌روزرسانی امنیتی دسامبر ۲۰۲۵ HyperOS را آغاز کرد

24 آذر 1404 - به‌روزشده در 25 آذر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

نسل جدید پردازنده‌های گرافیکی گیمینگ و هوش مصنوعی رونمایی شدند

نسل جدید پردازنده‌های گرافیکی گیمینگ و هوش مصنوعی رونمایی شدند

29 آذر 1404
شرکت OpenAI امکان تنظیم میزان صمیمیت و لحن ChatGPT را برای کاربران فعال کرد

شرکت OpenAI امکان تنظیم میزان صمیمیت و لحن ChatGPT را برای کاربران فعال کرد

29 آذر 1404
کشف میکروب‌های آتشفشانی و احتمال حیات روی مریخ!

کشف میکروب‌های آتشفشانی و احتمال حیات روی مریخ!

29 آذر 1404
جهش بزرگ در تعامل صوتی؛ مکالمه فارسی روان به چت‌بات گروک اضافه شد

جهش بزرگ در تعامل صوتی؛ مکالمه فارسی روان به چت‌بات گروک اضافه شد

29 آذر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir