• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » شرکت OpenAI مدل های صوتی جدید هوش مصنوعی را معرفی کرد

شرکت OpenAI مدل های صوتی جدید هوش مصنوعی را معرفی کرد

سید محمد برازنده نوشته شده توسط سید محمد برازنده
شنبه 19 اردیبهشت 1405 - 12:45
در اخبار هوش مصنوعی, فناوری
شرکت OpenAI مدل های صوتی جدید هوش مصنوعی را معرفی کرد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. مدل صوتی GPT-Realtime-2 شرکت OpenAI
  • 2. مدل صوتی GPT-Realtime-Translate شرکت OpenAI
  • 3. مدل صوتی GPT-Realtime-Whisper شرکت OpenAI
  • 4. صدا به‌ عنوان رابط نرم‌افزار
  • 5. الگوهای نوظهور در هوش صوتی
  • 6. ایمنی و الزامات
  • 7. قیمت و دسترسی
  • 8. شروع به کار سه مدل صوتی جدید OpenAI

شرکت OpenAI سه مدل صوتی جدید هوش مصنوعی را در API خود معرفی کرده است تا توسعه‌دهندگان، نسل تازه‌ای از اپلیکیشن‌های مبتنی بر صدا ایجاد کنند.

به گزارش سرویس هوش مصنوعی تک‌ناک، این مدل‌ها با هدف طبیعی‌تر کردن تعاملات صوتی، درک بهتر زمینه گفت‌وگو و انجام اقدامات در زمان واقعی طراحی شده‌اند.

این سه مدل شامل GPT-Realtime-2، GPT-Realtime-Translate و GPT-Realtime-Whisper هستند که سیستم‌های صوتی را از حالت ساده پرسش و پاسخ به تعاملات پیوسته و شبیه عامل هوشمند ارتقا می‌دهند؛ به‌گونه‌ای که قادر به شنیدن، تحلیل، ترجمه، تبدیل گفتار به متن و اقدام هم‌زمان در جریان مکالمه هستند.

بر اساس گزارش fonearena، این مدل‌ها گامی مهم در تبدیل تعاملات صوتی به تجربه‌ای هوشمند و سریع محسوب می‌شوند.

01
از 08
مدل صوتی GPT-Realtime-2 شرکت OpenAI

GPT-Realtime-2 نخستین مدل صوتی OpenAI با توان استدلال در سطح GPT-5 است که برای مکالمات زنده طراحی شده است. این مدل از تعاملات پیچیده پشتیبانی می‌کند و می‌تواند هم‌زمان با ادامه گفت‌وگو، فکر کند، پاسخ دهد و از ابزارها استفاده کند.

این مدل برای موقعیت‌هایی طراحی شده است که پاسخ، اقدام و استدلال باید بدون وقفه در جریان مکالمه انجام شوند.

قابلیت‌های کلیدی

  • پردازش درخواست‌های صوتی چندمرحله‌ای در زمان واقعی
  • حفظ جریان پیوسته مکالمه با درک زمینه
  • استفاده از ابزارها بدون اختلال در گفت‌وگو
  • پشتیبانی از جملات مقدماتی گفتاری
  • اجرای هم‌زمان چند ابزار با اطلاع‌رسانی صوتی
  • بهبود بازیابی خطا با پاسخ‌های طبیعی
  • افزایش پنجره زمینه از 32K به 128K
  • درک بهتر اصطلاحات تخصصی و اسامی خاص
  • پشتیبانی از تنظیم لحن
  • سطوح مختلف استدلال قابل تنظیم

بهبود عملکرد

  • بهبود 15.2 درصدی در Big Bench Audio نسبت به نسخه قبلی
  • بهبود 13.8 درصدی در Audio MultiChallenge

02
از 08
مدل صوتی GPT-Realtime-Translate شرکت OpenAI

این مدل امکان ارتباط صوتی چندزبانه در زمان واقعی را فراهم می‌کند و گفتار را با حفظ معنا و ریتم، به‌ صورت آنی ترجمه می‌کند. همچنین قابلیت رونویسی هم‌زمان را دارد.

این سیستم برای حفظ دقت در شرایط گفتار طبیعی مانند وقفه‌ها، لهجه‌ها و تغییر زمینه طراحی شده است.

قابلیت‌های کلیدی

  • پشتیبانی از بیش از 70 زبان ورودی
  • خروجی در 13 زبان
  • ترجمه هم‌زمان گفتار با حفظ معنا
  • رونویسی زنده در کنار ترجمه
  • پشتیبانی از لهجه‌ها و اصطلاحات تخصصی
  • حفظ روانی در گفتار طبیعی

کاربردها

  • پشتیبانی مشتری چندزبانه
  • آموزش و کلاس‌های درس
  • ارتباطات بین‌المللی
  • رسانه و رویدادها

برای نمونه، Deutsche Telekom در حال آزمایش این فناوری برای مکالمات چندزبانه با تأخیر کم است.

03
از 08
مدل صوتی GPT-Realtime-Whisper شرکت OpenAI

این مدل یک سیستم تبدیل گفتار به متن با تأخیر پایین است که می‌تواند هم‌زمان با صحبت، متن تولید کند و درک بلادرنگ را ممکن سازد.

این قابلیت امکان استفاده فوری از داده‌های صوتی را در جریان کار فراهم می‌کند.

قابلیت‌های کلیدی این مدل صوتی OpenAI

  • رونویسی در لحظه
  • زیرنویس زنده با تأخیر کم
  • درک پیوسته مکالمات
  • مناسب برای اپلیکیشن‌های واکنش‌گرا

کاربردها

  • یادداشت‌برداری جلسات
  • آموزش
  • پخش زنده
  • پشتیبانی مشتری
  • سیستم‌های سلامت و فروش

04
از 08
صدا به‌ عنوان رابط نرم‌افزار

شرکت OpenAI تأکید کرده که صدا یکی از طبیعی‌ترین روش‌های تعامل با نرم‌افزار است و به کاربران امکان انجام کارها بدون نیاز به تایپ را می‌دهد.

با وجود این، یک سیستم صوتی مؤثر باید بتواند:

  • هدف کاربر را درک کند.
  • با تغییرات مکالمه سازگار شود.
  • هم‌زمان از ابزارها استفاده کند.
  • در برابر خطاها به‌ خوبی بازیابی شود.
  • متناسب با شرایط پاسخ دهد.

05
از 08
الگوهای نوظهور در هوش صوتی

شرکت OpenAI سه الگوی کلیدی را معرفی می‌کند:

  • Voice-to-action: اجرای وظایف بر اساس دستور صوتی
  • Systems-to-voice: تبدیل داده‌های سیستم به راهنمای صوتی
  • Voice-to-voice: مکالمه چندزبانه در زمان واقعی

06
از 08
ایمنی و الزامات

این API دارای لایه‌های مختلف ایمنی است، که از جمله آنها می‌توان به موارد زیر اشاره کرد:

  • پایش زنده مکالمات
  • امکان افزودن محافظت‌های بیشتر توسط توسعه‌دهندگان
  • ممنوعیت سوءاستفاده و فریب
  • الزام به اطلاع‌رسانی درباره تعامل با AI
  • پشتیبانی از قوانین داده اتحادیه اروپا

07
از 08
قیمت و دسترسی

این مدل‌ها از طریق Realtime API در دسترس هستند.

  • GPT-Realtime-2: هزینه بر اساس توکن‌های صوتی
  • GPT-Realtime-Translate: هر دقیقه 0.034 دلار
  • GPT-Realtime-Whisper: هر دقیقه 0.017 دلار

08
از 08
شروع به کار سه مدل صوتی جدید OpenAI

توسعه‌دهندگان می‌توانند این مدل‌ها را در OpenAI Playground آزمایش کنند و از طریق ابزارهایی مانند Codex در اپلیکیشن‌های خود پیاده‌سازی نمایند.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

موج توسعه جمنای در کروم به خاورمیانه و آمریکای لاتین رسید
اخبار هوش مصنوعی

موج توسعه جمنای در کروم به خاورمیانه و آمریکای لاتین رسید

نوشته شده توسط سید محمد برازنده
23 خرداد 1405
ابزار جدید دیزر برای تشخیص موسیقی
اخبار هوش مصنوعی

این ابزار جدید آهنگ‌های ساخته‌شده با هوش مصنوعی را شناسایی می‌کند

نوشته شده توسط سید محمد برازنده
23 خرداد 1405
پودر قهوه آسیاب‌شده داخل پرتافیلتر فلزی در کنار دانه‌های قهوه روی سطح تیره برای نمایش آماده‌سازی اسپرسو.
پیشنهاد سردبیر

انقلاب در صنعت قهوه؛ تولید اسپرسو با امواج فراصوت

نوشته شده توسط نرگس چالوک
23 خرداد 1405
نسل جدید هوش مصنوعی OpenAI این ماه معرفی می‌شود
اخبار هوش مصنوعی

هوش مصنوعی GPT-5.6 بزودی عرضه می‌شود

نوشته شده توسط سید محمد برازنده
23 خرداد 1405
پهپاد رهگیر Cobra 600 آلمان معرفی شد
پیشنهاد سردبیر

پهپاد رهگیر Cobra 600 آلمان معرفی شد + تصویر

نوشته شده توسط نرگس چالوک
23 خرداد 1405
خبر بعدی
ترفند جدید مایکروسافت برای افزایش سرعت ویندوز ۱۱

ترفند جدید مایکروسافت برای افزایش سرعت ویندوز ۱۱

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

شهروندان در حال تماشای ستون عظیم دود و آتش ناشی از انفجار در یک منطقه شهری در شب

جنگ هسته‌ای هند و پاکستان می‌تواند لایه اوزون را نابود کند

23 خرداد 1405
فیفا هوش مصنوعی را به نیمکت تیم‌های جام جهانی آورد

فیفا هوش مصنوعی را به نیمکت تیم‌های جام جهانی آورد

17 خرداد 1405

داغ‌ترین‌های روز

مقایسه F-35 و Su-57؛ کدام جنگنده نسل پنجم برتری دارد؟

مقایسه F-35 و Su-57؛ کدام جنگنده نسل پنجم برتری دارد؟

22 خرداد 1405 - به‌روزشده در 23 خرداد 1405
نصب موتور Pratt & Whitney F135 روی نخستین جنگنده رادارگریز F-35A آلمان در خط مونتاژ نهایی شرکت Lockheed Martin

نخستین جنگنده F-35A آلمان وارد مرحله نهایی تولید شد

16 خرداد 1405 - به‌روزشده در 17 خرداد 1405
انواع تیپ های سورن پلاس

معرفی انواع تیپ های سورن پلاس ؛ کدام مدل خودرو ارزش خرید بالاتری دارد؟

22 خرداد 1405 - به‌روزشده در 23 خرداد 1405
نخستین جنگنده دوکابینه Gripen F جهان رونمایی شد

نخستین جنگنده دوکابینه Gripen F جهان رونمایی شد

19 خرداد 1405 - به‌روزشده در 20 خرداد 1405
آیفون 17 پرو مکس سفارشی کاویار با طراحی الهام‌گرفته از ساعت‌های نجومی لوکس در جعبه اختصاصی آبی‌رنگ.

آیفون 17 پرومکس کاویار با محفظه اختصاصی ساعت سوئیسی رونمایی شد

16 خرداد 1405 - به‌روزشده در 17 خرداد 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

اختلال در خدمات چهار بانک؛ حمله سایبری رد شد

اختلال در خدمات چهار بانک؛ حمله سایبری رد شد

23 خرداد 1405
پژو E-208 GTi با ۲۷۸ اسب‌بخار قدرت از راه رسید

پژو E-208 GTi با ۲۷۸ اسب‌بخار قدرت از راه رسید + تصویر

23 خرداد 1405
موج توسعه جمنای در کروم به خاورمیانه و آمریکای لاتین رسید

موج توسعه جمنای در کروم به خاورمیانه و آمریکای لاتین رسید

23 خرداد 1405
طرح مفهومی بدنه مقاوم آیفون جدید

اپل آیفون ۱۸ پرو را مقاوم‌تر از گذشته می‌سازد

23 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir