• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » دسته‌بندی نشده » شرکت OpenAI مدل های صوتی جدید هوش مصنوعی را معرفی کرد

شرکت OpenAI مدل های صوتی جدید هوش مصنوعی را معرفی کرد

سید محمد برازنده نوشته شده توسط سید محمد برازنده
شنبه 19 اردیبهشت 1405 - 12:45
در اخبار هوش مصنوعی, فناوری
شرکت OpenAI مدل های صوتی جدید هوش مصنوعی را معرفی کرد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. مدل صوتی GPT-Realtime-2 شرکت OpenAI
  • 2. مدل صوتی GPT-Realtime-Translate شرکت OpenAI
  • 3. مدل صوتی GPT-Realtime-Whisper شرکت OpenAI
  • 4. صدا به‌ عنوان رابط نرم‌افزار
  • 5. الگوهای نوظهور در هوش صوتی
  • 6. ایمنی و الزامات
  • 7. قیمت و دسترسی
  • 8. شروع به کار سه مدل صوتی جدید OpenAI

شرکت OpenAI سه مدل صوتی جدید هوش مصنوعی را در API خود معرفی کرده است تا توسعه‌دهندگان، نسل تازه‌ای از اپلیکیشن‌های مبتنی بر صدا ایجاد کنند.

به گزارش سرویس هوش مصنوعی تک‌ناک، این مدل‌ها با هدف طبیعی‌تر کردن تعاملات صوتی، درک بهتر زمینه گفت‌وگو و انجام اقدامات در زمان واقعی طراحی شده‌اند.

این سه مدل شامل GPT-Realtime-2، GPT-Realtime-Translate و GPT-Realtime-Whisper هستند که سیستم‌های صوتی را از حالت ساده پرسش و پاسخ به تعاملات پیوسته و شبیه عامل هوشمند ارتقا می‌دهند؛ به‌گونه‌ای که قادر به شنیدن، تحلیل، ترجمه، تبدیل گفتار به متن و اقدام هم‌زمان در جریان مکالمه هستند.

بر اساس گزارش fonearena، این مدل‌ها گامی مهم در تبدیل تعاملات صوتی به تجربه‌ای هوشمند و سریع محسوب می‌شوند.

01
از 08
مدل صوتی GPT-Realtime-2 شرکت OpenAI

GPT-Realtime-2 نخستین مدل صوتی OpenAI با توان استدلال در سطح GPT-5 است که برای مکالمات زنده طراحی شده است. این مدل از تعاملات پیچیده پشتیبانی می‌کند و می‌تواند هم‌زمان با ادامه گفت‌وگو، فکر کند، پاسخ دهد و از ابزارها استفاده کند.

این مدل برای موقعیت‌هایی طراحی شده است که پاسخ، اقدام و استدلال باید بدون وقفه در جریان مکالمه انجام شوند.

قابلیت‌های کلیدی

  • پردازش درخواست‌های صوتی چندمرحله‌ای در زمان واقعی
  • حفظ جریان پیوسته مکالمه با درک زمینه
  • استفاده از ابزارها بدون اختلال در گفت‌وگو
  • پشتیبانی از جملات مقدماتی گفتاری
  • اجرای هم‌زمان چند ابزار با اطلاع‌رسانی صوتی
  • بهبود بازیابی خطا با پاسخ‌های طبیعی
  • افزایش پنجره زمینه از 32K به 128K
  • درک بهتر اصطلاحات تخصصی و اسامی خاص
  • پشتیبانی از تنظیم لحن
  • سطوح مختلف استدلال قابل تنظیم

بهبود عملکرد

  • بهبود 15.2 درصدی در Big Bench Audio نسبت به نسخه قبلی
  • بهبود 13.8 درصدی در Audio MultiChallenge

02
از 08
مدل صوتی GPT-Realtime-Translate شرکت OpenAI

این مدل امکان ارتباط صوتی چندزبانه در زمان واقعی را فراهم می‌کند و گفتار را با حفظ معنا و ریتم، به‌ صورت آنی ترجمه می‌کند. همچنین قابلیت رونویسی هم‌زمان را دارد.

این سیستم برای حفظ دقت در شرایط گفتار طبیعی مانند وقفه‌ها، لهجه‌ها و تغییر زمینه طراحی شده است.

قابلیت‌های کلیدی

  • پشتیبانی از بیش از 70 زبان ورودی
  • خروجی در 13 زبان
  • ترجمه هم‌زمان گفتار با حفظ معنا
  • رونویسی زنده در کنار ترجمه
  • پشتیبانی از لهجه‌ها و اصطلاحات تخصصی
  • حفظ روانی در گفتار طبیعی

کاربردها

  • پشتیبانی مشتری چندزبانه
  • آموزش و کلاس‌های درس
  • ارتباطات بین‌المللی
  • رسانه و رویدادها

برای نمونه، Deutsche Telekom در حال آزمایش این فناوری برای مکالمات چندزبانه با تأخیر کم است.

03
از 08
مدل صوتی GPT-Realtime-Whisper شرکت OpenAI

این مدل یک سیستم تبدیل گفتار به متن با تأخیر پایین است که می‌تواند هم‌زمان با صحبت، متن تولید کند و درک بلادرنگ را ممکن سازد.

این قابلیت امکان استفاده فوری از داده‌های صوتی را در جریان کار فراهم می‌کند.

قابلیت‌های کلیدی این مدل صوتی OpenAI

  • رونویسی در لحظه
  • زیرنویس زنده با تأخیر کم
  • درک پیوسته مکالمات
  • مناسب برای اپلیکیشن‌های واکنش‌گرا

کاربردها

  • یادداشت‌برداری جلسات
  • آموزش
  • پخش زنده
  • پشتیبانی مشتری
  • سیستم‌های سلامت و فروش

04
از 08
صدا به‌ عنوان رابط نرم‌افزار

شرکت OpenAI تأکید کرده که صدا یکی از طبیعی‌ترین روش‌های تعامل با نرم‌افزار است و به کاربران امکان انجام کارها بدون نیاز به تایپ را می‌دهد.

با وجود این، یک سیستم صوتی مؤثر باید بتواند:

  • هدف کاربر را درک کند.
  • با تغییرات مکالمه سازگار شود.
  • هم‌زمان از ابزارها استفاده کند.
  • در برابر خطاها به‌ خوبی بازیابی شود.
  • متناسب با شرایط پاسخ دهد.

05
از 08
الگوهای نوظهور در هوش صوتی

شرکت OpenAI سه الگوی کلیدی را معرفی می‌کند:

  • Voice-to-action: اجرای وظایف بر اساس دستور صوتی
  • Systems-to-voice: تبدیل داده‌های سیستم به راهنمای صوتی
  • Voice-to-voice: مکالمه چندزبانه در زمان واقعی

06
از 08
ایمنی و الزامات

این API دارای لایه‌های مختلف ایمنی است، که از جمله آنها می‌توان به موارد زیر اشاره کرد:

  • پایش زنده مکالمات
  • امکان افزودن محافظت‌های بیشتر توسط توسعه‌دهندگان
  • ممنوعیت سوءاستفاده و فریب
  • الزام به اطلاع‌رسانی درباره تعامل با AI
  • پشتیبانی از قوانین داده اتحادیه اروپا

07
از 08
قیمت و دسترسی

این مدل‌ها از طریق Realtime API در دسترس هستند.

  • GPT-Realtime-2: هزینه بر اساس توکن‌های صوتی
  • GPT-Realtime-Translate: هر دقیقه 0.034 دلار
  • GPT-Realtime-Whisper: هر دقیقه 0.017 دلار

08
از 08
شروع به کار سه مدل صوتی جدید OpenAI

توسعه‌دهندگان می‌توانند این مدل‌ها را در OpenAI Playground آزمایش کنند و از طریق ابزارهایی مانند Codex در اپلیکیشن‌های خود پیاده‌سازی نمایند.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

هوش مصنوعی کدکس OpenAI به مرورگر کروم اضافه شد
اخبار هوش مصنوعی

هوش مصنوعی کدکس OpenAI به مرورگر کروم اضافه شد

نوشته شده توسط سید محمد برازنده
19 اردیبهشت 1405
آغاز توسعه عامل هوشمند متا
اخبار هوش مصنوعی

متا با هوش مصنوعی Hatch، اینستاگرام را متحول می کند

نوشته شده توسط سید محمد برازنده
19 اردیبهشت 1405
پیشنهاد سردبیر

ترکیه از یک موتور جت نظامی جدید رونمایی کرد

نوشته شده توسط نرگس چالوک
19 اردیبهشت 1405
چاپ سه‌بعدی سوخت موشک؛ پایان قالب‌گیری سنتی پس از ۶۰ سال
فناوری

چاپ سه‌بعدی سوخت موشک؛ پایان قالب‌گیری سنتی پس از ۶۰ سال

نوشته شده توسط نرگس چالوک
19 اردیبهشت 1405
بازی Eve Online به آزمایشگاه یادگیری هوش مصنوعی گوگل تبدیل می‌ شود
اخبار هوش مصنوعی

بازی Eve Online به آزمایشگاه یادگیری هوش مصنوعی گوگل تبدیل می‌ شود

نوشته شده توسط تارخ ترهنده
19 اردیبهشت 1405
خبر بعدی
ترفند جدید مایکروسافت برای افزایش سرعت ویندوز ۱۱

ترفند جدید مایکروسافت برای افزایش سرعت ویندوز ۱۱

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

راهنمای کامل استفاده از میرورهای داخلی برای توسعه‌دهندگان در شرایط اختلال اینترنت

18 اردیبهشت 1405 - به‌روزشده در 19 اردیبهشت 1405
ایرپادهای دوربین دار اپل، تنها یک گام تا نهایی شدن فاصه دارند

ایرپادهای دوربین دار اپل، یک گام تا عرضه به بازار

19 اردیبهشت 1405

داغ‌ترین‌های روز

 پروتکل VLESS چیست و چه کاربردهایی دارد؟

25 آذر 1402 - به‌روزشده در 27 مهر 1404
وب‌سایت رسمی انتشار اسناد یوفوها راه‌اندازی شد

وب‌سایت رسمی انتشار اسناد یوفوها راه‌اندازی شد

19 اردیبهشت 1405
هندزفری بلوتوثی

بهترین هندزفری بلوتوثی بازار تا ۳ میلیون تومان

30 دی 1403 - به‌روزشده در 21 اردیبهشت 1404
برنامه Google Earth با قابلیت‌ های متنوع و جذاب خود، امکانات وسیعی را برای مشاهده اماکن و نقشه‌ های قدیمی برای کاربران به ارمغان می‌آورد.

سفر به گذشته با Google Earth

17 فروردین 1403 - به‌روزشده در 27 مهر 1404

زیردریایی انتحاری بدون‌سرنشین جدید ترکیه رونمایی شد

17 اردیبهشت 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

ایرپادهای دوربین دار اپل، تنها یک گام تا نهایی شدن فاصه دارند

ایرپادهای دوربین دار اپل، یک گام تا عرضه به بازار

19 اردیبهشت 1405
هوش مصنوعی کدکس OpenAI به مرورگر کروم اضافه شد

هوش مصنوعی کدکس OpenAI به مرورگر کروم اضافه شد

19 اردیبهشت 1405
وام ساخت نیروگاه خورشیدی خانگی امسال چقدر است؟

وام ساخت نیروگاه خورشیدی خانگی امسال چقدر است؟

19 اردیبهشت 1405
پلتفرم یکپارچه Google Health معرفی شد

پلتفرم یکپارچه Google Health معرفی شد

19 اردیبهشت 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir