• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » شرکت OpenAI مدل های صوتی جدید هوش مصنوعی را معرفی کرد

شرکت OpenAI مدل های صوتی جدید هوش مصنوعی را معرفی کرد

سید محمد برازنده نوشته شده توسط سید محمد برازنده
شنبه 19 اردیبهشت 1405 - 12:45
در اخبار هوش مصنوعی, فناوری
شرکت OpenAI مدل های صوتی جدید هوش مصنوعی را معرفی کرد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. مدل صوتی GPT-Realtime-2 شرکت OpenAI
  • 2. مدل صوتی GPT-Realtime-Translate شرکت OpenAI
  • 3. مدل صوتی GPT-Realtime-Whisper شرکت OpenAI
  • 4. صدا به‌ عنوان رابط نرم‌افزار
  • 5. الگوهای نوظهور در هوش صوتی
  • 6. ایمنی و الزامات
  • 7. قیمت و دسترسی
  • 8. شروع به کار سه مدل صوتی جدید OpenAI

شرکت OpenAI سه مدل صوتی جدید هوش مصنوعی را در API خود معرفی کرده است تا توسعه‌دهندگان، نسل تازه‌ای از اپلیکیشن‌های مبتنی بر صدا ایجاد کنند.

به گزارش سرویس هوش مصنوعی تک‌ناک، این مدل‌ها با هدف طبیعی‌تر کردن تعاملات صوتی، درک بهتر زمینه گفت‌وگو و انجام اقدامات در زمان واقعی طراحی شده‌اند.

این سه مدل شامل GPT-Realtime-2، GPT-Realtime-Translate و GPT-Realtime-Whisper هستند که سیستم‌های صوتی را از حالت ساده پرسش و پاسخ به تعاملات پیوسته و شبیه عامل هوشمند ارتقا می‌دهند؛ به‌گونه‌ای که قادر به شنیدن، تحلیل، ترجمه، تبدیل گفتار به متن و اقدام هم‌زمان در جریان مکالمه هستند.

بر اساس گزارش fonearena، این مدل‌ها گامی مهم در تبدیل تعاملات صوتی به تجربه‌ای هوشمند و سریع محسوب می‌شوند.

01
از 08
مدل صوتی GPT-Realtime-2 شرکت OpenAI

GPT-Realtime-2 نخستین مدل صوتی OpenAI با توان استدلال در سطح GPT-5 است که برای مکالمات زنده طراحی شده است. این مدل از تعاملات پیچیده پشتیبانی می‌کند و می‌تواند هم‌زمان با ادامه گفت‌وگو، فکر کند، پاسخ دهد و از ابزارها استفاده کند.

این مدل برای موقعیت‌هایی طراحی شده است که پاسخ، اقدام و استدلال باید بدون وقفه در جریان مکالمه انجام شوند.

قابلیت‌های کلیدی

  • پردازش درخواست‌های صوتی چندمرحله‌ای در زمان واقعی
  • حفظ جریان پیوسته مکالمه با درک زمینه
  • استفاده از ابزارها بدون اختلال در گفت‌وگو
  • پشتیبانی از جملات مقدماتی گفتاری
  • اجرای هم‌زمان چند ابزار با اطلاع‌رسانی صوتی
  • بهبود بازیابی خطا با پاسخ‌های طبیعی
  • افزایش پنجره زمینه از 32K به 128K
  • درک بهتر اصطلاحات تخصصی و اسامی خاص
  • پشتیبانی از تنظیم لحن
  • سطوح مختلف استدلال قابل تنظیم

بهبود عملکرد

  • بهبود 15.2 درصدی در Big Bench Audio نسبت به نسخه قبلی
  • بهبود 13.8 درصدی در Audio MultiChallenge

02
از 08
مدل صوتی GPT-Realtime-Translate شرکت OpenAI

این مدل امکان ارتباط صوتی چندزبانه در زمان واقعی را فراهم می‌کند و گفتار را با حفظ معنا و ریتم، به‌ صورت آنی ترجمه می‌کند. همچنین قابلیت رونویسی هم‌زمان را دارد.

این سیستم برای حفظ دقت در شرایط گفتار طبیعی مانند وقفه‌ها، لهجه‌ها و تغییر زمینه طراحی شده است.

قابلیت‌های کلیدی

  • پشتیبانی از بیش از 70 زبان ورودی
  • خروجی در 13 زبان
  • ترجمه هم‌زمان گفتار با حفظ معنا
  • رونویسی زنده در کنار ترجمه
  • پشتیبانی از لهجه‌ها و اصطلاحات تخصصی
  • حفظ روانی در گفتار طبیعی

کاربردها

  • پشتیبانی مشتری چندزبانه
  • آموزش و کلاس‌های درس
  • ارتباطات بین‌المللی
  • رسانه و رویدادها

برای نمونه، Deutsche Telekom در حال آزمایش این فناوری برای مکالمات چندزبانه با تأخیر کم است.

03
از 08
مدل صوتی GPT-Realtime-Whisper شرکت OpenAI

این مدل یک سیستم تبدیل گفتار به متن با تأخیر پایین است که می‌تواند هم‌زمان با صحبت، متن تولید کند و درک بلادرنگ را ممکن سازد.

این قابلیت امکان استفاده فوری از داده‌های صوتی را در جریان کار فراهم می‌کند.

قابلیت‌های کلیدی این مدل صوتی OpenAI

  • رونویسی در لحظه
  • زیرنویس زنده با تأخیر کم
  • درک پیوسته مکالمات
  • مناسب برای اپلیکیشن‌های واکنش‌گرا

کاربردها

  • یادداشت‌برداری جلسات
  • آموزش
  • پخش زنده
  • پشتیبانی مشتری
  • سیستم‌های سلامت و فروش

04
از 08
صدا به‌ عنوان رابط نرم‌افزار

شرکت OpenAI تأکید کرده که صدا یکی از طبیعی‌ترین روش‌های تعامل با نرم‌افزار است و به کاربران امکان انجام کارها بدون نیاز به تایپ را می‌دهد.

با وجود این، یک سیستم صوتی مؤثر باید بتواند:

  • هدف کاربر را درک کند.
  • با تغییرات مکالمه سازگار شود.
  • هم‌زمان از ابزارها استفاده کند.
  • در برابر خطاها به‌ خوبی بازیابی شود.
  • متناسب با شرایط پاسخ دهد.

05
از 08
الگوهای نوظهور در هوش صوتی

شرکت OpenAI سه الگوی کلیدی را معرفی می‌کند:

  • Voice-to-action: اجرای وظایف بر اساس دستور صوتی
  • Systems-to-voice: تبدیل داده‌های سیستم به راهنمای صوتی
  • Voice-to-voice: مکالمه چندزبانه در زمان واقعی

06
از 08
ایمنی و الزامات

این API دارای لایه‌های مختلف ایمنی است، که از جمله آنها می‌توان به موارد زیر اشاره کرد:

  • پایش زنده مکالمات
  • امکان افزودن محافظت‌های بیشتر توسط توسعه‌دهندگان
  • ممنوعیت سوءاستفاده و فریب
  • الزام به اطلاع‌رسانی درباره تعامل با AI
  • پشتیبانی از قوانین داده اتحادیه اروپا

07
از 08
قیمت و دسترسی

این مدل‌ها از طریق Realtime API در دسترس هستند.

  • GPT-Realtime-2: هزینه بر اساس توکن‌های صوتی
  • GPT-Realtime-Translate: هر دقیقه 0.034 دلار
  • GPT-Realtime-Whisper: هر دقیقه 0.017 دلار

08
از 08
شروع به کار سه مدل صوتی جدید OpenAI

توسعه‌دهندگان می‌توانند این مدل‌ها را در OpenAI Playground آزمایش کنند و از طریق ابزارهایی مانند Codex در اپلیکیشن‌های خود پیاده‌سازی نمایند.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

موشک SpaceX روی سکوی پرتاب در غروب خورشید؛ نمایی از آماده‌سازی مأموریت فضایی در پایگاه پرتاب.
فناوری

اسپیس ایکس از کپسول باری مداری Starfall  رونمایی کرد

نوشته شده توسط نرگس چالوک
2 تیر 1405
پیشنهاد سردبیر

ساخت نخستین ابرآلیاژ جهان با استحکامی دو برابر فولاد

نوشته شده توسط نرگس چالوک
2 تیر 1405
سیستم چندعاملی Fugu معرفی شد
اخبار هوش مصنوعی

سیستم چندعاملی Fugu معرفی شد

نوشته شده توسط سید محمد برازنده
2 تیر 1405
حمله سایبری به تاتا الکترونیکس
امنیت سایبری

حمله سایبری به تاتا الکترونیکس؛ داده‌های حساس اپل و تسلا در خطر

نوشته شده توسط مانی
2 تیر 1405
تغییر مدیریت واتساپ؛ متا رئیس جدید این پیام‌رسان را معرفی کرد
شبکه های اجتماعی

تغییر مدیریت واتساپ؛ متا رئیس جدید این پیام‌رسان را معرفی کرد

نوشته شده توسط مانی
2 تیر 1405
خبر بعدی
ترفند جدید مایکروسافت برای افزایش سرعت ویندوز ۱۱

ترفند جدید مایکروسافت برای افزایش سرعت ویندوز ۱۱

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

ویژگی‌های جدید سیستم‌عامل iOS 27 چیست؟

31 خرداد 1405
مقایسه گلکسی A57 با گلکسی S25 FE

گلکسی A57 یا گلکسی S25 FE؛ کدام گوشی سامسونگ ارزش خرید بیشتری دارد؟

29 خرداد 1405 - به‌روزشده در 1 تیر 1405

داغ‌ترین‌های روز

لوگوی رسمی شیائومی هایپراواس ۴ با فونت سفید روی پس‌زمینه انتزاعی مارپیچ به رنگ آبی تیره که عدد بزرگ ۴ را در مرکز نشان می‌دهد

به‌روزرسانی HyperOS 4 با تغییرات بزرگ نرم‌‌افزاری معرفی می‌‌شود

31 خرداد 1405 - به‌روزشده در 1 تیر 1405
سامانه لیزری ضدپهپاد Lijian ساخت چین در نمایشگاه دفاعی ۲۰۲۶؛ مجهز به حسگرهای اپتیکی و سامانه رهگیری اهداف هوایی.

سلاح لیزری ضدپهپاد قابل‌حمل چین رونمایی شد

31 خرداد 1405
ایلان ماسک: تراشه جدید ما ۳ برابر بهتر از انویدیا است

ایلان ماسک: تراشه جدید ما ۳ برابر بهتر از انویدیا است

1 تیر 1405
پیشرفته‌ترین هواپیماهای بدون سرنشین رزمی جهان در سال ۲۰۲۶؛ معرفی ۶ پهپاد نظامی برتر دنیا

با ۶ پهپاد نظامی برتر و پیشرفته دنیا آشنا شوید

29 خرداد 1405 - به‌روزشده در 1 تیر 1405
ساعت فلزی مربعی کاسیو سری MTP-B185

کاسیو تصمیم‌گیری درباره عرضه ساعت های MTP-B185 را به کاربران سپرد

1 تیر 1405 - به‌روزشده در 2 تیر 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

موشک SpaceX روی سکوی پرتاب در غروب خورشید؛ نمایی از آماده‌سازی مأموریت فضایی در پایگاه پرتاب.

اسپیس ایکس از کپسول باری مداری Starfall  رونمایی کرد

2 تیر 1405

ساخت نخستین ابرآلیاژ جهان با استحکامی دو برابر فولاد

2 تیر 1405
مرسدس بنز از مینی‌ون لوکس تمام برقی VLE-Class رونمایی کرد

مرسدس بنز از مینی‌ون لوکس تمام برقی VLE-Class رونمایی کرد + تصویر

2 تیر 1405
سیستم چندعاملی Fugu معرفی شد

سیستم چندعاملی Fugu معرفی شد

2 تیر 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir