theme-icon
logo
logo
Menu icon
Point.md logo
Distribuie știrea
Copiază linkul
Link copiat
29 August 2025, 17:37
3 995
Copiază linkul
Link copiat

OpenAI prezintă modelul gpt‑realtime pentru crearea agenților vocali AI de generație nouă

OpenAI a lansat cel mai avansat model de conversie vorbire‑în‑vorbire, gpt‑realtime, și a oferit acces la acesta prin API.

OpenAI prezintă modelul gpt‑realtime pentru crearea agenților vocali AI de generație nouă.
OpenAI prezintă modelul gpt‑realtime pentru crearea agenților vocali AI de generație nouă.

Aceste actualizări permit dezvoltatorilor și companiilor să creeze agenți vocali AI fiabili, gata de utilizare, cu latență redusă și cu o voce mai naturală și expresivă, transmite incrussia.ru.

Problema asistenților vocali tradiționali constă în întârziere și voce robotizată. Ei folosesc de obicei un lanț de mai multe modele (vorbire în text, procesare, text în vorbire), ceea ce încetinește răspunsul. Realtime API de la OpenAI procesează și generează audio direct printr-un singur model, reducând semnificativ întârzierea, păstrând intonațiile și făcând conversația mai vie.

GPT Realtime înțelege mult mai bine instrucțiunile complexe comparativ cu predecesorul său integrat în GPT‑4o. De asemenea, modelul utilizează mai precis instrumente externe, vorbește mai natural și respectă prompturile sistemice. Au fost adăugate două voci noi, mai naturale – Cedar și Marin.

Realtime API a primit actualizări esențiale pentru utilizarea în producție. A fost adăugată suportul pentru apeluri telefonice prin protocolul SIP, posibilitatea de a trimite modele cu imagini pentru context (de exemplu, capturi de ecran) și suport pentru servere MCP externe pentru integrarea cu instrumente precum Stripe. Aceasta face agenții vocali mult mai funcționali.

OpenAI a redus, de asemenea, prețurile pentru gpt‑realtime cu 20% față de versiunea anterioară: 32 de dolari pentru un milion de audio tokenuri de intrare și 64 de dolari pentru un milion de audio tokenuri de ieșire. Noile funcționalități API au fost deja apreciate de companii precum Zillow, care spun că modelul permite procesarea solicitărilor complexe în mai mulți pași.

Acum ne puteți urmări și pe TelegramFacebook și Instagram pentru a fi la curent cu ultimele știri.

Sursă
Distribuie știrea
Copiază linkul
Link copiat