OpenAI a lansat instrumente pentru comunicare și traducere în timp real
OpenAI a extins API-ul cu noi instrumente de inteligență artificială vocală, care permit dezvoltatorilor să creeze aplicații pentru comunicare, transcriere și traducere vocală în timp real.

Compania a prezentat modelul GPT-Realtime-2 — un sistem pentru procesarea și generarea vorbirii bazat pe tehnologiile GPT-5. Potrivit OpenAI, noua versiune gestionează mai bine cererile complexe ale utilizatorilor și susține un dialog mai natural comparativ cu GPT-Realtime-1.5, transmite openai.com.
Împreună cu acesta, în API a apărut funcția GPT-Realtime-Whisper pentru transcrierea în flux a vorbirii în text — recunoașterea are loc chiar în timpul conversației.
De asemenea, OpenAI a lansat GPT-Realtime-Translate pentru traducerea simultană a vorbirii. Sistemul suportă peste 70 de limbi de intrare și 13 limbi de ieșire, menținând ritmul unei conversații live.
Reprezentanții OpenAI menționează că noile instrumente pot fi utilizate nu doar în serviciile de suport, ci și în educație, media, evenimente și platforme pentru creatori de conținut.
Compania a anunțat, de asemenea, mecanisme integrate de protecție. Sistemul va putea întrerupe dialogul la identificarea încălcărilor regulilor, pentru a reduce riscurile de spam, fraudă și alte abuzuri.
GPT-Realtime-2 va fi tarifat pe tokeni, iar Translate și Whisper — pe minute de utilizare.