OpenAI представила три новые голосовые модели — от рассуждений до перевода | Hi-Tech

Компания выпустила специализированные модели для работы с голосом в реальном времени: флагманскую GPT-Realtime-2, переводчик GPT-Realtime-Translate и транскрибатор GPT-Realtime-Whisper. GPT-Realtime-2 получила логику «уровня GPT-5», контекстное окно на 128 тыс. токенов и способность поддерживать естественный диалог с помощью уточняющих реплик. Все три модели уже доступны разработчикам через API. Главной новинкой стала GPT-Realtime-2 — первая аудиомодель OpenAI с логическим мышлением «класса GPT-5». Модель показывает на 11% более высокую производительность по сравнению с GPT-Realtime-1.5, а...