金色财经报道,今天凌晨1点,OpenAI进行了技术直播发布了三款全新语音模型,专用于开发语音AI Agent。两个是语音转文本模型GPT-40 Transcribe和GPT-4 Mini Transcribe;一个是文本转语音模型GPT-40 Mini TTS。值得一提的是,开发者可以控制GPT-40 Mini TTS模型的语音情绪和风格。OpenAI为语音转文本API增添了强大的streaming模式,允许开发者将连续的音频流实时输入模型,模型也能实时返回连续的文本和响应,这种实时交互的特性对于需要即时反馈的应用场景,例如,实时语音对话系统、语音会议转写等,帮助非常大。(AIGC开放社区)