OpenAI 发布新一代语音模型,让智能体语音表达更自然 - 果核剥壳

AI文摘
此内容由AI根据文章内容自动生成,并已由人工审核

3月20日,OpenAI发布语音转文本和文本转语音模型,包括gpt-4o

3 月 21 日消息,OpenAI 昨日(3 月 20 日)发布博文,宣布推出语音转文本(speech-to-text)和文本转语音(text-to-speech)模型,提升语音处理能力,支持开发者构建更精准、可定制的语音交互系统,进一步推动人工智能语音技术的商业化应用。

在语音转文本模型上,OpenAI 主要推出了 gpt-4o-transcribe 和 gpt-4o-mini-transcribe 两个模型,官方表示在单词错误率(WER)、语言识别和准确性上超越现有 Whisper 系列。

OpenAI 发布新一代语音模型,让智能体语音表达更自然

这两个模型支持超 100 种语言,主要通过强化学习和多样化高质量音频数据集训练,能捕捉细微语音特征,减少误识别,尤其在嘈杂环境、口音及不同语速下表现更稳定。

在文本转语音上,OpenAI 最新推出了 gpt-4o-mini-tts 模型,开发者通过“模拟耐心客服”或“生动故事叙述”等指令,控制语音风格,可以应用于客服(合成更具同理心的语音,提升用户体验)和创意内容(为有声书或游戏角色设计个性化声音)方面。

如果您喜欢本站,点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你: 下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件,加群提示为修改者自留,非本站信息,注意鉴别

(0)
上一篇 6天前
下一篇 5天前

相关推荐

发表回复

评论问题之前,点击我,能帮你解决大部分问题

您的电子邮箱地址不会被公开。 必填项已用*标注

评论列表(1条)

  • c.zyrichard
    c.zyrichard 2025年3月21日 上午11:33
    Google Chrome 134.0.0.0 Google Chrome 134.0.0.0 Windows 10 x64 Edition Windows 10 x64 Edition

    不开源的话意义不大啊

本站通知
没关注公众号的同学,可以关注下公众号【果核剥壳】,每天有软件推荐和新闻可以订阅
本通知一周弹一次,如有打扰,非常抱歉。