OpenAI 发布新一代语音模型，让智能体语音表达更自然

3 月 21 日消息，OpenAI 昨日（3 月 20 日）发布博文，宣布推出语音转文本（speech-to-text）和文本转语音（text-to-speech）模型，提升语音处理能力，支持开发者构建更精准、可定制的语音交互系统，进一步推动人工智能语音技术的商业化应用。

在语音转文本模型上，OpenAI 主要推出了 gpt-4o-transcribe 和 gpt-4o-mini-transcribe 两个模型，官方表示在单词错误率（WER）、语言识别和准确性上超越现有 Whisper 系列。

这两个模型支持超 100 种语言，主要通过强化学习和多样化高质量音频数据集训练，能捕捉细微语音特征，减少误识别，尤其在嘈杂环境、口音及不同语速下表现更稳定。

在文本转语音上，OpenAI 最新推出了 gpt-4o-mini-tts 模型，开发者通过“模拟耐心客服”或“生动故事叙述”等指令，控制语音风格，可以应用于客服（合成更具同理心的语音，提升用户体验）和创意内容（为有声书或游戏角色设计个性化声音）方面。

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

Ultraman 2025年3月28日

可以再弄一下arm64的链接吗？我一直没找到感谢

评论于 Microsoft Edge v134.0.3124.93 离线安装包
后来乀 2025年3月28日

不用导，直接再打开旧版的微信就好了，新版的是复制，不会删除旧的

评论于微信PC v4.0.2.22 绿色版
hjlw2004 2025年3月28日

无法完成安装。

评论于 Autodesk CAD v2026.0.0 高级版
猴啊 2025年3月28日

180天

评论于 Microsoft Activation Scripts v3.0 官方版/汉化版
Aeon Lau 2025年3月28日

我只知道按你的定义，你们俩都是老古董

评论于安卓闭源的谣言，反而利好了谁？
将夜 2025年3月28日

建议你去查查事实的定义是什么

评论于安卓闭源的谣言，反而利好了谁？
Aeon Lau 2025年3月28日

Win10的老古董认清现实吧，他说的就是事实

评论于安卓闭源的谣言，反而利好了谁？
将夜 2025年3月28日

用安卓11的老古董，睁眼看看世界吧

评论于安卓闭源的谣言，反而利好了谁？
将夜 2025年3月28日

张嘴就来，鸿蒙出来多少年了你们这群人还是反反复复这一句是吧？

评论于安卓闭源的谣言，反而利好了谁？
T哥 2025年3月28日

激活用MAS，microsoft activation script，不知道拼对了没，大概这样

评论于 Office 2024 批量许可版25年03月更新版

OpenAI 发布新一代语音模型，让智能体语音表达更自然 - 果核剥壳