音频处理工具，faster-whisper-GUI软件体验

音频处理工具，faster-whisper-GUI软件体验 - 果核剥壳

2024年2月22日上午9:34 • 微信推文

文章来自于果核剥壳公众号首发：https://mp.weixin.qq.com/s/qz9cjewZpfmud12-vouUZg

现在关于AI的工具是越来越多，随着AI的出现，大家肯定也听到了很多关于某某模型的信息，各厂家之间也是在对比模型之间的性能，把它换种说法，有点类似在软件和系统上，讨论使用哪种内核的味道了。

训练模型一般要用到大量的算力，还要放在专门的服务器上，而训练好的成果，就像是炼制好的丹药，在精简和用户的设备上也能跑，今天我们要说的，是在音频识别上面一款融合了众多优点的模型启动器——faster-whisper-GUI。

听到Whisper，这个大家可能有点熟悉，这是OpenAI做的一个神经网络模型，可以在本地实时语音转文字，用来翻译和做字幕等，之前给大家介绍过一款叫做Constme-Whisper的软件，可以快速进行离线语音文字识别，还有GPU加速等等。

而faster-whisper-GUI增添了更多的特性，可以快速把音视频文件转成srt/txt/smi/vtt/lrc，支持Demucs、FastWhiper和whisperX、VAD-model这些技术，简单来说，支持的可调整的选项要比之前推荐的工具更多一点。

由于这类工具离线处理的特点，所以体积都比较大，faster-whisper-GUI的本体有1.6个G，安装完之后的占用又是6个多G，而且还不包括后续添加模型的大小，建议大家体验的时候，装在空间富裕的盘里。

如果是分离音频和背景音乐的话，直接把文件丢进来就行，试了一下效果还不错，也可以单独设置输出的内容。

其他的就需要加载一下额外模型了，把模型加载的时候需要注意，有个处理设备的选项，CPU还是CUDA，如果你用的不是英伟达的显卡，选择自动就好了，不然会提示加载失败。

模型也有多重选择，如果上面带有V3标志，记得把这个开关打开。

来试试语音转文字，如果你觉得自己的设备处理等待时间有点长，在软件执行的时候可以挂在后台和切换到其他界面，在它的详情页面能看到输出的具体信息，它的正确率还是比较高的，中英文混合与首字母大小写这些细节都有。

这类机器识别和人一样，识别率还不能做到100%正确，识别完之后，会有一些错误需要手动调整，在faster-whisper-GUI里，它会自己跳转到字幕制作的界面，可以快速浏览调整，在这里分割不同说话人的文本等等。

在设置里面，还有许多细节可以调整，调整音频的默认语言和翻译，以及各种防止幻听的参数。

这个功能在一些视频编辑软件还是需要收费的，或者需要云端处理，识别的准确率也就那样。

有了这类软件，就可以自己手动操作了，有音频转文字编辑需求的朋友可以说是常备了～

最后，附上软件的体验地址。

在极客果核公众号

回复20240222获取最新链接

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

发表回复

评论列表（2条）

406180725 2024年9月24日上午10:17

Google Chrome 122.0.6261.95 Windows 11 x64 Edition
20240222获取最新链接

回复
Nick 2024年2月22日上午11:55

Google Chrome 112.0.0.0 Windows 11 x64 Edition
安装报错 RPGSetup archive is corrupted

回复

marcille 2025年5月12日

这东西本身是网页版的，PC版只是添头，所以按理来说支持所有平台

评论于 PDF24 Creator(PDF工具箱) v11.25.1 官方版
Neptune 2025年5月12日

其实是有人修改的但是在小论坛里面流传，多看的pj别人也不敢上传呀

评论于 Android 静读天下 v9.9 专业版
ilehoo 2025年5月12日

这个也能文字转音频吗？

评论于 VideoTrans(视频翻译和配音) v3.42 绿色版
夜雨 2025年5月12日

有没有可能是某个定制化的WINDOWS系统，不能自由浏览网页，但是需要支持访问淘宝这种呢？

评论于淘宝的PC客户端拆解，真不知道是不是团队没事干了
VRBest 2025年5月12日

哦，年订阅的，记错了

评论于 Directory Opus v13.14.10.Beta 专业版 - 文件管理器
hz小生 2025年5月12日

以前有个UC浏览器的，淘宝适配挺好，后面自己下架停更了。只能说好产品到淘宝都浪费了。

评论于淘宝的PC客户端拆解，真不知道是不是团队没事干了
VRBest 2025年5月12日

评论于 Directory Opus v13.14.10.Beta 专业版 - 文件管理器
vertical 2025年5月12日

太好了，感谢大哥

评论于 Directory Opus v13.14.10.Beta 专业版 - 文件管理器
VRBest 2025年5月12日

对了，DO设置的话右键要更改的“布局块”都可以跳转，比如地址栏、文件夹树

评论于 Directory Opus v13.14.10.Beta 专业版 - 文件管理器
VRBest 2025年5月12日

已发，也有简短说明。哈哈，本人是大白一个，如果使用中有错乱欢迎回复讨论。

评论于 Directory Opus v13.14.10.Beta 专业版 - 文件管理器

音频处理工具，faster-whisper-GUI软件体验 - 果核剥壳

相关推荐

发表回复

评论列表（2条）

分享到：