软件开源Github地址:https://github.com/Const-me/Whisper
下载地址:https://github.com/Const-me/Whisper/releases/tag/1.11.0
Windows系统就下载WhisperDesktop.zip这个压缩包就可以了,如果不方便打不开的话,我也会把文件上传到网盘上,需要的到文章底部下载链接下载。
一、简介:
WhisperDesktop是基于OpenAI在2023年初左右推出的Whisper语音转文字技术,通过AI识别技术,它不仅能快速地、正确地生成文字还能进行实时翻译。优点是免费,可离线单机使用,不用上传任何数据,缺点是需要通过python命令行运行,对小白用户实在有点不友好。所以才会出现许多套壳的应用,而WhisperDesktop正是其中一款比较方便的应用。
二、使用方法:
1、除了下载WhisperDesktop软件 ,还要下载一个Whisper模型,下载网址:https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main。开放者建议ggml-medium.bin 这个版本的模型就可以。点击进入相应的模型链接,然后点左边的download下载。
2、把软件和都解压后,运行WhisperDesktop.exe。第一次运行需要选择模型,选择你存放模型的目录下的模型即可。
3、具体操作界面看下图说明:
4、Audio Capture(音频采集),软件还支持实时音频采集生成文字,具体操作看下图:
5、转换生成速度取决于你的电脑配置,一般有独立显卡的话,转换生成一个6分钟左右的视频不会超过1分半钟(仅供参考)。
6、一般情况下Whisper转换的识别率和准确率已经非常高了(95%以上),但还是会受到模型的影响,具体可以自行测试,你也可以自己打开转换后的字幕文件自行校对修改。
三、总结:
WhisperDesktop是一个免费软件,操作简单,不用上传任何东西到云端,也没有任何限制,再加上不错的识别率和生成速度,所以是值得推荐给有需要语音转文字的朋友使用的。