详情介绍
Constme-Whisper是一款本地离线语音转文字工具,支持 GPU、支持实时语音转换。Whisper是由 OpenAI 训练并开源的神经网络,在英语语音识别方面的稳健性和准确性接近人类水平whisper.cpp 项目是将 Whisper 移植到 C/C++ 中,而今天介绍的 Const-me/Whisper 项目则是 whisper.cpp 在 Windows 上的实现,并增加了显卡的支持,使得速度大幅提升。欢迎需要此款工具的朋友前来下载使用。
软件介绍
Constme-Whisper是OpenAI的Whisper自动语音识别ASR模型的衍生项目。
Constme-Whisper可以在Windows上使用,支持高性能GPGPU处理,可以利用GPU加速处理。
本体是个启动器,需要结合一个语言识别模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large)使用,模型越大,效果越好,但相对的速度也更慢。
软件特点
基于DirectCompute的与供应商无关的GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
纯C++实现,除了基本的操作系统组件外,没有运行时依赖关系
比OpenAI的实现快得多。
混合 F16 / F32 精度:Windows 需要自 D3D 版本 10.0 起支持缓冲区R16_FLOAT
内置性能探查器,用于测量单个计算着色器的执行时间
内存使用率低
用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis除外), 以及大多数在Windows上运行的音频捕获设备(除了一些专业设备,它们只实现ASIO API)。
用于音频捕获的语音活动检测。
易于使用的 COM 样式 API,nuget 上提供的惯用 C# 包装器
提供预构建的二进制文件
下载 Whisper 模型
而 Const-me 的这个名为 Whisper 的项目,目前仅提供 Windows 版本,使用简单,需要先下载模型:
开发者推荐 ggml-medium.bin,因为一直在使用这个模型进行测试,1.53 GB 大小。
使用 Whisper
在 Model Path 里面选择你下载的模型,然后选择 GPU 就能进入软件了。
之后,就可以选择通过麦克风实时转换,或者使用音频文件比如 MP3 来转换为文字了:
青小蛙随便测试了一个极客湾的视频(仅下载了音频),效果如下:
准确度很高,基本上比较满意。
由于是在虚拟机中测试,显卡性能有限,所以时间不具有参考性。
不过,开发者的测试是在装有 GeForce 1080Ti GPU 的台式电脑上,中型模型,3 分 24 秒语音使用 PyTorch 和 CUDA 转录需要 45 秒,但使用这个和 DirectCompute 只需要 19 秒。而 @JoeCubber 同学测试的是 11:31 分钟的音频,耗时1分26秒完成。
当然,你需要有显卡。
实在是没想到,挖矿之后,显卡又有了用武之地。
更新日志
更新了文档和 GUI 中的模型源 URL
可靠性增强,麦克风捕获不太可能转换到“停滞”状态并丢弃音频
注意:
需要不低于Win8.1的64位Windows
文件main.exe为命令行调用工具
下载地址
人气软件
IBM ViaVoice Pro v9.1 简体中文版
iZotope RX6 Audio Editor Advanced(音频修复工具) v6.0 安装特
Adobe Audition CC 2019 12.1 中/英文正式最新版 64位
高级音频后期制作Steinberg Nuendo v12.0.70 x64 安装激活版(附
变声宝宝 V2.767 把你的声音变成男声、女声、童声的软件
MP3万能格式化工具 MDBoot
Voxengo SPAN Plus(音频频谱分析软件) v1.5 破解安装版
铃声助手 铃声编辑器 v0.21 绿色免费版
Discord4(修复损坏音频软件) v4.0 免费安装版
dvd音频提取工具 Clone2Go DVD Ripper V2.8.1 官方简体中文特别
相关文章
- WPS如何设置从图片获取文字 WPS设置从图片获取文字的方法
WPS如何设置从图片获取文字?那么我们可以将工具栏中的获取数据功能打开,将其中的自图片导入文字选项点击打开,就可以从本地中找到需要进行提取文字的图片,将其导入进行...
- Word如何更改每页固定行数 Word更改每页固定行数的方法
Word如何更改每页固定行数?其实我们只需要在Word程序的文字文档页面中点击打开布局工具,然后找到并打开页面设置弹框,接着在我们文档网格页面中找到行数设置,在该设置下...
- Word如何设置行号与正文距离 Word设置行号与正文距离的方法
Word如何设置行号与正文距离?其实我们只需要点击打开Word中的行号工具,然后在下拉列表中打开行编号选项,接着在弹框中打开行号选项,再在行号弹框中点击勾选“添加行号”...
- Excel如何一键清除所有下拉选项 Excel一键清除所有下拉选项的方法
Excel如何一键清除所有下拉选项?其实我们只需要选中表格文档中的所有表格,然后在工具栏中找到“数据”工具,点击打开该工具,接着在其子工具栏中找到并打开“数据验证”...
- Excel如何自定义打印缩放比例 Excel自定义打印缩放比例的方法
Excel如何自定义打印缩放比例?其实我们只需要进入Excel的表格文档打印设置页面,然后在该页面中找到“无缩放”选项,打开该选项,再在菜单列表中点击打开“自定义缩放选项...
- VMware Workstation Pro 17.5.2 解决NAT服务CPU高温和占用过高的问题(含下载)
VMware Workstation 17是一款功能非常强大的虚拟机,但有网友发现更新VMware Workstation Pro 17,NAT服务一直处于开启状态,导致占用cpu大量资源和高温,怎么解决呢?下面...
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的Constme-Whisper(离线语音识别转文字) v1.12 绿色免费版(含完整模型)资源来源互联网,版权归该下载资源的合法拥有者所有。