当前位置: 首页 > news >正文

中文语音识别不建议使用VOSK

40几MB的vosk-model-small-cn-0.3,识别率极低,识别速度极慢。

1.3GB的vosk-model-cn-0.22没试,想必速度不会更快。

网站上Models里只有vosk-model-small-cn-0.22,没有0.3

vosk-transcriber --list-models

vosk-transcriber -n model -i input -o output 会下载model

输入可以是有视频的.mp4。

ffmpeg -i $1 -ac 1 -ar 16000 -acodec pcm_s16le t.wav 提取.mp4里的音频。

vosk-transcriber -l cn -n model 把语言也指定上,输入换成wav,识别结果一样。

pip uninstall 卸载。

vosk-transcriber自动下载的模型在~/.cache/vosk下。

http://www.gsyq.cn/news/20892.html

相关文章:

  • VSCode插件开发的注意点 - Erica
  • 斑马日记2025.10.12
  • 2025 年国内卷板机源头厂家最新推荐排行榜:涵盖不锈钢 / 大型 / 锥形 / 数控等多类型设备,助力企业精准采购优质设备
  • mysql5.7 AUTO_INCREMENT 问题
  • NVR设备ONVIF接入平台EasyCVR智慧小区视频监控系统建设方案
  • FPGA开发流程
  • Java word文档中的图片抽离方法
  • Kerberos认证(Elasticsearch)
  • 在Anolis OS 8.10 GA上安装和配置VNC系统
  • 钩子(HOOK):改变系统行为的 “隐形抓手”
  • 新装 CentOS 7 切换 yum 源完整指南 - 详解
  • 如何在统信系统中将 Avalonia 软件程序打包 Deb 安装包
  • 2025 年涡街流量计厂家推荐,湖北南控仪表科技有限公司技术创新与行业应用解决方案解析
  • ArcGIS 10.2.2 字符串长度为20却仅能输入3个汉字的解决方法
  • 爬虫遇到的问题与解
  • LatchUtils:简化Java异步任务同步的利器
  • Agentic RAG对比传统RAG的优势
  • linux系统查看磁盘过程
  • ftp多用户多目录配置
  • 温故知新,机器人进化论,机器人分类与全球格局
  • 微信机器人框架
  • 详细介绍:Go 语言中指针介绍
  • AI元人文构想基础理论体系研究
  • DevEco Testing全面解析:HarmonyOS测试框架与实战指南 - 教程
  • 单片机使用同一硬件定时器实现多周期定时功能
  • (二十六)、Kuboard 部署网络问题 k8s 使用本地镜像 k8s使用 register本地镜像站 综合应用 - 实践
  • 从PHP到Spring Boot:思维的转变与入门实战 (指南二) - 教程
  • 微前端架构:实战指南与未来趋势 - 详解
  • Microsoft Visual C++,Microsoft Visual Studio for Office Runtime,Microsoft Visual Basic Runtime等下载
  • 实用指南:如何进行WGBS的数据挖掘——从甲基化水平到功能通路