当前位置: 首页 > news >正文

ManySpeech-CLI:开箱即用的本地命令行语音识别工具

ManySpeech-CLI 是一款免费、开箱即用、本地运行的命令行语音识别工具,支持本地音频文件识别、麦克风实时流式识别,自带交互操作模式,模型自动下载、离线推理、字幕生成均可通过命令一键完成。

工具无需云端、无需 GPU、无需复杂环境配置,下载解压即可使用,支持多种高质量语音模型,语言覆盖广泛。首次使用时联网自动下载模型,后续全程本地离线运行,音频不上云、不泄露,适合会议录音、私人录音等隐私场景。


典型使用示例

1. 长音频离线识别 + 生成字幕

# FireRedASR 大模型manyspeech asr-toffline--modelfireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212-mchunk--formatsrt--threads2-ifile-f"/path/to/0.wav"# FunASR 轻量模型manyspeech asr-toffline--modelFun-ASR-Nano-2512-LLM-int8-onnx-mchunk--formatsrt--threads2-ifile-f"/path/to/0.wav"

2. 麦克风实时语音识别

manyspeech asr-tonline--modelparaformer-large-zh-en-int8-onnx-online-mchunk--formatsrt--threads2-imic manyspeech asr-tonline--modelk2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630-mchunk--formatsrt--threads2-imic manyspeech asr-tonline--modelk2transducer-zipformer-ctc-xlarge-zh-onnx-online-yuekai-20250630-mchunk--formatsrt--threads2-imic

3. 语音静音检测(VAD)

# 麦克风在线检测manyspeech vad-tonline-imic# 音频文件离线检测(剔除静音)manyspeech vad-toffline-fmeeting.wav# 指定输出格式manyspeech vad-toffline--formatwav-fnoisy_speech.wav

4. 自动标点符号恢复

# 直接输入文本manyspeech punc--text"今天天气不错一起去郊游吧"# 从文件读取manyspeech punc-ftranscript.txt# 指定输出JSON格式manyspeech punc--text"hello world"--formatjson# 交互输入manyspeech punc

相关链接

  • 📚 官方文档:https://manyeyes.github.io/manyspeech/
  • 📥 软件下载:https://manyeyes.github.io/manyspeech/cli/getting-started/installation.html
  • 🧩 模型查询:https://modelscope.cn/profile/manyeyes?tab=model

🔗 参考
ManySpeech​

http://www.gsyq.cn/news/1409460.html

相关文章:

  • Linux内核开发者视角:深入SMMUv3驱动,手把手拆解dma_map_sg()的IOVA连续映射魔法
  • 力扣HOT100(35)回溯-全排列
  • 国产第一!Qwen3.7-Max全端上线,好易智算同步首发,企业级Agent底座再添新选择
  • 阿姆智创IBOX-6076R工控一体机,机器视觉设备控制升级
  • Windows命令行利器:Hexdump十六进制文件解析实战
  • 为什么92.3%的人用错ChatGPT设目标?——斯坦福HAI实验室联合实证:3类错误输入导致目标漂移率提升4.8倍
  • AI应用可观测性工程2026:LLM调用追踪评估与监控全栈实践
  • 睡眠呼吸暂停监测:轻量化CNN与ECG信号分析
  • 跨越十个数量级的能效革命:从GPU到忆阻器,神经计算硬件的能耗全景与路径选择
  • 别再死记硬背梯度下降公式了!用Python动画可视化梯度流,理解优化算法的本质
  • 基于 HarmonyOS 6.0 的日程备忘应用:待办事项板与提醒卡片详解
  • 美股盘前盘后数据接入前的 4 项核验:交易窗口、返回样本、timestamp 与失败分支
  • Cortex-M3开发者文档版本更新解析与应对策略
  • 从顺序表到ArrayList,吃透动态数组的底层逻辑
  • 工业视觉辅助系统:实时检测与装配质量优化
  • 作为Oracle DBA,如何快速处理HANG类故障?
  • 【企业级ChatGPT客服话术安全白皮书】:工信部备案要求下的12类高危话术自动拦截规则(含正则+语义双引擎配置)
  • 研究生读文献亲测好用的工具
  • LeetCode 22. 括号生成(JS里的回溯算法)
  • GS算法与Fienup算法详解:为什么你的相位恢复总不收敛?可能是反馈机制没搞懂
  • 别再纠结MBR还是GPT了!SATA/NVMe固态硬盘装Win10,保姆级分区与引导设置全流程
  • 2026年智慧工地系统推荐榜单:工地人脸识别/塔吊防碰撞/AI视频巡检/扬尘监测/实名制考勤/车辆道闸/升降机监控/劳务管理平台全解析 - 品牌企业推荐师(官方)
  • 基于三轴加速度计的塑料水管泄漏振动检测技术全解析
  • MIT-BIH ECG信号预处理避坑指南:中值滤波窗大小设置与边界失真处理实战
  • Text to SQL准确率为什么上不去?三个核心难点
  • 4J36板材怎么选?国内主流厂家盘点,助您快速匹配优质供应商 - 品牌2025
  • 强化学习实战:用DQN家族玩转Atari游戏,从环境搭建到模型调优的全流程记录
  • 星露谷物语农场规划器:免费在线设计你的完美农场
  • 量子溢出检测电路在生物医学图像处理中的应用与Qiskit实现
  • 收藏!AI岗位暴涨12倍,小白程序员如何抓住这波红利,实现薪资跃迁?