当前位置: 首页 > news >正文

智能语音识别中继网关-可白嫖轮询理论上支持市面上90%asr语音识别需求。可二次开发对接

ASR Relay Gateway - 智能语音识别中继网关

产品简介

ASR Relay Gateway 是一款企业级的智能语音识别中继网关系统,专为需要高质量语音识别服务的开发者和企业设计。它集成了多家主流语音识别厂商,提供统一的API接口、智能路由、负载均衡、故障自动切换等核心功能,让您轻松构建稳定可靠的语音识别服务。

核心优势

1. 多厂商智能路由

  • 大主流厂商:支持OpenAI Whisper、阿里云DashScope、小米MiMo、科大讯飞语音听写、科大讯飞AIUI、阿里云一句话识别等
  • 智能负载均衡:基于优先级和权重的智能流量分配
  • 故障自动切换:厂商故障时自动切换到备用厂商,保障服务可用性
  • 多种部署模式:支持主备模式、负载均衡、灰度测试等

2. 企业级多租户架构

  • 完善的权限管理:基于角色的访问控制(RBAC),支持超级管理员、租户管理员、普通用户等多种角色
  • 多级租户隔离:支持根租户、子租户、孙租户的多级架构
  • 灵活的配额管理:支持按用户设置调用配额和限流策略

3. 全面的计费与监控

  • 实时统计:今日调用量、成功数、音频时长、活跃租户等关键指标
  • 趋势分析:7天/30天调用趋势图表,直观展示使用情况
  • 详细日志:完整的调用日志记录,支持按时间、租户、厂商等条件筛选
  • CSV导出:支持将日志数据导出为CSV格式

4. 灵活的API接入方式

提供四种不同的API调用模式,满足不同场景需求:

  • 直连模式:直接发送PCM音频到网关
  • 代理模式:OpenAI兼容格式,支持WAV音频文件
  • 兼容协议:Token+ASR两步调用模式
  • AIUI兼容:兼容讯飞AIUI协议

功能详解

1. 仪表盘 - 一目了然的数据监控

核心功能:

  • 实时统计卡片:显示今日调用量、成功数、音频时长、活跃租户
  • 调用趋势图表:支持7天和30天时间维度的趋势分析
  • 数据可视化:柱状图+折线图的复合图表,直观展示业务数据

使用方法:

  1. 登录系统后自动进入仪表盘页面
  2. 查看统计卡片了解今日业务概况
  3. 点击"7天"或"30天"按钮切换时间范围
  4. 鼠标悬停图表查看详细数据

2. 用户管理 - 灵活的用户生命周期管理

核心功能:

  • 用户列表:ID、用户名、类型、角色、上级、余额、状态、创建时间
  • 搜索筛选:支持按用户名/姓名/手机/邮箱搜索,按类型、状态、角色筛选
  • 用户操作:创建用户、编辑信息、重置密码、充值余额、管理API Keys
  • 状态切换:一键启用/禁用用户账户

使用方法:

  1. 点击"+ 创建用户"按钮添加新用户
  2. 填写用户名、密码、用户类型、角色等信息
  3. 为用户设置每日调用配额和限流策略
  4. 使用搜索框快速查找用户
  5. 点击操作列的按钮管理用户

3. 角色管理 - 细粒度的权限控制

核心功能:

  • 预置角色:超级管理员、租户管理员、租户观察者、代理商管理员、普通用户、观察者
  • 权限配置:9个功能模块的细粒度权限控制
  • 用户绑定:显示每个角色绑定的用户数量
  • 自定义角色:支持创建自定义角色

使用方法:

  1. 查看预置角色的权限配置
  2. 点击"编辑权限"按钮配置角色权限
  3. 勾选/取消勾选功能模块
  4. 点击"+ 创建角色"创建自定义角色
  5. 为角色分配合适的权限组合

4. API Key管理 - 安全的密钥管理

核心功能:

  • API Key列表:ID、名称、密钥值、关联用户、状态、最后使用时间
  • IP白名单:基于IP的访问控制,增强安全性
  • 快速操作:一键复制密钥、启用/禁用状态切换
  • 批量管理:支持批量创建和管理API Key

使用方法:

  1. 点击"+ 创建 API Key"生成新密钥
  2. 为API Key设置名称和关联用户
  3. 使用复制按钮快速复制密钥值
  4. 切换到"IP 白名单"标签页管理IP访问控制
  5. 点击"+ 添加白名单"添加允许访问的IP地址

5. 厂商管理 - 智能的多厂商路由

核心功能:

  • 厂商列表:8大主流语音识别厂商
  • 配置指南:核心概念、路由流程、配置方案
  • 优先级权重:基于优先级和权重的智能流量分配
  • 健康检查:厂商状态监控和故障自动切换

配置方案示例:

  1. 主备模式:科大(权重90) + 小米MiMo(权重10)
  2. 负载均衡:三个厂商各33%流量
  3. 按能力分配:科大50% + 阿里云30% + 小米MiMo20%
  4. 灰度测试:新厂商5%流量测试

使用方法:

  1. 点击"添加厂商"按钮添加新厂商
  2. 配置厂商的API地址、模型、优先级、权重
  3. 查看配置指南了解最佳实践
  4. 启用/禁用厂商状态
  5. 监控厂商健康状态

6. 计费管理 - 精准的费用控制

核心功能:

  • 计费记录:按日期和租户汇总的使用统计
  • 数据维度:日期、租户、调用次数、音频时长
  • 多租户支持:按租户隔离的计费数据
  • 精确计量:音频时长精确到小数点后4位

使用方法:

  1. 查看计费记录了解各租户的使用情况
  2. 按日期筛选查看历史数据
  3. 切换到"IP 白名单"标签页管理访问控制
  4. 使用统计数据分析使用趋势

7. 调用日志 - 全面的调用追踪

核心功能:

  • 日志列表:时间、Trace ID、租户、IP、厂商、状态、耗时、时长、结果
  • 筛选查询:支持按时间范围筛选
  • 数据导出:支持CSV格式导出
  • 日志清理:支持7天、30天、全部清理

使用方法:

  1. 设置开始和结束日期筛选日志
  2. 点击"查询"按钮查看筛选结果
  3. 点击"导出 CSV"按钮导出数据
  4. 使用"清理日志"功能释放存储空间
  5. 查看详细日志了解调用详情

8. 系统配置 - 灵活的系统设置

核心功能:

  • 功能开关:调用日志开关、ASR识别缓存开关
  • 缓存配置:支持1小时到7天的缓存时间设置
  • 厂商配置:厂商失败次数限制、自动恢复时间、重试次数
  • Webhook集成:ASR识别完成后的异步回调通知

配置项说明:

  • provider_max_failures:厂商最大连续失败次数(默认3次)
  • provider_recovery_seconds:厂商自动恢复时间(默认60秒)
  • provider_max_retries:单次请求最大重试次数(默认2次)
  • asr_cache_enabled:ASR识别结果缓存开关
  • asr_cache_ttl:ASR缓存过期时间(默认24小时)

使用方法:

  1. 切换功能开关启用/禁用特定功能
  2. 配置缓存时间优化性能
  3. 设置Webhook URL接收识别结果回调
  4. 调整厂商管理参数优化服务稳定性

9. API文档 - 开发者友好的接口文档

核心功能:

  • 四种调用模式:直连模式、代理模式、兼容协议、AIUI兼容
  • 详细示例:每种模式都提供完整的curl示例
  • 认证说明:多种认证方式的详细说明
  • 错误码文档:完整的错误码和响应格式说明

四种调用模式:

模式一:直连模式
curl-XPOST http://本网站域名/asr/1\-F"token=YOUR_API_KEY"\-F"file=@/path/to/audio.pcm;type=application/octet-stream"
模式二:代理模式
curl-XPOST http://本网站域名/v1/audio/transcriptions\-H"Authorization: Bearer YOUR_API_KEY"\-F"file=@/path/to/audio.wav"
模式三:兼容协议
# 1. 获取Tokencurl-XPOST http://本网站域名/server/api/auth/v2/ip-token\-H"Content-Type: application/json"\-d'{"appKey":"YOUR_API_KEY","appSecret":""}'# 2. ASR识别curl-XPOST http://本网站域名/open/asr/sentence/v1/recognition\-H"aitoken: YOUR_JWT_TOKEN"\-H"format: pcm"\--data-binary @/path/to/audio.pcm
模式四:AIUI兼容
curl-XPOST http://本网站域名/v2/aiui\-H"X-Appid: YOUR_API_KEY"\-H"X-CurTime: 1781838696"\-H"X-Param:$(echo'...'|base64-w0)"\-H"X-CheckSum: xxx"\--data-binary @/path/to/audio.pcm

使用场景

1. 智能客服系统

  • 集成多厂商语音识别,提供高可用的语音转文字服务
  • 通过智能路由实现故障自动切换,保障服务连续性
  • 使用计费功能控制成本,按实际使用量付费

2. 语音助手应用

  • 支持多种音频格式(PCM、WAV),满足不同设备需求
  • 提供低延迟的语音识别服务,提升用户体验
  • 通过API Key管理实现多用户隔离

3. 会议记录系统

  • 实时语音转文字,自动生成会议记录
  • 支持长时间音频处理,满足会议场景需求
  • 通过日志功能追踪调用情况,便于问题排查

4. 教育培训平台

  • 为在线教育提供语音识别能力
  • 支持多租户架构,为不同机构提供独立服务
  • 通过权限管理控制不同角色的访问权限

技术架构

后端技术栈

  • Swoole:高性能协程HTTP服务器
  • PHP:稳定可靠的后端语言
  • SQLite/MySQL:灵活的数据库支持
  • Redis:高性能缓存和会话管理

前端技术栈

  • Vue 3:现代化的前端框架
  • Vite:快速的开发构建工具
  • Tailwind CSS:实用的CSS框架
  • ECharts:强大的数据可视化库

核心特性

  • 协程HTTP连接池:高并发下的稳定连接管理
  • 智能负载均衡:基于优先级和权重的流量分配
  • 故障自动恢复:厂商健康检查和自动切换
  • 多租户隔离:完整的数据和权限隔离

部署方式

1. 环境要求

  • PHP 8.0+ with Swoole扩展
  • Redis for缓存和会话
  • SQLite or MySQL for数据存储

2. 快速部署

# 克隆项目gitclone<repository-url># 安装后端依赖cdbackendcomposerinstall# 安装前端依赖cd../webnpminstall# 构建前端npmrun build# 启动后端服务cd../backend php bin/start.php

3. 配置说明

  • 配置文件位于backend/config/目录
  • 数据库配置:database.php
  • 应用配置:app.php
  • 路由配置:routes.php

安全特性

1. 认证与授权

  • JWT Token认证,支持自定义有效期
  • 基于角色的访问控制(RBAC)
  • API Key级别的权限管理

2. 访问控制

  • IP白名单机制,限制访问来源
  • 用户级别的配额和限流控制
  • 多租户数据隔离

3. 数据安全

  • 敏感信息加密存储
  • 完整的审计日志
  • 定期数据备份机制

性能优化

1. 高并发处理

  • Swoole协程服务器,支持高并发连接
  • HTTP连接池复用,减少连接开销
  • 异步非阻塞IO处理

2. 缓存优化

  • ASR识别结果缓存,减少重复调用
  • Redis缓存热点数据
  • 可配置的缓存过期策略

3. 资源管理

  • 智能的厂商故障检测和切换
  • 自动的资源清理和回收
  • 灵活的日志轮转机制

技术支持

1. 文档支持

  • 完整的API接口文档
  • 详细的部署指南
  • 丰富的配置说明

2. 社区支持

  • 开源社区贡献
  • 问题反馈和讨论
  • 持续的功能更新

3. 企业支持

  • 定制化开发服务
  • 技术咨询和培训
  • 7x24小时技术支持

总结

ASR Relay Gateway 是一款功能强大、易于使用的智能语音识别中继网关系统。它通过多厂商智能路由、企业级多租户架构、全面的计费监控等功能,为企业和开发者提供了稳定可靠的语音识别服务解决方案。

无论您是构建智能客服系统、语音助手应用,还是会议记录平台,ASR Relay Gateway 都能满足您的需求。立即开始使用,体验智能语音识别的便捷与高效!


http://www.gsyq.cn/news/1593164.html

相关文章:

  • vSphere网络性能断崖式下降?揭秘vmknic队列溢出与NSX-T叠加导致的隐性瓶颈(附tcpdump诊断模板)
  • 【AI帮我忙之补知识 显存和卡顿的关系】
  • 059、上下文管理器:with 语句的原理、contextlib 装饰器与嵌套资源管理
  • 【双Hypervisor时代生存手册】:从蓝屏崩溃到稳定并行——基于137家客户现场的Hyper-V/VMware共存失败根因分析报告
  • 5分钟解锁Honey Select 2完整游戏体验:HS2-HF补丁终极指南
  • 嵌入式调试工具选型指南:从BDM原理到USB Multilink与Cyclone PRO实战对比
  • UWB技术如何重塑汽车交互:从厘米级定位到数字钥匙与生命检测
  • UWB厘米级定位技术如何赋能医疗无人机精准配送
  • Linux服务器应急响应:使用iptables快速封禁漏洞端口实战指南
  • 5个必知技巧:HunterPie游戏数据覆盖插件让你的《怪物猎人:世界》狩猎效率提升300%
  • Hyper-V与VMware同台运行的终极方案:Intel VT-x/AMD-V硬件级隔离配置清单(含BIOS/UEFI 8项关键开关校验表)
  • Selenide入门指南:简化Selenium UI自动化测试的配置与实战
  • Display Driver Uninstaller (DDU):专业显卡驱动深度清理技术解析
  • 论文写到一半卡壳了?高校教授说用这几个一键生成论文工具
  • Gemini 3.1 Pro免费使用指南:5种谷歌官方零成本接入方式
  • 如何深度掌握联发科设备调试:专业级底层控制完全指南
  • ComfyUI启动失败?3步快速诊断与修复指南 [特殊字符]
  • 嵌入式Web服务器与AJAX实时数据监控方案实践
  • 基于MCP1633的SEPIC LED驱动设计:宽电压输入恒流方案详解
  • Windows终极DLL注入工具Xenos:5大高级特性深度解析
  • Kinetis SDK环境搭建:从工具链配置到第一个工程调试
  • VMware替代不是换软件,而是重构IT底座:2025国产化率达标红线下的4层解耦策略(含Kubernetes+裸金属混合架构图谱)
  • ZigBee ZCL Alarms集群:物联网设备告警机制与工程实践详解
  • 学生团队如何用一年打造碳捕获汽车?揭秘全生命周期可持续创新
  • 如何免费解锁网易云NCM加密音乐:ncmdumpGUI完整使用指南
  • ViGEmBus虚拟控制器驱动完全指南:Windows游戏设备兼容性终极解决方案
  • Linux环境下Java AES/CBC加密实战:BouncyCastle集成与跨平台一致性解决方案
  • MinerU 3.4.0 PDF/文档转 Markdown/Word软件免安装一键启动整合包
  • 系统故障恢复
  • 别再交“隐形学费”!ESXi Free版5大性能陷阱:内存气球驱动缺失、无vMotion、无DRS…第4条90%运维都踩过坑