智能语音识别中继网关-可白嫖轮询理论上支持市面上90%asr语音识别需求。可二次开发对接
ASR Relay Gateway - 智能语音识别中继网关
产品简介
ASR Relay Gateway 是一款企业级的智能语音识别中继网关系统,专为需要高质量语音识别服务的开发者和企业设计。它集成了多家主流语音识别厂商,提供统一的API接口、智能路由、负载均衡、故障自动切换等核心功能,让您轻松构建稳定可靠的语音识别服务。
核心优势
1. 多厂商智能路由
- 大主流厂商:支持OpenAI Whisper、阿里云DashScope、小米MiMo、科大讯飞语音听写、科大讯飞AIUI、阿里云一句话识别等
- 智能负载均衡:基于优先级和权重的智能流量分配
- 故障自动切换:厂商故障时自动切换到备用厂商,保障服务可用性
- 多种部署模式:支持主备模式、负载均衡、灰度测试等
2. 企业级多租户架构
- 完善的权限管理:基于角色的访问控制(RBAC),支持超级管理员、租户管理员、普通用户等多种角色
- 多级租户隔离:支持根租户、子租户、孙租户的多级架构
- 灵活的配额管理:支持按用户设置调用配额和限流策略
3. 全面的计费与监控
- 实时统计:今日调用量、成功数、音频时长、活跃租户等关键指标
- 趋势分析:7天/30天调用趋势图表,直观展示使用情况
- 详细日志:完整的调用日志记录,支持按时间、租户、厂商等条件筛选
- CSV导出:支持将日志数据导出为CSV格式
4. 灵活的API接入方式
提供四种不同的API调用模式,满足不同场景需求:
- 直连模式:直接发送PCM音频到网关
- 代理模式:OpenAI兼容格式,支持WAV音频文件
- 兼容协议:Token+ASR两步调用模式
- AIUI兼容:兼容讯飞AIUI协议
功能详解
1. 仪表盘 - 一目了然的数据监控
核心功能:
- 实时统计卡片:显示今日调用量、成功数、音频时长、活跃租户
- 调用趋势图表:支持7天和30天时间维度的趋势分析
- 数据可视化:柱状图+折线图的复合图表,直观展示业务数据
使用方法:
- 登录系统后自动进入仪表盘页面
- 查看统计卡片了解今日业务概况
- 点击"7天"或"30天"按钮切换时间范围
- 鼠标悬停图表查看详细数据
2. 用户管理 - 灵活的用户生命周期管理
核心功能:
- 用户列表:ID、用户名、类型、角色、上级、余额、状态、创建时间
- 搜索筛选:支持按用户名/姓名/手机/邮箱搜索,按类型、状态、角色筛选
- 用户操作:创建用户、编辑信息、重置密码、充值余额、管理API Keys
- 状态切换:一键启用/禁用用户账户
使用方法:
- 点击"+ 创建用户"按钮添加新用户
- 填写用户名、密码、用户类型、角色等信息
- 为用户设置每日调用配额和限流策略
- 使用搜索框快速查找用户
- 点击操作列的按钮管理用户
3. 角色管理 - 细粒度的权限控制
核心功能:
- 预置角色:超级管理员、租户管理员、租户观察者、代理商管理员、普通用户、观察者
- 权限配置:9个功能模块的细粒度权限控制
- 用户绑定:显示每个角色绑定的用户数量
- 自定义角色:支持创建自定义角色
使用方法:
- 查看预置角色的权限配置
- 点击"编辑权限"按钮配置角色权限
- 勾选/取消勾选功能模块
- 点击"+ 创建角色"创建自定义角色
- 为角色分配合适的权限组合
4. API Key管理 - 安全的密钥管理
核心功能:
- API Key列表:ID、名称、密钥值、关联用户、状态、最后使用时间
- IP白名单:基于IP的访问控制,增强安全性
- 快速操作:一键复制密钥、启用/禁用状态切换
- 批量管理:支持批量创建和管理API Key
使用方法:
- 点击"+ 创建 API Key"生成新密钥
- 为API Key设置名称和关联用户
- 使用复制按钮快速复制密钥值
- 切换到"IP 白名单"标签页管理IP访问控制
- 点击"+ 添加白名单"添加允许访问的IP地址
5. 厂商管理 - 智能的多厂商路由
核心功能:
- 厂商列表:8大主流语音识别厂商
- 配置指南:核心概念、路由流程、配置方案
- 优先级权重:基于优先级和权重的智能流量分配
- 健康检查:厂商状态监控和故障自动切换
配置方案示例:
- 主备模式:科大(权重90) + 小米MiMo(权重10)
- 负载均衡:三个厂商各33%流量
- 按能力分配:科大50% + 阿里云30% + 小米MiMo20%
- 灰度测试:新厂商5%流量测试
使用方法:
- 点击"添加厂商"按钮添加新厂商
- 配置厂商的API地址、模型、优先级、权重
- 查看配置指南了解最佳实践
- 启用/禁用厂商状态
- 监控厂商健康状态
6. 计费管理 - 精准的费用控制
核心功能:
- 计费记录:按日期和租户汇总的使用统计
- 数据维度:日期、租户、调用次数、音频时长
- 多租户支持:按租户隔离的计费数据
- 精确计量:音频时长精确到小数点后4位
使用方法:
- 查看计费记录了解各租户的使用情况
- 按日期筛选查看历史数据
- 切换到"IP 白名单"标签页管理访问控制
- 使用统计数据分析使用趋势
7. 调用日志 - 全面的调用追踪
核心功能:
- 日志列表:时间、Trace ID、租户、IP、厂商、状态、耗时、时长、结果
- 筛选查询:支持按时间范围筛选
- 数据导出:支持CSV格式导出
- 日志清理:支持7天、30天、全部清理
使用方法:
- 设置开始和结束日期筛选日志
- 点击"查询"按钮查看筛选结果
- 点击"导出 CSV"按钮导出数据
- 使用"清理日志"功能释放存储空间
- 查看详细日志了解调用详情
8. 系统配置 - 灵活的系统设置
核心功能:
- 功能开关:调用日志开关、ASR识别缓存开关
- 缓存配置:支持1小时到7天的缓存时间设置
- 厂商配置:厂商失败次数限制、自动恢复时间、重试次数
- Webhook集成:ASR识别完成后的异步回调通知
配置项说明:
provider_max_failures:厂商最大连续失败次数(默认3次)provider_recovery_seconds:厂商自动恢复时间(默认60秒)provider_max_retries:单次请求最大重试次数(默认2次)asr_cache_enabled:ASR识别结果缓存开关asr_cache_ttl:ASR缓存过期时间(默认24小时)
使用方法:
- 切换功能开关启用/禁用特定功能
- 配置缓存时间优化性能
- 设置Webhook URL接收识别结果回调
- 调整厂商管理参数优化服务稳定性
9. API文档 - 开发者友好的接口文档
核心功能:
- 四种调用模式:直连模式、代理模式、兼容协议、AIUI兼容
- 详细示例:每种模式都提供完整的curl示例
- 认证说明:多种认证方式的详细说明
- 错误码文档:完整的错误码和响应格式说明
四种调用模式:
模式一:直连模式
curl-XPOST http://本网站域名/asr/1\-F"token=YOUR_API_KEY"\-F"file=@/path/to/audio.pcm;type=application/octet-stream"模式二:代理模式
curl-XPOST http://本网站域名/v1/audio/transcriptions\-H"Authorization: Bearer YOUR_API_KEY"\-F"file=@/path/to/audio.wav"模式三:兼容协议
# 1. 获取Tokencurl-XPOST http://本网站域名/server/api/auth/v2/ip-token\-H"Content-Type: application/json"\-d'{"appKey":"YOUR_API_KEY","appSecret":""}'# 2. ASR识别curl-XPOST http://本网站域名/open/asr/sentence/v1/recognition\-H"aitoken: YOUR_JWT_TOKEN"\-H"format: pcm"\--data-binary @/path/to/audio.pcm模式四:AIUI兼容
curl-XPOST http://本网站域名/v2/aiui\-H"X-Appid: YOUR_API_KEY"\-H"X-CurTime: 1781838696"\-H"X-Param:$(echo'...'|base64-w0)"\-H"X-CheckSum: xxx"\--data-binary @/path/to/audio.pcm使用场景
1. 智能客服系统
- 集成多厂商语音识别,提供高可用的语音转文字服务
- 通过智能路由实现故障自动切换,保障服务连续性
- 使用计费功能控制成本,按实际使用量付费
2. 语音助手应用
- 支持多种音频格式(PCM、WAV),满足不同设备需求
- 提供低延迟的语音识别服务,提升用户体验
- 通过API Key管理实现多用户隔离
3. 会议记录系统
- 实时语音转文字,自动生成会议记录
- 支持长时间音频处理,满足会议场景需求
- 通过日志功能追踪调用情况,便于问题排查
4. 教育培训平台
- 为在线教育提供语音识别能力
- 支持多租户架构,为不同机构提供独立服务
- 通过权限管理控制不同角色的访问权限
技术架构
后端技术栈
- Swoole:高性能协程HTTP服务器
- PHP:稳定可靠的后端语言
- SQLite/MySQL:灵活的数据库支持
- Redis:高性能缓存和会话管理
前端技术栈
- Vue 3:现代化的前端框架
- Vite:快速的开发构建工具
- Tailwind CSS:实用的CSS框架
- ECharts:强大的数据可视化库
核心特性
- 协程HTTP连接池:高并发下的稳定连接管理
- 智能负载均衡:基于优先级和权重的流量分配
- 故障自动恢复:厂商健康检查和自动切换
- 多租户隔离:完整的数据和权限隔离
部署方式
1. 环境要求
- PHP 8.0+ with Swoole扩展
- Redis for缓存和会话
- SQLite or MySQL for数据存储
2. 快速部署
# 克隆项目gitclone<repository-url># 安装后端依赖cdbackendcomposerinstall# 安装前端依赖cd../webnpminstall# 构建前端npmrun build# 启动后端服务cd../backend php bin/start.php3. 配置说明
- 配置文件位于
backend/config/目录 - 数据库配置:
database.php - 应用配置:
app.php - 路由配置:
routes.php
安全特性
1. 认证与授权
- JWT Token认证,支持自定义有效期
- 基于角色的访问控制(RBAC)
- API Key级别的权限管理
2. 访问控制
- IP白名单机制,限制访问来源
- 用户级别的配额和限流控制
- 多租户数据隔离
3. 数据安全
- 敏感信息加密存储
- 完整的审计日志
- 定期数据备份机制
性能优化
1. 高并发处理
- Swoole协程服务器,支持高并发连接
- HTTP连接池复用,减少连接开销
- 异步非阻塞IO处理
2. 缓存优化
- ASR识别结果缓存,减少重复调用
- Redis缓存热点数据
- 可配置的缓存过期策略
3. 资源管理
- 智能的厂商故障检测和切换
- 自动的资源清理和回收
- 灵活的日志轮转机制
技术支持
1. 文档支持
- 完整的API接口文档
- 详细的部署指南
- 丰富的配置说明
2. 社区支持
- 开源社区贡献
- 问题反馈和讨论
- 持续的功能更新
3. 企业支持
- 定制化开发服务
- 技术咨询和培训
- 7x24小时技术支持
总结
ASR Relay Gateway 是一款功能强大、易于使用的智能语音识别中继网关系统。它通过多厂商智能路由、企业级多租户架构、全面的计费监控等功能,为企业和开发者提供了稳定可靠的语音识别服务解决方案。
无论您是构建智能客服系统、语音助手应用,还是会议记录平台,ASR Relay Gateway 都能满足您的需求。立即开始使用,体验智能语音识别的便捷与高效!
