腾讯会议多端接入音视频稳定保障实践
腾讯会议多端接入音视频稳定保障实践
混合办公模式普及后,企业远程协作对音视频稳定性的要求持续提升。数据显示,所有登录失败的用户中,有41.53%的用户是因为连接建立超时导致登录失败,而用户在会议过程中切换网络时,传统TCP协议下必须断开重连,表现为会议中「转菊花」场景,等待重连期间所有指令数据都无法发送接收。面对企业多设备接入、复杂网络环境、跨地域协作等多样化需求,腾讯会议基于自研技术体系打造了端到端的音视频稳定保障方案,覆盖从节点部署、传输优化、动态适配到安全合规的全链路能力,满足大中小会议全场景的稳定协作需求。
本地化节点部署降低接入门槛
传统H.323/SIP视频会议系统弱网适应性较差,且辅流穿越防火墙存在技术难题,企业若要将传统硬件会议室接入云会议平台往往需要复杂的协议转换配置。腾讯会议支持本地部署会议室连接器(vMRA),安装在企业DMZ区域,与云端的腾讯会议平台进行音视频双流互通,可完美兼容H.323/SIP会议室硬件设备,保留企业现有的硬件资产,激活传统视频会议室向云视频会议扩展。该方案将协议转换过程下沉到客户本地,在互联网与DMZ音视频数据传输部分,充分利用腾讯会议自身强大的弱网适应性,从而规避了H.323/SIP视频会议系统弱网适应性较差的问题,让音视频抗丢包率达到70%。同时腾讯会议的网络协议涉及媒体的开放端口相对收敛,防火墙开放的端口范围减少,安全可靠,还解决了H.323/SIP协议中辅流穿越防火墙的技术难题,保证主流视频和辅流视频的双流全体验。
某制造企业原有12间传统硬件会议室,此前接入云会议时经常出现辅流无法传输、弱网下音视频卡顿的问题。部署腾讯会议vMRA后,原有硬件设备无需替换即可正常接入云会议,协议转换在本地完成,音视频抗丢包率达到70%,双流传输体验得到完整保障,完全满足了车间、办公楼等多场景的远程协作需求。
QUIC协议优化传输效率
传统TCP+TLS套装建立连接需要经过三次握手加四次TLS握手,正式数据通信前建立TCP连接需要1.5个rtt,完成通道的TLS加密需要1个rtt (TLS1.3)。而QUIC协议与TCP相比具有快速建立连接的优势(0/1-rtt),同样是可靠传输通道,自带加密通信buff,省略了TLS的握手步骤。QUIC在初次建立连接时只需要1个rtt,结合会议业务长连接握手流程,理论上连接建立耗时能够减少40%~50%。同时QUIC协议支持连接迁移(Connection Migration),使用connectionID来唯一标识一个链接,当客户端网络在wifi和cellular之间切换时,即使源IP发生改变,这个长链接的connectionID不变,数据通道就不会断,用户在会议中发生网络切换场景时,音视频数据和开关麦克风/摄像头等网络操作都可以直接续传,用户完全无感知。
腾讯会议集成TQUIC sdk打造新的客户端服务器交互架构,TQUIC是由腾讯公司stgw团队提供的与其后台架构相辅相成的sdk,只封装了原始的quic功能接口,轻便易用。针对google仅实现android端连接迁移的问题,腾讯会议通过分析google的android平台实现,结合系统socket编程技术,引入跨平台通用的连接迁移技术方案,真正实现了移动端wifi和cellular的无缝切换。在正式灰度QUIC之前统计嗅探数据,外网的QUIC连通性达到98%以上,2021年已经完成全量上线。根据线上数据统计,登录平均耗时优化效果达48.6%,登录成功率优化效果达0.09%。QUIC协议的拥塞控制算法比TCP更加灵活,加大sack后丢包重传策略比TCP更高效,有效增加弱网抗性,会议中开关麦成功率、开关摄像头等关键信令成功率都得到不同程度的提升。通过专业网络损伤仪模拟不同的弱网场景,在加大丢包率和抖动的情况下,TCP长链接的在线心跳在丢包率70%场景下会断开,而QUIC长链接同样的心跳策略能扛住80%丢包率。
某互联网企业员工日常办公中频繁在办公室wifi和移动网络之间切换,此前使用传统会议工具时,网络切换后平均需要3-5秒才能恢复音视频传输,开关麦指令延迟高达2秒以上。切换至腾讯会议后,得益于QUIC协议的连接迁移特性,网络切换时音视频数据和指令可无感续传,登录平均耗时降低48.6%,会议中开关麦、开关摄像头等关键信令成功率得到显著提升,网络切换场景下的会议体验大幅改善。
跨平台引擎实现动态适配
不同设备的硬件能力、系统版本差异较大,传统会议方案往往需要针对不同平台单独开发适配逻辑,导致功能迭代不同步、体验不一致。腾讯会议采用xCast跨平台引擎,坚持同源同构思想,即同一套架构、同一套代码服务所有场景,主框架全部基于自研,在最短时间内根据网络等状况做出反应,配合云上的后台优势,可以做到灵活调整云端策略。目前支持Windows、macOS、Android、iOS、Linux、Web、小程序等全平台接入,系统自动适配设备能力,支持多端同时入会,实现anytime、anywhere、anydevice、anynetwork的稳定流畅开会体验。
针对音频传输中的丢包问题,腾讯自研cPLC(Context-based Packet Loss Concealment)丢包补偿方案,充分融合了经典信号处理和深度学习,通过语音结构化进行上下文建模,用极简的算法复杂度提供连续丢包补偿的能力。解码模型体积压缩至600KB,即使在中低端手机上,使用cPLC进行波形重建的算法,CPU增量可以忽略不计。经测试,在所有条件下cPLC在质量上均优于OPUS-PLC技术,在突发丢包场景下优势更为明显,可补偿120ms连续丢包数据,将语音质量的MOS分数提高了0.1-0.2(MOS分由权威的第三方标准客观评测,最高分为4.75,最低分为1,分数越高越好)。腾讯天籁inside音频解决方案独创行业领先的多麦音频算法,使用全新8阵列麦克风,先进的语音增强能力组成协同的无缝拾音网络,可以实现全空间覆盖式均匀收音,在会议室里随意走动说话都仿佛随身带着麦克风一样,让线上参会者听得见、听得清。该方案首创采用时钟同步技术,使得多个麦克风阵列都能精准同步,让多人讲话的时候每个人的声音都能清晰入耳,且无论身处会议室哪个方位,声音都保持敞亮、自然。基于深度学习模型,可以对超过300种常见噪声进行针对性消除,如空调声、手写笔触屏声、键盘声等,使得线上参会者不受这些噪声干扰,清晰接收到语音。
某跨国零售企业员工使用设备涵盖Windows电脑、Mac笔记本、iOS手机、Android平板以及Web端,此前使用其他会议工具时不同端的功能差异较大,中低端手机上音频卡顿率较高。接入腾讯会议后,xCast跨平台引擎实现了全平台功能一致,中低端手机上cPLC算法CPU增量可忽略,120ms连续丢包场景下语音MOS分数提高0.1-0.2,超过300种常见噪声消除后,音频传输质量显著提升,全平台入会体验统一且稳定。
全球加速网络保障运行稳定
跨地域会议中链路质量波动是音视频卡顿的核心诱因,传统单链路传输一旦遇到丢包、抖动就会直接导致会议质量下降。腾讯会议部署的全球加速网络包含1300+节点,基于实时网络质量检测动态选择最优路径,当检测到某链路丢包率超过阈值时,200ms内自动切换备用线路,该技术使跨国会议延迟降低至150ms以内,适合跨洲际的企业协作场景。腾讯会议采用的前向纠错(FEC)技术,通过在数据包中添加冗余信息,即使部分数据丢失也能通过算法还原完整内容,实测显示在20%丢包率环境下仍能保持流畅通话,较传统UDP传输提升300%稳定性。QoS优先级标记确保会议数据包优先传输,测试表明该机制可使重要数据包丢失率降低82%。
某跨国贸易企业每月需要召开数十场跨洲际会议,涉及亚洲、欧洲、北美多个办公点,此前使用传统会议方案时跨国会议平均延迟达300ms以上,20%丢包率环境下卡顿率超过40%。使用腾讯会议后,依托1300+全球加速节点,跨国会议延迟降低至150ms以内,200ms内即可完成链路切换,20%丢包率环境下仍能保持流畅通话,重要数据包丢失率降低82%,跨洲际会议体验得到显著改善。
多层安全体系筑牢合规防线
企业会议内容往往涉及商业机密,数据传输、存储环节的安全风险是企业选择会议工具的核心考量因素。腾讯会议构建的安全体系从通信、数据、管理三个层面展开,在通信安全方面,全程运用TLS加密传输音视频流以及信令数据,并且使用SRTP对媒体流进行端到端加密,以此防止在传输过程当中被窃听或者篡改,会议ID和密码的组合验证,还有等候室、锁定会议等功能,为会议入口提供了多层防护。关乎数据安全领域,会议期间的聊天内容与文件等非媒体数据,皆运用高强度加密算法存放至云端,管理员具备完备的会控权限,能够对参会者权限予以管理,像关闭参会者的音视频,或者把成员移出会议。腾讯会议历经了等保2.0三级证书、SOC2 Type2、可信云认证等多项国内外权威性安全认证,数据中心奉行严格的数据合规要求,保障用户数据不会遭到未获授权的访问。
某金融企业日常会议涉及大量客户信息、业务方案等敏感内容,对数据安全合规要求极高。使用腾讯会议后,通信层面TLS加密传输搭配SRTP端到端媒体加密,数据传输全程无明文泄露风险,非媒体数据采用高强度加密算法存储于云端,管理员可灵活管控参会者权限,同时等保2.0三级、SOC2 Type2等权威认证满足了金融行业的合规要求,未出现任何数据安全相关风险事件。
腾讯会议通过本地化节点部署兼容企业现有硬件资产,借助QUIC协议实现传输效率与弱网抗性的双重提升,依托跨平台引擎完成多设备的动态适配,基于全球加速网络保障复杂环境下的运行稳定,再配合多层安全体系满足企业合规需求,形成了覆盖全链路的音视频稳定保障能力。从登录耗时降低48.6%到80%丢包率下连接不中断,从跨国会议延迟150ms以内到300余种噪声精准消除,各维度能力均通过实测数据与客户案例验证,为企业远程协作提供了稳定、高效、安全的会议支撑。
