当前位置: 首页 > news >正文

对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法

概述

LLM 的计算资源和能耗与模型中的标记数成正比增长。为了减少标记符的数量,设计高效的标记符生成器非常重要。目前许多标记化器都是针对静态、结构化语料库(如书籍和网络文本)进行优化的。然而,聊天机器人是 LLM 在实践中的主要应用,主要是具有不同输入和输出格式的对话文本。

针对这一空白,本研究重新设计了 “对话优化标记符号化器”。具体地说,我们使用真实世界的聊天数据 LMSYS Chat 1M 重新训练了几种 LLM 的标记化器。

结果表明,标记符号的减少量最高可达 10%,甚至更多,这表明了提高能效的潜力。另一方面,对训练语料的影响有限,预计对模型性能的负面影响也很小。

建议采用的方法

本研究探讨了能否针对会话数据优化现有的标记符号生成器,以减少标记符号数量和推理过程中的能耗成本。

作为该方法的第一步,LMSYS Chat 1M 语料库的 80% 用于训练,20% 用于评估。然后建立三种类型的标记化器,仅使用用户输入、仅使用模型响应或同时使用用户输入和模型响应进行重新标记化。为确保公平比较,重新训练使用的算法和设置与每个模型的原始标记化器相同。

生育率"(每个词的标记数)和 "标记减少率 "用于评估。作为文本压缩效率的一项指标,"生字率 "尤其有用。与原始标记器相比,重新标记的模型在减少标记总数方面表现出一致的趋势。在回复方面的优化尤其有效,这也与聊天回复占大部分文本的情况相符。

结论是,这些设计可以在不影响模型通用性的情况下对标记符进行实际改进。

实验

本研究通过三项实验测试了对话优化标记符的有效性。

在第一个实验中,对八个 LLM 模型(GPT-4、GPT-4o、DeepSeek-R1、LLaMA-3.1、Gemma-2、Mistral-7B、BLOOM 和 Phi-4)中现有标记符的性能进行了评估。结果表明,所有模型在对话数据上的标记效率(生育率)都有所下降,这表明有必要进行优化。

接下来的实验证实,重新训练的标记符号生成器可以比原始标记符号生成器减少 5-10% 或更多的标记符号。其中,Gemma-2、Mistral-7B 和 BLOOM 的改进幅度超过了 10%,而针对具体语言的分析也表明,在英语和西班牙语等数据量大的语言中,减少幅度更为明显。

最后一项实验研究了重新训练的标记符对传统训练数据(C4 语料库)的影响。在大多数模型中,标记数只增加了 1-2%,而在某些模型中,标记数在某些情况下反而减少了。这表明,引入会话优化并不会明显降低模型的通用性。

http://www.gsyq.cn/news/102750.html

相关文章:

  • 3.2 理解AI Agent工作原理:构建复杂任务自动化系统
  • Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间的提示中遗忘信息
  • 阿里云ESA:一起领ESA免费套餐,CDN升级版防护加速服务。
  • 如何优化TCP总结
  • FMEA在软件可靠性测试中的实践与应用
  • 利用LobeChat生成技术文档:提升开发效率的新思路
  • Playwright MCP在UI自动化测试中的定位与思考
  • 纳西东巴画系统管理平台--毕设附源码68202
  • 9、探索元宇宙中利用摄影测量和其他3D重建工具的增强现实实际用例
  • 采用Flask框架的不动产租赁业务管理系统--毕设附源码68285
  • WebGL渲染引擎图层合成技术终极指南:从深度冲突到完美融合的完整解析
  • 部署到服务器调用麦克风没有ssl证书的情况下的临时使用方式
  • 14、OpenStack 实例网络连接与安全组管理指南
  • 2025年靠谱的六角不锈钢螺栓用户口碑最好的厂家榜 - 品牌宣传支持者
  • 数据库死锁问题重现:测试场景构建与排查指南
  • 2025年智能检索工具五大服务商推荐:实力强的智能检索平台有 - myqiye
  • 15、OpenStack 安全组管理全攻略
  • DBeaver数据库管理终极入门指南:从零开始掌握高效数据管理的10个技巧
  • 2025年比较好的135度异型铰链行业内口碑厂家排行榜 - 行业平台推荐
  • 2025腾讯混元7B大模型本地部署实战指南:从零搭建到高效推理
  • 实测数据出炉:保健品akg哪个品牌好?akg抗衰老产品十款推荐! - 博客万
  • 深度解析2025年12月企业境外投资备案代理市场 - 2025年品牌推荐榜
  • Apache2一句话木马
  • 57、Linux 网络地址配置与管理全解析
  • RocketMQ 生产者 / 消费者核心原理:发送机制、订阅模式与 ACK 机制详解
  • 前端如何实现分页?零基础入门到精通,收藏这篇就够了
  • Gazebo仿真环境搭建:5步快速构建专业虚拟测试平台
  • GinFast 插件管理系统深度解析与开发规范
  • 2025年最新前端面试题汇总,零基础入门到精通,收藏这篇就够了
  • SFT(监督微调)实战宝典:从零开始掌握大模型微调技巧 | 程序员必学,建议收藏