当前位置: 首页 > news >正文

前期工作总结

任务:各自把前期工作总结,包括主要使用的模型或技术介绍,附上博客链接。

1. BERT模型的改进

使用模型为bge-large模型替换bert。

bge模型(M3)以及BGE模型使用的预训练方法RetroMAE的具体技术介绍见:《M3-Embedding》汇报-CSDN博客

将BERT模型替换为BGE模型之后,由另一位同学在此基础上加入rerank模型进行重排序。

之后将large+rerank模型与有数据库版本的心法系统进行整合。

测试主要包含以下的不足:

  1. rerank模型会出现多线程错误:由于模型比较大,计算速度很慢,当带搜索框输入一条问题,并删除,再接着输入问题时,会因为前端快速连续搜索导致多个请求同时到达,导致多线程并发问题。但是只要删掉问题,等过一会模型就会自动恢复。(但是测试的结果展示,rerank加入确实有助于问答对的匹配)
  2. 关于速度的问题:模型加载缓慢,代码运行启动时,可能需要半小时。搜索框搜索稳定时,可以需要5分钟时间。
  3. 关于代码部分:进行整合的过程中发现,其实代码里面有一些逻辑问题。比如关于阈值问题,由于rerank模型控制输出5条结果,那么阈值的作用就显得没那么重要了,那么就需要考虑删除的问题。还有一些比较细节的问题,但是由于时间和测试比较麻烦(因为启动时间很长)的原因,没有进行一一排除。但是总体来说,代码是可以跑通的。

2. 标签预测

目前暂时使用利于语义来匹配标签预测:将新添加的问答对进行一个相似度计算,计算出最相似的问答对,将最相似的问答对的标签赋给新进来的问答对。

具体使用的逻辑如下:

  1. 计算问题与知识库中所有问题的相似度,取最相似的5个问题。
  2. 统计这5个问题中每个一级标签的权重(权重为所有属于该一级标签的问题的相似度之和)。
  3. 选择权重最高的一级标签。
  4. 然后,针对该一级标签,统计这5个问题中属于该一级标签的问题的二级标签,每个二级标签的权重为包含它的问题的相似度之和。
  5. 选择权重最高的1-3个二级标签(如果不足3个,则全部选择;如果超过3个,选前3个)。

利用上面逻辑来保证一级标签和二级标签的从属关系。

上面方法的不足如下:

  1. 如果数据集中没有与新问题相似的问题,那么预测可能不准确。

  2. 如果数据集中存在错误标签,也会影响预测结果。

http://www.gsyq.cn/news/94736.html

相关文章:

  • 智乃的数字【牛客tracker 每日一题】
  • [UUCTF 2022 新生赛]ezpop
  • GitHub中文排行榜终极指南:新手快速发现优质开源项目的完整教程
  • MAUI跨平台云同步终极指南:轻松实现多设备数据无缝流动
  • 3分钟快速上手:WhiteSur主题打造macOS风格Linux桌面完整指南
  • 24
  • GPT-5如何通过新框架减少30%政治偏见
  • 光伏三相并网仿真 模型内容: 1.光伏+MPPT控制+两级式并网逆变器(boost+三相桥式逆...
  • elastic/kibana 升级问题
  • 15、Linux系统管理实用指南
  • 腾讯混元语音驱动数字人技术:重塑动态视频生成新范式
  • SAP业财一体化实现的“隐形桥梁”-价值串
  • 25、技术探索:Google App Engine、Zenoss与Python包管理
  • 5分钟掌握AI驱动飞船设计:用智能参数优化打造专属星际舰队
  • 高中数学
  • 中国独立开发者创业实战指南:从技术到商业的变现路径
  • eHR品牌TOP5年度榜单公布!HR系统/HR管理系统市场主流公司推荐 - 全局中转站
  • 32、Django Web 应用开发实战指南
  • 24、Python在多操作系统及云计算环境中的应用
  • 【Ubuntu】『You are in emergency mode, After logging in, type “journalctl -xb“ to view system logs,...』
  • 格子波尔兹曼LBM在甲烷吸附解吸研究中的应用及文献复现
  • TCR-T细胞疗法
  • 2025最新人力资源系统/人力资源管理系统top5推荐!市场主流公司权威榜单发布 - 全局中转站
  • DeepSeek-R1 与 OpenAI o3 的启示:Test-Time Compute 技术不再迷信参数堆叠
  • 强化学习——PPO、DPO、GRPO的原理推导
  • Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?
  • FLAC3D随机裂隙建模:从基础到复杂网络
  • 北京老药丸回收服务权威推荐榜单 - 品牌排行榜单
  • 元素周期表1.0.7更新
  • Level 0 → Level 1