当前位置: 首页 > news >正文

An Empirical Study on Commit Message Generation using LLMs via In-Context Learning 论文笔记

介绍

(1) 发表:ICSE'25

(2) 背景

最近的一些工作研究了基于 LLM 的提交信息生成,然而目前尚不清楚 LLM 通过 ICL 在该领域的表现如何

(3) 贡献

本文对通过 ICL 使用 LLM 进行提交信息生成进行了实证研究,并创建了一个新的数据集

工作

(1) 研究设计

  • RQ1:不同的提示和提示设置如何影响基于 ICL 的提交信息生成的性能?

    具体来说,我们根据是否提供了角色描述以及是否给出了约束信息来设计四个提示,并从三个维度(即数量、选择方式和顺序)研究演示设置

    所获得的发现:适度数量的演示会增强性能,但过多的演示会降低性能;基于检索的演示选择可以显著提高性能,而演示顺序对性能的影响最小;GPT-3.5-Turbo 和 DeepSeek-V2-Chat 是提交消息生成任务中性能最佳的 LLM。此外,在通用 LLM 上进行额外的代码预训练并不会产生更好的性能

  • RQ2:基于 ICL 的提交信息生成与最先进的方法相比如何?

    表现最好的 LLM 显著优于表现最好的基线,LLM 58.5% 的表现不佳案例是由不准确的测量引起的,这表明传统指标的局限性,迫切需要新的指标来准确评估基于 LLM 的提交消息生成方法的性能

  • RQ3:LLM 表现不佳的根本原因是什么?

    我们抽样了 200 个 LLM 未能在 RQ2 中做出准确预测的表现不佳的案例,并总结了根本原因的类别。LLM 表现不佳的主要根本原因是缺乏上下文知识、不利的演示和模型谬误。两种潜在的缓解策略是提供高质量的演示和改进大型语言模型

(2) 一些结论

迫切需要高质量的数据集, LLM 作为评估方式是很理想的

总结

基于 ICL 的提交信息生成的一个较为全面的实证研究

http://www.gsyq.cn/news/8386.html

相关文章:

  • Jetpack Navigation - 在 Fragment 中跳转到 Activity(4 种方式) - 详解
  • 强化学习之父 Richard Sutton: 如今AI正进入“经验时代” - 指南
  • 嵌入式笔记系列——UART:TTL-UART、RS-232、RS-422、RS-485 - 指南
  • 实用指南:【保姆级教程】TEXTurePaper运行环境搭建与Stable Diffusion模型本地化
  • 高级数据结构手册
  • 【无人艇协同】基于matlab面向海事安全的双体无人艇分布式协同任务规划(目标函数:总时间满意度)【含Matlab源码 14161期】博士论文 - 教程
  • 深入解析:【Fiora深度解析】手把手教你用固定公网IP搭建专属聊天系统!
  • 使用JavaScript和CSS创建动态高亮导航栏
  • wxt 开发浏览器插件的框架
  • Gridspech 全通关
  • 纯国产GPU性能对比,谁才是国产算力之王?
  • 英伟达入股英特尔,当竞争对手便成协作者,真正受益的......
  • ODT/珂朵莉树 入门
  • 绯闻女孩不只会八卦:从“验明正身”到“抓内鬼”,Gossip的进阶玩法
  • reLeetCode 热题 100- 15. 三数之和 - MKT
  • US$94 T300 Key Programmer Spanish Blue 2016 V16.8 Full
  • US$99 VVDI MB NEC Key Adaptor
  • testuserpython
  • [Nacos/Docker/MCP] Nacos 3.x : 为 AI MCP 而生
  • AIGC拾遗:Flash Attention
  • Python-CSV库
  • C++小白修仙记_LeetCode刷题_双指针
  • 前路漫漫亦灿灿 往事堪堪亦澜澜
  • 现代汽车前瞻杯2025牛客暑期多校训练营3
  • 详细介绍:[新启航]白光干涉仪在微透镜阵列微观 3D 轮廓测量中的应用解析
  • 2023 CCPC 深圳 F
  • 完整教程:【算法】双指针(三)[快慢指针]-快乐数
  • 9.19做题资料:哈希表查找时间复杂度分析
  • 实用指南:容器逃逸漏洞
  • 深入解析:卷对卷(Roll-to-Roll,R2R)技术的应用领域和技术进展