当前位置: 首页 > news >正文

多模态大模型Grounding目标检测数据集大全 「包含Grounding数据标注+训练评估脚本」(持续原地更新)

一、作者介绍:七年+算法开发经验、AI 算法经理、阿里云专家博主。擅长:检测、分割、理解、大模型等算法训练与推理部署任务。

二、数据集介绍

  • 质量高:高质量图片、高质量标注数据,原始目标检测标注框使用 labelimg 软件吐血标注、整理,可以作为训练模型的基础数据集或者作为原数据集的很好补充皆可;
  • 范围广:数据集涉及目标场景范围广,避免算法收敛到某一、某些固定场景;
  • 格式内容标注:组织成 ms-swift 支持的 jsonl 形式的多模态大模型 Grounding 任务自定义数据集格式;
  • 附加训练脚本:提供 ms-swift + Qwen3-VL 一键训练、测试、可视化检测结果脚本;;

下载说明:点击数据集对应的蓝色超链接即可跳转自行下载,如还未添加蓝色超链说明该数据集还在标注中还没发布,如果其他类型的数据集可以私信联系博主。另外未来新增数据集本帖原地更新,多模态大模型 Grounding 目标检测数据集汇总篇不再另开新篇,建议收藏关注 ~

Grounding数据集标注格式 (仅示例)

目录

交通相关

恶劣天气场景车辆检测数据集

动植物相关

苹果检测数据集

更多数据集更新中

交通相关

恶劣天气场景车辆检测数据集

  • 数据集介绍:恶劣天气场景车辆检测数据集,真实场景高质量图片数据,涉及场景丰富,比如暴雨天气道路、大雾天气高速、冰雪天气路面、夜间低光照、强逆光干扰、雨雪遮挡数据等,且类别丰富,划分为 "bike"、"bus"、"car"、"motor"、"person"、"rider"、"truck" 7 个类别;
  • 适用实际项目应用:恶劣天气交通监控场景下多目标检测项目,以及作为智能驾驶辅助、道路安全预警系统数据集场景数据的补充;
  • 标注说明:原始目标框标注信息采用 labelimg 标注软件进行标注,标注质量高,然后组织成多模态大模型 Grounding 目标检测数据集格式 (参考 ms-swift 自定义 Grounding 数据集格式 jsonl),可以直接用于如 Qwen3-VL 等的多模态大模型的训练;
  • 附赠训练示例:提供 ms-swift + Qwen3-VL 一键训练、测试、可视化检测结果脚本;

数据集点击蓝色链接下载 (若想要更多数量数据集请联系博主 ~):

  • 1000 张图片:多模态大模型Grounding目标检测数据集_恶劣天气场景车辆检测数据集_1000张图_+对应ms-swift+Qwen3-VL一键训练评估脚本
  • 更多:待更新
数据集缩略图截图
labelimg标注截图

动植物相关

苹果检测数据集

  • 数据集介绍:苹果检测数据集,真实场景高质量图片数据,涉及场景丰富,比如果园成熟苹果、采摘期苹果、枝叶遮挡苹果、果实密集分布、水果店苹果数据等,划分为 "apple" 一个类别;
  • 适用实际项目应用:果园智能采摘与产量估算场景下苹果识别项目,以及作为水果分选流水线、农业机器人视觉系统数据集场景数据的补充;
  • 标注说明:原始目标框标注信息采用 labelimg 标注软件进行标注,标注质量高,然后组织成多模态大模型 Grounding 目标检测数据集格式 (参考 ms-swift 自定义 Grounding 数据集格式 jsonl),可以直接用于如 Qwen3-VL 等的多模态大模型的训练;
  • 附赠训练示例:提供 ms-swift + Qwen3-VL 一键训练、测试、可视化检测结果脚本;

数据集点击蓝色链接下载 (若想要更多数量数据集请联系博主 ~):

  • 1000 张图片:多模态大模型Grounding目标检测_苹果检测数据集_1000张图_+对应ms-swift+Qwen3-VL一键训练评估脚本
  • 3000 张图片:多模态大模型Grounding目标检测_苹果检测数据集_3000张图_+对应ms-swift+Qwen3-VL一键训练评估脚本
  • 更多:待更新
数据集缩略图截图
labelimg标注截图

更多数据集更新中

其他数据集需求私信联系博主 ~

http://www.gsyq.cn/news/1330436.html

相关文章:

  • 乐鑫ESP-Mesh-Lite无线自组网方案:从原理到大规模物联网部署实战
  • 告别虚拟机!在WSL2里搞定i.MX6开发板的QT交叉编译(实测避坑)
  • 2026桂林市秀峰区黄金回收铂金回收白银回收深度实测 五大正规门店横屏 报价透明 免费上门才是真靠谱 - 亦辰小黄鸭
  • AES128加密实战:用C语言写一个加密函数,并集成到你的STM32项目里
  • CAD新手别再用直线硬画了!用PL命令的‘A’和‘R’快速搞定带半径的圆弧多段线
  • 别再只复制代码了!手把手教你理解UniApp Map组件的定位、气泡与事件交互(附完整项目源码)
  • 企业级跨平台媒体资源管理:BiliTools架构设计与微服务实践
  • SpringBoot接口规范进阶:参数校验、文档生成、安全幂等与性能监控
  • 古镇慢游不赶场,沉浸式感受烟火里的旧时光
  • GCP上跑DeepSeek R1竟比AWS贵42%?深度剖析e2-highmem-16 vs. a2-ultragpu-1g成本模型与吞吐量拐点
  • Android Auto真正价值在默认应用外!六个应用让驾驶更轻松、生活更便利
  • Docker容器化高可用架构部署方案(十一)
  • 再议指针变量和普通变量
  • 谐振电路分析
  • 【Perplexity词汇查询功能深度解密】:20年NLP专家亲授3大隐藏技巧,90%用户从未用过的高效查词法
  • Perplexity搜索结果突然失准?三类隐性偏见陷阱正在吞噬你的决策质量(附MIT媒体实验室2024最新评估报告)
  • 2026年宁波短视频代运营哪家靠谱:本地获客转化完全指南 - 优质企业观察收录
  • 2026佛山市顺德区黄金回收铂金回收白银回收深度实测 五大正规门店横屏 报价透明 免费上门才是真靠谱 - 亦辰小黄鸭
  • 告别软件模拟!用STM32硬件IIC驱动OLED,U8g2库移植保姆级教程(Keil+STM32CubeMX)
  • 仅剩最后47份!《Midjourney概念艺术创作密钥手册》(含23个受版权保护的材质编码+动态光照参数表)
  • 如何在5分钟内掌握VSCode Mermaid图表实时预览:开发者终极指南
  • SoM嵌入式开发实战:从选型到量产的全流程解析
  • 2026桂林市雁山区黄金回收铂金回收白银回收深度实测 五大正规门店横屏 报价透明 免费上门才是真靠谱 - 亦辰小黄鸭
  • 解密B站缓存转换:m4s-converter让你的珍藏视频永不丢失
  • 2026海口市龙华区黄金回收铂金回收白银回收深度实测 五大正规门店横屏 报价透明 免费上门才是真靠谱 - 亦辰小黄鸭
  • 经典的网格寻路问题实例分析
  • 别只盯着S21!用ADS仿真LNA时,这3个容易被忽略的细节(稳定性、实际元件模型、噪声圆)才是成败关键
  • 别再折腾gcc版本了!Ubuntu 20.04下用Docker一键搞定OLLVM编译环境
  • Python跨平台应用开发终极指南:用Flet框架轻松构建桌面、移动和Web应用
  • Translumo:Windows平台的开源实时屏幕翻译解决方案