当前位置: 首页 > news >正文

域泛化DomainBed的评价指标含义解释

DomainBed是域泛化领域的公认框架,其统一了输入输出以及相关细节处理,使得泛化性能比较更加公平公正,但是庞大的框架使其理解十分困难,今天首先介绍其评价指标,即Selection字段。

结果展示

+------------+--------------+---------+---------+---------+---------+
| Selection  | art_painting | cartoon |  photo  |  sketch |   Avg.  |
+------------+--------------+---------+---------+---------+---------+
|   oracle   |   90.116%    | 85.181% | 96.856% | 80.852% | 88.251% |
|    iid     |   85.052%    | 75.373% | 97.680% | 69.943% | 82.012% |
|    last    |   85.357%    | 85.181% | 96.931% | 70.070% | 84.385% |
| last (inD) |   97.171%    | 95.840% | 96.226% | 95.395% | 96.158% |
| iid (inD)  |   97.342%    | 96.922% | 96.756% | 97.667% | 97.172% |
+------------+--------------+---------+---------+---------+---------+

以上结果,来自GGA(Gradient-Guided Annealing for Domain Generalization)在PACS数据集上的复现结果。

字段解释

  1. Oracle:理想化模型选择策略,使用测试域的数据直接选择模型参数,这是一个上界。在实际部署中,无法获取测试域的数据。
  2. iid:independent and identically distributed 独立同分布验证策略。从训练集中抽出一部分作为验证集,基于验证集正确率选择最佳模型,符合真实场景。也是论文中常采用的指标。最后,在测试域上进行评估正确率
  3. last:简单的基线策略,直接选择最后一个迭代或者epoch的模型,而不是用任何验证集进行选择。

以下是inD(in domain)域内系列

  1. last(inD):类似于last,但重心在in-domain的性能,即在于训练集相同分布的验证集或者测试集上的准确率。简而言之,选择最后一个模型,然后在训练域的测试数据上进行评估正确率
  2. iid(inD):与“iid”类似,使用独立同分布的验证集选择模型,但评估的是域内性能。简而言之,在iid中选择最佳模型,然后在训练域的测试数据上进行评估正确率

这两个评价指标不重要,只能作为参考,检查模型是否学到了训练域的特征或者在训练域的拟合程度,但不反映泛化能力,而域泛化的研究重心是域外的泛化能力,所以不重要。

http://www.gsyq.cn/news/12838.html

相关文章:

  • JUC: 线程锁
  • 实用指南:网络通信协议全解析:HTTP/UDP/TCP核心要点
  • macOS 多 Java 版本管理(jenv 方案)
  • AI 落地教育智慧招生:从 “热线占线” 到 “724 小时精准应答” 的实践分享
  • 软件技术基础第一次课程
  • 思维题练习
  • US$42 BDM01 Adapter for Yanhua Mini ACDP Module1 BMW CAS1-CAS4+
  • spatial项目的主要领导者斯坦福大学ppl实验室的 Kunle Olukotun 教授和 Christos Kozyrakis 教授
  • 程序杂谈:概述
  • 多态下,构造函数和析构函数的顺序,以及父类、子类的转换
  • US$49 B48 amp; MSV90 ISN Reading via OBD Authorization for Yanhua Mini ACDP
  • 在CodeBolcks下wxSmith的C++编程教程——使用 wxGrid
  • OI 笑传 #12
  • spatial芯片设计语言 学习笔记
  • 非诚勿扰 —— 大龄单身男,找人生合伙人,有意者邮件联系
  • soul 这款APP太差劲了,天天都有婚介加我,怎么个事情,还能不能好好的解决解决个人问题了
  • 【项目实战 Day7】springboot + vue 苍穹外卖架构(微信小程序 + 微信登录模块 完结)
  • LGP9755 [CSP-S 2023] 种树 学习笔记
  • Spring知识点(2)
  • 超越实习期的AI自动化工具:播客工作流与Slack导出器实战
  • 浅谈dsu on tree
  • 【转】中国信通院《低代码产业发展研究报告(2025年)》核心解读
  • python开始exe应用程序初级教程
  • 深入解析:cocos 添加背景,帧动画,贴图
  • 基于Python+Vue开发的反诈视频宣传管理系统源码+运行步骤
  • 大模型agent综述:A Survey on Large Language Model based Autonomous Agents - 详解
  • 微服务去掉认证的功能
  • INNER JOIN LEFT JOIN, RIGHT JOIN, FULL OUTER JOIN
  • 思想
  • P3197fwx - FanWenxuan