当前位置: 首页 > news >正文

TP、FP、FN、TN 详解

一、前言

在图像检测、文本分类、异常识别、AI 风控等二分类任务中,TP、FP、FN、TN是评估模型好坏最基础、最核心的四个指标。看懂这四个值,就能算出准确率、精确率、召回率、F1 分数,快速判断模型漏检、误判问题。

二、基础定义(二分类判定规则)

设定两类:

  • 正样本 P:目标物体、异常、合格、阳性
  • 负样本 N:背景、正常、不合格、阴性

模型只有两种预测结果:预测为正、预测为负,两两组合得到四种结果:

符号全称中文名称实际情况模型预测通俗理解
TPTrue Positive真正例正样本预测正猜对目标
FPFalse Positive假正例负样本预测正误判认错
FNFalse Negative假负例正样本预测负漏检漏掉
TNTrue Negative真负例负样本预测负猜对背景

预测正(P) 预测负(N)
实际正(P) TP✅ FN❌
实际负(N) FP❌ TN✅

三、四大核心评估指标计算公式

总样本数:\(Total = TP+FP+FN+TN\)

  1. 准确率 Accuracy整体判断正确的比例\(Accuracy=\frac{TP+TN}{TP+FP+FN+TN}\)

  2. 精确率 Precision模型判定为正样本里,真正正确的比例,防误判\(Precision=\frac{TP}{TP+FP}\)

  3. 召回率 Recall所有真实正样本中,被成功检出的比例,防漏检\(Recall=\frac{TP}{TP+FN}\)

  4. F1-Score精确率和召回率调和平均,综合衡量模型整体性能\(F1=\frac{2\times Precision\times Recall}{Precision+Recall}\)

四、F1-Score

F1分数:精确率与召回率的调和

当我们需要一个综合指标来平衡精确率和召回率时,F1分数就派上用场了。它综合反映了模型的稳健性。

定义:精确率和召回率的调和平均数,更强调二者的均衡性。

特点:取值范围 [0,1],越接近1越好。它对P/R中的较低值非常敏感,仅当两者都较高时,F1分数才会高。适合样本不均衡或需兼顾质量与数量的场景。

http://www.gsyq.cn/news/1385056.html

相关文章:

  • 山东大学软件学院项目实训-创新实训-计科智伴 组周报(第五周)—— 错题诊断 Agent 落地、course-ai 接通大模型 + RAG + 多 Agent 调度、登录与对话全链路前端化
  • HDI与普通PCB的叠层差异
  • 为什么选择Noto字体:告别“豆腐块“困扰的全球字体解决方案
  • HDR视频制作避坑指南:HLG和PQ到底怎么选?从广电直播到流媒体的实战解析
  • VideoDownloadHelper 插件深度解析:Chrome 视频下载架构设计与技术实现
  • 15事件警报:告警机制的设计案例
  • 炉石传说脚本终极指南:智能自动对战助手完整教程
  • WaveTools深度解析:鸣潮玩家的专业性能调优与数据管理实战指南
  • 高效实现百度网盘链接解析:技术架构与API调用深度解析
  • AMD Ryzen终极调试指南:用SMUDebugTool解锁隐藏性能的完整教程
  • 性能采集与问题定位工具链实战
  • AI时代两大高决策行业的社交营销进化 | 第十届社交媒体风向大会数码家电与汽车分论坛 - 资讯快报
  • 中微单片机SC8F072/SC8P062代码生成工具
  • 为什么阴干的衣服那么臭?原因竟然是……
  • 35岁那年我考下AI认证,职业反而越走越宽
  • 告别Linux依赖!Windows下用CloudCompare和MATLAB查看PCD点云的保姆级教程
  • 第一次买NAS,这8个坑千万别踩
  • 历史建筑隐形门铃系统设计:物联网与智能交互的工程实践
  • 【AI应用开发工程师】第一章:AI 基础与神经网络入门
  • 【最新】最完美的WPF窗体无边框设计!
  • 鸿蒙PC:Qt适配OpenHarmony实战【取色间】:RGB 滑动调整、HEX 展示和颜色预览
  • 不再填鸭式教学:魔珐星云+DeepSeek打造苏格拉底式AI具身智能3D数字人学习辅导实战
  • Agent 工程化最佳实践:从 prompt 到系统架构的全流程规范
  • 山东大学软件学院创新实训——个人博客(六)
  • # 2026年陕西热门高考补习学校盘点:哪家提分效果好?(附选型指南) - 科技焦点
  • Vue2-Verify终极指南:5种验证码类型的完整教程与实战应用
  • MongoDB Limit 与 Skip 方法详解
  • [特殊字符] Qwen3.6-35B 8G VRAM 极限部署蓝图:资源受限环境下的多模态大模型运行指南
  • YOLOv11医院病房医护人员目标检测数据集-579张-doc-nurse--1
  • Corrosion2靶机深度解析:渗透测试综合能力训练指南