当前位置: 首页 > news >正文

神经网络与深度学习(二)

五、深度学习视觉应用

1、数据集

常用数据集包括MNIST、Fashion-MNIST、CIFAR-10、PASCAL VOC、MS COCO、ImageNet、JFT-300M等。

2、任务评价指标

(1)精确率P与召回率R

P=TP/(TP+FP) ,表示“挑剔”的程度

R=TP/(TP+FN) ,表示“通过”的程度。召回率越高,准确度越低。

精度:(TP+TN)/(TP+FP+TN+FN)

其中,TP:正确划分为正例的个数, FP:错误划分为正例的个数,

FN:错误划分为负例的个数, TN:正确划分为负例的个数。

召回率和准确率之间的关系如图:

(2)平均准确率AP

其中,N表示测试集中所有图片个数,P(k)表示能识别出k个图时的P值,Δr(k)表示识别图片数从k-1变到k时的R的变化情况。

3、目标检测与YOLO

对于给定的图片,找到物体所在的位置,并标注出物体的类别。

(1)yolo v1

输入448*448*3的彩色图片,输出是7*7*30的张量。

损失函数包括:位置误差、置信度误差、类别概率损失

(2)yolo v2

相对于v1,v2有更大的分辨率,使用DarkNet网络,没有fc全连接层,经过5次降采样,输入图片大小必须是32的倍数。

4、全卷积网络与语义分割

FCN是语义分割的经典方法,DeepLab v3是广泛使用的语义分割方法。

http://www.gsyq.cn/news/1376179.html

相关文章:

  • 机器学习力场微调策略:高效预测LiF中锂离子扩散性能
  • 贵阳团体服装定制指南:文化衫、广告衫、T恤、POLO、马甲、冲锋衣怎么选?6大本土实力厂家优势解析 - 贵州服装测评君
  • 2026年降AI工具处理速度横评:五款主流工具一万字论文处理时长完整数据报告
  • 12.解决刷机 99% 故障:Bootloop 修复 + 分区表重建 + 底层短路触发技巧
  • 神经算子:从PDE求解到生物医学工程应用的AI新范式
  • 终极NCM文件解密教程:一键解锁网易云音乐加密格式
  • HVAC故障诊断的可复现性危机:从数据到模型的系统性解决方案
  • OpenClaw Windows 最新官方安装教程(超简单一键安装)
  • NS-USBLoader完整教程:Switch文件传输与RCM注入一站式解决方案
  • 2026哪个品牌的排插好?安全实用与设计感兼具之选 - 品牌排行榜
  • 让 Java 变甜的秘密武器!Gitee 2.4 万 Star 的 Hutool 工具库详解
  • SQL注入实战:报错注入与堆叠注入原理、绕过与协同打法
  • C# 集合详解:ArrayList 与 List<T>的核心用法与对比
  • 数据驱动VS物理模型:随机森林在电动汽车跟驰行为预测中的精度革命
  • 频率学习模型:基于傅里叶思想的参数高效神经网络架构
  • 工业设备预测性维护实战:自适应阈值与合成数据驱动的故障诊断
  • Armv9 SME指令集:矩阵运算加速原理与优化实践
  • SubCube稀疏注意力架构的优势是什么
  • vi与vim在openEuler中的差异及应用
  • RAG 架构在网文创作中的应用:以茄子写作助手为例
  • Token经济学正在重构芯片工程师的生存逻辑(万字长文深度拆解“token“这个计量单位的对于芯片工程师的意义)
  • 深度学习新手必懂的激活函数!Sigmoid、Tanh、ReLU、Leaky ReLU、Softmax 详解
  • 助睿实验作业3-学生用户画像考勤主题扩展标签构建
  • 直接去偏机器学习:用Bregman散度统一因果推断与协变量平衡
  • Windows Audio服务启动失败?除了疑难解答,你还需要检查这些容易被忽略的设置
  • 基于CNN的遥感影像土地利用分类:从原理到斐济城市扩张监测实践
  • 嘉兴GEO优化公司2026年度深度评测选型指南 - 品牌报告
  • 字节校招7000人转正率50%:大厂HR体系,正在“去经验化“
  • 避坑指南:在openEuler 22.03上配置vsftpd虚拟用户,解决gdbm数据库和SELinux权限问题
  • IwaraDownloadTool:简单快速的Iwara视频下载神器