当前位置: 首页 > news >正文

机器学习——放回抽样 - 详解

为了构建树集成模型,要求一种叫做有放回采样的技术。

以4个标记为演示,分别是红色、黄色、绿色和蓝色,用一个黑色的袋子把这四个标记的例子放进去,继而从这个袋子里有放回地抽取四次,抽出一个标记,结果是绿色的。有放回的意思是,在拿下一个标记之前,要把之前那个放回去,再次摇一摇,然后再拿一个,是黄色的,放回去,这就是有放回的部分,然后再来一次,是蓝色的,再放回去,再抽一次,又是蓝色的,所以抽到的顺序依次是绿色、黄色、蓝色和蓝色。抽到了两次蓝色,没有抽到一次红色。如果多次重复这个有放回的抽样程序,如果在做一次,可能会得到红色、黄色、红色和绿色或者绿色、绿色、蓝色和红色或者红色,蓝色、黄色和绿色。

注意:有放回抽样这一点非常关键,缘于如果每次抽样后不把标记放回,如果从四个标记袋中抽出四个标记,总是会得到相同的四个标记,这就是为什么每次抽出标记后放回去很重要,以确保不会只得到相同的四个标记。

有放回抽样在构建树集成方法中的应用如下:我们将构建多个随机训练集,这些训练集与原始训练集略有不同,我们将采用10个猫和狗的例子,将这10个训练例子放入一个假想的袋子中,利用这个假想的袋子,我们将创建一个新的随机训练集,由十个与原始数据集大小相同的例子组成,这样做的方法是伸手进去,拿出一个随机的训练例子,假设已经拿到了这个训练例子,接着将它放回袋子里,然后再次随机拿出一个训练例子,如此反复,你拿到例子,然后再抽一次,再抽一次。注意到现在第五个训练例子和我们上面提到的第二个是相同的,但这没关系,在抽几次,我们得到另一个重复的例子,如此反复,只到最终得到10个训练例子,其中有例子是重复的,而且这个训练集并不包含原始的10个训练例子的全部。这没关系,这是带放回抽样过程的一部分。

带放回抽样的过程让你构造一个有点类似于一个新的训练集,但和最初的训练就又有很大的不同,这将是构建树集成的关键构件。

http://www.gsyq.cn/news/17200.html

相关文章:

  • 2025 年废品回收公司最新推荐排行榜权威发布,聚焦桂林废铜/废铁/废铝/电缆电线等回收领域优质公司
  • 搭建doris FE的开发环境
  • 2025 铅板源头厂家最新推荐排行榜:聚焦防辐射铅门 / 放射科防护 / 高纯度铅皮,深挖性价比与适配性
  • 2025 年国内电容厂家最新推荐排行榜:聚焦固态 / 高压 / 安规 / CBB / 超级电容多品类,精选优质厂商助力企业精准采购选型
  • ROS 2机器人操作系统与Gazebo机器人仿真
  • 完整教程:BUUCTF[ACTF2020 新生赛]Include 1题解
  • LINUX之TCP内核参数解析
  • 实用指南:基于langchain的简单RAG的实现
  • 2025双氧水厂家权威推荐榜:优质生产与稳定供应实力之选
  • 英国AI数据中心发展规划:技术挑战与产业反馈
  • 2025 年工业风机厂家最新推荐排行榜:涵盖离心高温防腐耐磨防爆等类型设备实力厂商精选高温/防腐/耐磨/防爆/除尘/不锈钢/锅炉风机厂家推荐
  • 2025 年最新推荐!种植牙医院权威榜单:聚焦连锁品牌与万级手术室,助您精准选靠谱口腔机构西宁种植牙口腔医院/西宁种植牙齿美容/西宁种植牙美容医院推荐
  • 2025 年最新推荐西安路灯厂家排行榜:市政 / LED / 智慧 / 太阳能 / 农村路灯优质企业全景指南
  • 2025 最新红绿灯厂家推荐排行榜:实力厂家技术与口碑深度解析,交通信号设备优选指南交通信号/路口红绿灯厂家推荐
  • Claude Code完整安装部署指南:支持Windows/Linux/macOS三平台详细教程
  • 2025 年淋膜机厂家最新推荐排行榜:覆盖纸张 / 无纺布 / 高速 / 全自动等多类型设备,精选优质企业助力精准选购
  • 2021年度十大前沿科技研究盘点
  • 2025 最新推荐:全国开锁公司口碑排行榜权威甄选,含智能锁专项服务与紧急上门品牌详解全国/汽车保险柜/汽车锁/保险柜/智能/快速上门开锁公司推荐
  • CSP - J 讲义内容与CSP - S 讲义内容对比
  • h5的aliplayer-min.js 加密视频会走到debugger - 教程
  • python“锈化”库替代,性能更快的库
  • docker B站学习 - 实践
  • 在AI技术唾手可得的时代,挖掘新需求成为制胜关键——某知名自动化脚本工具需求洞察
  • 白箱算力与AI元人文:一场从“求解”到“创造”的范式革命
  • vm ubuntu22安装docker
  • 重装系统后 D 盘软件搜不到?3 步搞定快捷方式与搜索问题
  • PVS 可见性剔除示意图
  • Ambari安装Hadoop
  • 数据仓库中的“时间旅行者”:深入理解渐变维度(SCD)与拉链表
  • MOVEit网络攻击波及普华永道与安永,供应链安全再响警钟