当前位置: 首页 > news >正文

day23 常见特征筛选算法

1.方差筛选 是最基础的过滤法:计算特征的方差,剔除方差极低的特征(这类特征数值变化小,对样本区分度弱)。优点是计算极快,缺点是只看特征自身,不考虑和目标的关联。
2.皮尔逊相关系数筛选 属于过滤法:计算特征与目标变量的皮尔逊相关系数(衡量线性相关程度),保留相关系数绝对值高的特征。
优点是直观易懂,缺点仅能捕捉线性关联,对非线性关系无效。
3.Lasso 筛选 属于嵌入法:在线性模型(如线性回归、逻辑回归)中加入L1正则化,迫使不重要的特征系数收缩至 0,最终保留系数非0的特征。既能完成特征筛选,也能同步训练模型,适合高维数据。
树模型重要性 属于嵌入法:基于决策树/随机森林/XGBoost等树模型,通过“特征对节点分裂的贡献度”计算重要性,保留重要4性高的特征。优点是能捕捉非线性关联,缺点是易受高基数特征干扰。
5.SHAP 重要性 是树模型重要性的进阶版:基于 SHAP 值(解释模型预测的统一框架)计算特征重要性,不仅能体现特征的整体影响程度,还能展示特征对预测结果的正负方向,解释性更强。
6.递归特征消除(RFE) 属于包裹法:反复训练指定模型,每次移除模型判定的“最不重要特征”,直到保留预设数量的特征。优点是直接以模型性能为筛选依据,精度较高;缺点是计算成本高(需多次训练模型)@浙大疏锦行

http://www.gsyq.cn/news/94974.html

相关文章:

  • 百度网盘智能提取码解决方案:技术驱动的自动化访问新体验
  • Flutter开发基石:Dart语言从入门到实战核心指南
  • 【论文阅读】Multi-modal Spatial Clustering for Spatial Transcriptomics Utilizing High-resolution Histology
  • 【牛客周赛 107】E 题【小苯的刷怪笼】题解
  • YOLOv11 改进 - C2PSA | C2PSA融合DML动态混合层(Dynamic Mixing Layer)轻量级设计优化局部细节捕获与通道适应性,提升超分辨率重建质量
  • 编辑相似度(Edit Similarity):原理、演进与多模态扩展
  • ClickHouse 快速入门
  • A little something to get you started
  • YOLOv11 改进 - C2PSA | C2PSA融合EDFFN高效判别频域前馈网络(CVPR 2025):频域筛选机制增强细节感知,优化复杂场景目标检测
  • Vue + Echarts 实现科技感数据大屏
  • SmoothDiscreteMarchingCubes 多边形网格数据的平滑
  • YOLOv11 改进 - C2PSA | C2PSA融合Mona多认知视觉适配器(CVPR 2025):打破全参数微调的性能枷锁:即插即用的提点神器,引领视觉微调新突破
  • YOLOv11 改进 - SPPF模块 | 替代SPPF, Mona多认知视觉适配器(CVPR 2025):打破全参数微调的性能枷锁:即插即用的提点神器
  • 百度网盘直链解析:新手必学的3步全速下载方法
  • 【KMP算法】KMP算法揭秘:高效字符串匹配的艺术
  • CSS Padding图解指南:小白也能懂的间距魔法
  • KL按键映射文件修改
  • 智驾相关名词简介
  • 面向对象程序设计———数字电路模拟程序1、2与第一次课堂测验总结
  • 传统统计 “手忙脚乱” VS 虎贲等考 AI “一键洞察”:数据分析的革命性分水岭
  • document.querySelector在电商网站中的5个实战应用
  • SK海力士×NVIDIA联手,AI NAND性能狂飙30倍!
  • C 标准库 - <locale.h>
  • 单片机芯片] CH32V307 支持手机的虚拟U盘实现拖拽固件升级
  • 【规范驱动的开发方式】之【spec-kit】 的安装入门指南
  • 基于ipsec的医院网络规划设计与实现
  • 电商评论分析实战:Java + NLP 大模型,从 10 万条评论中自动提取“用户槽点”
  • ISCTF2025-病毒分析
  • [数据结构/Java] 数据结构之循环队列
  • 检索增强生成(RAG)技术原理深度解析:突破大模型知识边界的范式革命