当前位置: 首页 > news >正文

主成分分析 PCA(二)-- 高维 PCA

高维 PCA

  • 维度--> \(x_n \in R^D\)
  • 数据集 \(X = \{x_1, x_2, ..., x_n \}\) 表示
    • \(n\) 表示样本数量(number of samples / observations),即数据点的个数
    • \(D\) 表示特征维度(dimensionality / number of features),即每个数据点 \(x_i\) 是一个 \(D\) 维向量
    • \(x_i = [x_{i1},x_{i2},...,x_{iD}]^T \in R^D\)
  • \(D\) 维数据,其协方差矩阵为 \(D×D\)
    • 计算该矩阵的特征值和特征向量,复杂度为 \(O(D^3)\)
  • 数据点数量远小于维度时(\(N<<D\)
  • 协方差矩阵 \(S\) 的秩为 \(N\),它有 \(D−N+1\) 个零特征值
  • 存在冗余,将 \(D×D\) 转化为 \(N ×N\) 协方差矩阵,其所有特征值均为正
  • 求解 \(N ×N\) 协方差矩阵 \(S'\) 的特征值
    • 由协方差矩阵定义
      • \(S b_m = \frac{1}{N} X X^\top b_m = \lambda_m b_m\)
    • 左乘 \(X^T\)
      • \(\frac{1}{N} \underset{N \times N}{X^\top X} \underset{=:c_m}{X^\top b_m} = \lambda_m X^\top b_m \Leftrightarrow \frac{1}{N} X^\top X c_m = \lambda_m c_m\)
    • \(XX^⊤\)非零特征值与 \(X^⊤X\)非零特征值相同
    • 可以降维求解(原 \(D\)\(N\))矩阵 \(\frac{1}{N} X^\top X \in R^{N \times N}\) 对应于 \(\lambda_m\) 的特征向量 \(c_m:=X^T b_m\)
    • 假设无重复数据点,则 \(\frac{1}{N} X^\top X \in R^{N \times N}\) 秩为 \(N\)可逆
    • 即: \(\frac{1}{N} X^\top X\) 与数据协方差矩阵 \(S\) 具有相同的非零特征值
  • 恢复原始特征向量
    • 已有 \(\frac{1}{N} X^\top X\) 的特征向量 \(c_m\)
    • 左乘 \(X\)
      • \(\frac{1}{N} X X^\top X c_m = \lambda_m X c_m\)
      • \(X c_m\) 即为原始协方差矩阵 \(S\) 的 特征向量
      • 应用(三)中的 PCA 算法,需将 \(S\) 的特征向量 \(X c_m\) 归一化,使其范数为1
http://www.gsyq.cn/news/148252.html

相关文章:

  • 2025最新!自考必看10个AI论文平台测评,写论文不再愁
  • 游戏测试与普通软件测试的异同点
  • 探索式测试的“道”与“术”:如何系统性地成为Bug狩猎高手?
  • 在戴尔Precision Max Slim本地部署KAG,把AI 问答系统卷出天际
  • 从用户体验(UX)设计中学习测试用例设计灵感
  • 【路径规划】混合人工蜂群ABC和粒子群优算法PSO机器人路径规划【含Matlab源码 14774期】
  • MySQL 审计级别配置指南
  • 测试工程师如何培养“老板思维”?
  • 训练模型用GCP,推理服务放阿里云?聊聊AIGC时代的多云自由
  • 2025年12月母线槽优质厂家推荐:密集型、耐火型、封闭式、空气型母线槽品质一览 - 深度智识库
  • 【RRT三维路径规划】基于matlab带信息的RRT算法无人机路径规划【含Matlab源码 14776期】
  • 2025托福培训哪家强?这5家高口碑机构帮你精准提分(附选课攻略) - 品牌测评鉴赏家
  • 2025年南京地区留学中介服务实力权威排名榜单揭晓 - 留学品牌推荐官
  • CF2078虚拟赛总结 - Link
  • 【git 教程-番外1】Conventional Commits——commit message 的社区规范
  • 国产开源神器 MonkeyCode:企业级 AI 编程助手,私有化部署超省心
  • 2025年上海留学中介口碑榜TOP5揭秘:哪家机构获学子力荐 - 留学品牌推荐官
  • 揭秘Open-AutoGLM部署难题:5步实现AI手机本地大模型高效运行
  • 2025年末Deepseek优化排名甄选:深耕GEO优化领域的口碑服务商解析 - 品牌推荐排行榜
  • 2025年上海留学中介全解析,权威榜单揭晓综合实力机构 - 留学品牌推荐官
  • 【Python新手村】函数全攻略:从基础语法到匿名函数、递归的深度进阶!
  • RustFS Windows 版本安装部署指南(免Docker版)
  • 大模型赋能制造业:8D Agent实战开发指南,让你的代码“挖出“企业隐藏利润!
  • 2025权威榜单:广州地区留学中介综合实力TOP10揭晓 - 留学品牌推荐官
  • 2025 年 12 月热流道系统厂家权威推荐榜:塑胶模具热流道系统,温控精准、高效节能的工业智造核心方案深度解析 - 品牌企业推荐师(官方)
  • 数据库智能诊断的4个核心,10分钟定位80%故障
  • 江苏比较好的港澳台联考学校推荐
  • 2025权威测评!上海留学中介实测推荐5家优质机构 - 留学品牌推荐官
  • 大模型程序员必备!PaddleOCR-VL文档解析全攻略:从入门到实战,RAG应用不再愁
  • NMN 哪个牌子好?2025权威排名出炉:抗衰效果 + 成分透明度双维度对比 - 速递信息