机器学习——降维算法学习总结

logos515 / 2023-07-24 / 原文

降维算法学习

一、PDA（主成分分析）算法

假设有n个m维向量，需要降到k维
PDA的目标是最大化组内方差，最小化组间协方差
步骤：

中心化：计算这n个向量在每一个维度上的均值，得到m维的均值向量，再用每一个向量减去这个均值向量。
计算这n个向量的协方差矩阵。
提取协方差矩阵的特征值和特征向量，将特征值按从大到小的顺序排列，提取对应的前k个特征向量，即为新空间的基。
将所有特征向量单位化后按行排列成一个k行m列的矩阵A，将需要转换的向量按列排列成一个m行n列的矩阵B，A×B得到一个k行n列的矩阵D，D的每一列即为降维后的新向量。

二、MDS（多维尺度变换）算法

假设有n个m维向量，需要降到k维
MDS的目标是降维并保持向量之间的距离尽量不变
步骤：

计算这n个向量的距离矩阵，得到一个n行n列的矩阵A
计算内积矩阵：$ B=AA^T $
提取矩阵B的特征值和特征向量
将特征值从大到小排序，提取前k个特征值对应的特征向量作为新空间的基

三、Isomap Embedding（等距特征映射）算法

假设有n个m维向量，需要降到k维
基本与MDS相同，区别在于不再使用欧氏距离表示两个点之间的距离，而是使用最短路径的长度代替。

如何计算最短路径：
首先采用KNN算法找出每一个点的k个邻接点，如果两个点互相是彼此的邻接点，那么连接这两个点，如是构建出邻域图。然后根据这张图计算任意两点之间的路径长度，代替欧氏距离，再套用MDS的方法即可。

机器学习——降维算法学习总结更多相关文章

Redis持久化机制（面试考点）与位图API

爬虫--识别验证码

TZYLT's 2024CSP-S游记

「CSP2024」游记

js模拟构造函数的实现过程

命令拼接技巧

SD NAND 与 SPI NAND

C语言中的编译过程详解

step7 V5.x上的SCL

yolo --- 核心思想

一些学科笑话

NOIP2024模拟赛20 & 11.1 小记

20241101 数据结构与算法期中机试收获

什么是IT技术

即将到来！

舍得-时间-工作是人的一生最重要的事情-自己要有私房钱-人的一生最重要的事情是书写自己的人生

2.TiUP 部署 DM 集群

ubuntu 24.04 部署 mysql 8.4.3 LTS

随机推荐

一些学科笑话

NOIP2024模拟赛20 & 11.1 小记

20241101 数据结构与算法期中机试收获

Java，启动！

什么是IT技术

即将到来！

2024/11/1日日志关于JavaScript简介&引入方式以及基础语法的学习

舍得-时间-工作是人的一生最重要的事情-自己要有私房钱-人的一生最重要的事情是书写自己的人生

2.TiUP 部署 DM 集群

原型模式的C++实现

python bytecode解析

09-XSS键盘监听、cookie窃取&文件上传绕过

ubuntu 24.04 部署 mysql 8.4.3 LTS

国标GB28181公网平台LiteGBS国标GB28181视频平台建筑工地无线视频联网监控系统方案

imes完工下线

android 13 更改手机信号调整

BFS(Breath First Search 广度优先搜索)

Visual Studio Code（VSCode）中设置中文界面

影响黄金价格大幅波动的因素主要有哪些？

winform用Dev的TreeList滚动到指定节点的位置

热门话题

Ethernaut Level 11: Elevator Attack and Blockchain Interaction

快速部署开源spug运维平台的Docker安装指南

驱动调试之printk的原理与使用

计算机思维模型及其应用

华为云发布代码大模型PanGu-Coder2，实现高效代码生成

Linux多硬盘数据存储和分区操作

构建高可用架构: 分层冗余与自动故障转移

LoRA：高效调参的大语言模型适应方法

《分布式系统的基本原理及互联网分层架构的本质》

Hadoop写流程解析

Java架构师的系统架构设计方法论中的规范要点

使用observeDOM解决BetterScroll插件在移动端无法滑动的问题

互联网一致性架构设计实践

高并发系统架构与水平扩展

混合应用的崛起：跨平台开发取代原生应用

穗舟网（www.seizhou.com）

本站除标明"本站原创"外所有文章版权归创作人所有，本站不承担任何法律责任和连带责任，如有冒犯请直接联系，我们将立即予以纠正并致歉。

Powered by WordPress · v1.0.0-alpha