当前位置:首页 > 教育培训 >

python怎么求协方差(python官网计算方差)

来源:原点资讯(www.yd166.com)时间:2023-04-26 11:55:57作者:YD166手机阅读>>

▌概述

本文主要介绍一种降维方法,PCA(Principal Component Analysis,主成分分析)。降维致力于解决三类问题:

  • 降维可以缓解维度灾难问题;
  • 降维可以在压缩数据的同时让信息损失最小化;
  • 理解几百个维度的数据结构很困难,小维度的数据通过可视化更容易理解。

下面,将从简介、计算步骤、应用三方面进行理解PCA的降维作用。

▌PCA简介

在理解特征提取与处理时,涉及高维特征向量的问题往往容易陷入维度灾难。随着数据集维度的增加,算法学习需要的样本数量呈指数级增加。有些应用中,遇到这样的大数据是非常不利的,而且从大数据集中学习需要更多的内存和处理能力。另外,随着维度的增加,数据的稀疏性会越来越高。在高维向量空间中探索同样的数据集比在同样稀疏的数据集中探索更加困难。

主成分分析也称为卡尔胡宁-勒夫变换(Karhunen-Loeve Transform),是一种用于探索高维数据结构的技术。PCA通常用于高维数据集的探索与可视化。还可以用于数据压缩,数据预处理等。PCA可以把可能具有相关性的高维变量合成线性无关的低维变量,称为主成分( principal components)。新的低维数据集会尽可能的保留原始数据的变量。

PCA将数据投射到一个低维子空间实现降维。例如,二维数据集降维就是把点投射成一条线,数据集的每个样本都可以用一个值表示,不需要两个值。三维数据集可以降成二维,就是把变量映射成一个平面。一般情况下,nn维数据集可以通过映射降成kk维子空间,其中k≤n。

假如你是一本养花工具宣传册的摄影师,你正在拍摄一个水壶。水壶是三维的,但是照片是二维的,为了更全面的把水壶展示给客户,你需要从不同角度拍几张图片。下图是你从四个方向拍的照片:

python怎么求协方差,python官网计算方差(1)

第一张图里水壶的背面可以看到,但是看不到前面。第二张图是拍前面,可以看到壶嘴,这张图可以提供了第一张图缺失的信息,但是壶把看不到了。从第三张俯视图里无法看出壶的高度。第四张图是你真正想要的,水壶的高度,顶部,壶嘴和壶把都清晰可见。

PCA的设计理念与此类似,它可以将高维数据集映射到低维空间的同时,尽可能的保留更多变量。PCA旋转数据集与其主成分对齐,将最多的变量保留到第一主成分中。假设我们有下图所示的数据集:

python怎么求协方差,python官网计算方差(2)

数据集看起来像一个从原点到右上角延伸的细长扁平的椭圆。要降低整个数据集的维度,我们必须把点映射成一条线。下图中的两条线都是数据集可以映射的,映射到哪条线样本变化最大?

python怎么求协方差,python官网计算方差(3)

显然,样本映射到黑色虚线的变化比映射到红色点线的变化要大的多。实际上,这条黑色虚线就是第一主成分。第二主成分必须与第一主成分正交,也就是说第二主成分必须是在统计学上独立的,会出现在与第一主成分垂直的方向,如下图示:

python怎么求协方差,python官网计算方差(4)

栏目热文

python求方差初级代码(python按步骤计算方差)

python求方差初级代码(python按步骤计算方差)

方差:方差是衡量一组数据离散程度的统计量。统计学中的方差(样本方差)是每个样本值与全体样本值的均值之差的平方的均值。概率...

2023-04-26 12:23:31查看全文 >>

python求均方差(python求均值方差标准差)

python求均方差(python求均值方差标准差)

标题 | python-is-cool作者 | chiphuyen原文 | https://github.com/chi...

2023-04-26 11:53:56查看全文 >>

利用列表求方差python(python编写函数求列表的方差)

利用列表求方差python(python编写函数求列表的方差)

第四节 测量离散度3.4.1 计算一组数字的极差再次考虑之前的一组捐款清单,100, 60,70, 900, 100, ...

2023-04-26 12:05:59查看全文 >>

python协方差计算步骤(python怎么打印协方差矩阵)

python协方差计算步骤(python怎么打印协方差矩阵)

理解两个变量之间的关系是数据科学任务中常见的问题。我们主要用相关性来理解两个变量之间的关系。但我们也经常听说散布矩阵(也...

2023-04-26 12:18:33查看全文 >>

python求一组数的方差(怎么用python计算方差)

python求一组数的方差(怎么用python计算方差)

作者 | CDA数据分析师进行到这一步就可以算是开始正式的烹饪了,在这部分之前的数据操作部分我们列举了一些不同维度的分析...

2023-04-26 11:58:22查看全文 >>

怎样用python求标准差(python求标准差用计算公式)

怎样用python求标准差(python求标准差用计算公式)

最近在做股票分析的时候,需要用到 布林带 。以 宁德时代 为例,图片上的圈圈的部分就是布林带。为了方便查看,我用圈圈代替...

2023-04-26 11:45:43查看全文 >>

python计算方差中位数(python计算平均数后计算标准方差)

python计算方差中位数(python计算平均数后计算标准方差)

导读:NumPy是Python的基础,更是数据科学的通用语言。本文简单介绍NumPy模块的两个基本对象ndarray、u...

2023-04-26 12:17:20查看全文 >>

python方差分析(python求方差的怎么编写)

python方差分析(python求方差的怎么编写)

之前我们曾经讲过用Python做t检验,它用于分析一组数据与另一组数据或者总体均值之间的均值差异,从而判断它们是否来自于...

2023-04-26 11:59:13查看全文 >>

使用python写一个函数求方差(python官网计算方差)

使用python写一个函数求方差(python官网计算方差)

标准差:标准差(standard deviation,SD),又称均方差,是衡量一组数据离散程度的统计量,其值为方差的算...

2023-04-26 11:52:28查看全文 >>

python计算1到100的和(python计算1到100的和怎么运行)

python计算1到100的和(python计算1到100的和怎么运行)

循环是编程语言中经常使用的功能。当你想要自动执行特定的重复性任务时,循环非常有用。Python 中有两种类型的循环:fo...

2023-04-26 11:55:54查看全文 >>

文档排行