2023-11-04 bigbai
1、一直没明白,方差、协方差以及相关系数这几个概念的含义及其在统计学中作用和计算方法,这里简单做一个记录和梳理。方差(),表征统计量,随机变量,对均值的误差,偏离度或离散度,方差越小离散度越小,统计量越接近统计平均值。协方差()表征统计量,随机变量,不同维度之间的误差,衡量该量不同维度之间的相关性。
2、相关系数(),统计学上常用是皮尔森相关系数(),定义为两个维度,特征,之间的协方差和标准差之比,用于度量两个维度之间的(线性)相关程度,其值介于之间。当协方差为正时,两个维度呈正相关,同增同减,当协方差为负时,两个维度负相关,一增一减,
3、将所有将所有维度之间的协方差关系以矩阵的形式表现,即为协方差矩阵。无论是方差、协方差还是相关系数,针对的对象始终是随机变量的各个维度,而非针对样本。
4、所以在实际使用时,切记注意目标矩阵中,哪些是特征,哪些是样本。方差,是协方差的一个特例,即两个维度相同时的情况。协方差,反映随机变量各个维度之间的统计特性。如果协方差趋近于,则该随机变量的维度和维度相关性很弱。
5、极端情况下,协方差为$0$,则这两个维度无关。协方差矩阵是一个方阵,其大小由随机变量的维度决定。如果该随机变量维度为$$,则协方差矩阵的大小为。相关系数,也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差,其值为之间,
1、另外提一下标准差()。标准差定义为方差的算术平方根,习惯使用表示,由于方差在量纲上与被测物理量不同,因此,标准差可以消除量纲带来的差异。
2、设样本集由个维随机变量构成则样本矩阵为:注意:是样本数,是随机变量的维度,特征,为行向量,针对行,样本,为列向量,针对列第1下标表示样本编号,第2个下标表示维度编号,例如表示第个样本的第个维度。方差:,针对维度,纵向使用统计学符号表示。协方差:,同样针对维度,其中:使用统计学符号表示。
3、当时,即协方差矩阵的对角矩阵。考虑样本矩阵由各列向量构成:,则各列标准差,记,同时记对样本空间,其相关系数矩阵定义为:代入协方差矩阵和:上述矩阵除法,指的是对应元素相除。其中:完整表达式:由可得,相关系数矩阵对角线元素的值均为。1)维随机变量的协方差矩阵。
4、设个二维随机变量样本,其中:矩阵表示为:。二维随机变量的两个特征分别用两个特征的平均值分别为:,中,使用用来计算协方差,函数原型:首先厘清两个概念:。
5、:变量,也就是特征。:观测,也就是样本。
原文链接:https://www.bigbai.cc/news/7306.html
本文版权:如无特别标注,本站文章均为原创。