本文重点
协方差的大小在一定程度上反映了X 和Y相互间的关系,但它还受X和Y本身度量单位的影响。比如说:
这个就是说使用X、Y的不同的度量单位,X和Y之间的协方差会不一样,会为克服这一缺陷,对协方差进行标准化,就引入了相关系数的概念。
相关系数
相关系数的简单理解就是就是用X、Y的协方差除以X的标准差和Y的标准差。所以,相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差。
既然是一种特殊的协方差,那么协方差有的它都有:
1、相关系数也可以反映两个变量变化时是同向还是反向, 如果同向变化就为正,反向变化就为负。
2、由于它是标准化后的协方差,因此它消除了两个变量变化幅度的影响,只是单纯反映两个变量每单位变化时的相似程度。
若随机变量X与Y的相关系数ρ=0,则称 X 与 Y 线性无关,或线性不相关,简称不相关。需要注意的是不相关只是说线性不相关,而很有可能是非线性相关。
相关系数性质
- |ρ|≤ 1。等于 1 的充要条件是:存在常数 a 和 b,使 Y = aX + b 的概率等于1,也