点网站出图片怎么做,能看人与动物做的网站,技术支持 重庆网站,怎么样注册一个网站一、协方差#xff1a;
可以通俗的理解为#xff1a;两个变量在变化过程中是同方向变化#xff1f;还是反方向变化#xff1f;同向或反向程度如何#xff1f;
你变大#xff0c;同时我也变大#xff0c;说明两个变量是同向变化的#xff0c;这时协方差就是正的。
你…一、协方差
可以通俗的理解为两个变量在变化过程中是同方向变化还是反方向变化同向或反向程度如何
你变大同时我也变大说明两个变量是同向变化的这时协方差就是正的。
你变大同时我变小说明两个变量是反向变化的这时协方差就是负的。
从数值来看协方差的数值越大两个变量同向程度也就越大。反之亦然。
咱们从公式出发来理解一下 公式简单翻译一下是如果有X,Y两个变量每个时刻的“X值与其均值之差”乘以“Y值与其均值之差”得到一个乘积再对这每时刻的乘积求和并求出均值其实是求“期望”但就不引申太多新概念了简单认为就是求均值了。
下面举个例子来说明吧
比如有两个变量X,Y观察t1-t77个时刻他们的变化情况。
简单做了个图分别用红点和绿点表示X、Y横轴是时间。可以看到XY均围绕各自的均值运动并且很明显是同向变化的。 总结一下如果协方差为正说明XY同向变化协方差越大说明同向程度越高如果协方差为负说明XY反向运动协方差越小说明反向程度越高。
LINE
一般的同学看到above the line的内容就ok了。但有一些爱钻研的同学可能会进一步提问 另外如果你还钻牛角尖说如果t1t2t3……t7时刻XY都在增大而且X都比均值大Y都比均值小这种情况协方差不就是负的了7个负值求平均肯定是负值啊但是XY都是增大的都是同向变化的这不就矛盾了
这个更好解释了这种情况不可能出现
因为你的均值算错了…… 好了现在对于协方差应该有点感觉了吧
二、相关系数
对于相关系数我们从它的公式入手。一般情况下相关系数的公式为
翻译一下就是用X、Y的协方差除以X的标准差和Y的标准差。
所以相关系数也可以看成协方差一种剔除了两个变量量纲影响、标准化后的特殊协方差。
既然是一种特殊的协方差那它
1、也可以反映两个变量变化时是同向还是反向如果同向变化就为正反向变化就为负。
2、由于它是标准化后的协方差因此更重要的特性来了它消除了两个变量变化幅度的影响而只是单纯反应两个变量每单位变化时的相似程度。
比较抽象下面还是举个例子来说明 这是为什么呢
因为以上两种情况下在X、Y两个变量同向变化时X变化的幅度不同这样两种情况的协方差更多的被变量的变化幅度所影响了。
所以为了能准确的研究两个变量在变化过程中的相似程度我们就要把变化幅度对协方差的影响从协方差中剔除掉。于是相关系数就横空出世了就有了最开始相关系数的公式 所以标准差描述了变量在整体变化过程中偏离均值的幅度。协方差除以标准差也就是把协方差中变量变化幅度对协方差的影响剔除掉这样协方差也就标准化了它反应的就是两个变量每单位变化时的情况。这也就是相关系数的公式含义了。
同时你可以反过来想象一下既然相关系数是协方差除以标准差那么当X或Y的波动幅度变大的时候它们的协方差会变大标准差也会变大这样相关系数的分子分母都变大其实变大的趋势会被抵消掉变小时也亦然。于是很明显的相关系数不像协方差一样可以在∞\infty∞ 到−∞-\infty−∞间变化它只能在1到1之间变化相关系数的取值范围在1到1之间变化可以通过施瓦茨不等式来证明有些复杂这里就不赘述了有兴趣的可以google下。
总结一下对于两个变量X、Y
当他们的相关系数为1时说明两个变量变化时的正向相似度最大即你变大一倍我也变大一倍你变小一倍我也变小一倍。也即是完全正相关以X、Y为横纵坐标轴可以画出一条斜率为正数的直线所以X、Y是线性关系的。
随着他们相关系数减小两个变量变化时的相似度也变小当相关系数为0时两个变量的变化过程没有任何相似度也即两个变量无关。
当相关系数继续变小小于0时两个变量开始出现反向的相似度随着相关系数继续变小反向相似度会逐渐变大。
当相关系数为1时说明两个变量变化的反向相似度最大即你变大一倍我变小一倍你变小一倍我变大一倍。也即是完全负相关以X、Y为横纵坐标轴可以画出一条斜率为负数的直线所以X、Y也是线性关系的。 好了讲了这么多不知你看完是否对相关系数也有了一些感觉
原文作者GRAYLAMB https://www.zhihu.com/question/20852004