
现在空间有两个向量X=[a1a2]Y=[b1b2]
点积和内积是一致的,点积是和投影相关的。
X点乘Y=∣∣X∣∣2∣∣Y∣∣2cosθ=a1b1+a2b2
向量X在向量Y上的投影是∣∣Y∣∣2X点乘Y
协方差和相关系数是用来做相关分析的:
现在有两个属性X和Y,当X取值a1的时候,Y取值b1,当X取值a2的时候,Y取值b2。分析属性X和属性Y的相关性。
协方差:
COV(X,Y)=E[(a−a)(b−b)]
皮尔逊相关系数就是:
ρX,Y=σXσYCOV(X,Y)
σXσY分别是X和Y的方差。
当a和b都等于0并且X取值a1与X取值a2的概率相同时:
COV(X,Y)=X点乘Y=a1b1+a2b2=∣∣X∣∣2∣∣Y∣∣2cosθ
其他情况下,协方差与点积是没有什么关系的。
协方差的物理意义理解并不是向量的投影。而是通过点a,b与均值点mean所形成的矩形面积之和:
点a=[a1b1]表示当X取值a1的时候,Y取值b1
点b=[a2b2]表示当X取值a2的时候,Y取值b2
点mean=[ab]表示X的均值为a,Y的均值为b
如下图:

中间的点就是均值点mean
一象限的1号点:当a1>a时,b1>b,所以矩阵面积a1b1是正的。
二象限的2号点:当a2<a时,b2>b,所以矩阵面积a2b2是负的。
三象限的3号点:当a3<a时,b3<b,所以矩阵面积a3b3是正的。
四象限的4号点:当a4>a时,b4<b,所以矩阵面积a4b4是负的。
将所有矩形的面积加起来,如果是正的就是正相关,如果是负的就是负相关。
这个思想是来自于这篇文章,更详细的解释也可参见这篇文章
https://www.matongxue.com/madocs/568.html