皮尔森斯皮尔曼大不同,两种相关系数你可得弄明白!
皮尔逊相关系数和斯皮尔曼等级相关系数是两种常用的相关系数,用于衡量两个变量之间的线性关系。皮尔逊相关系数适用于连续变量,并且假设数据呈正态分布。它的取值范围在-1到1之间,其中1表示完全正相关,-1表示完全负相关,0表示没有线性关系。计算公式为:
\[ r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} \]
其中,\( x_i \)和\( y_i \)分别是两个变量的观测值,\( \bar{x} \)和\( \bar{y} \)分别是它们的均值。
斯皮尔曼等级相关系数适用于有序数据或非正态分布的数据。它通过将数据转换为等级,然后计算这些等级的皮尔逊相关系数来衡量相关性。其取值范围也在-1到1之间,计算公式为:
\[ \rho = 1 - \frac{6 \sum d_i^2}{n(n^2 - 1)} \]
其中,\( d_i \)是两个变量的等级差,\( n \)是观测值的数量。
总结来说,皮尔逊相关系数适用于连续且正态分布的数据,而斯皮尔曼等级相关系数适用于有序数据或非正态分布的数据。选择哪种相关系数取决于数据的类型和分布情况。