相关系数的取值范围是多少?附计算公式与实例解析


相关系数的取值范围通常介于-1和1之间,包括-1、-1到1的区间(不包含-1和1)、以及1。这个取值范围反映了两个变量之间关系的强度和方向。

-1表示完全负相关,意味着当一个变量增加时,另一个变量减少,反之亦然。

1表示完全正相关,意味着当一个变量增加时,另一个变量也增加,反之亦然。

-1到1之间的值表示不同程度的正相关或负相关。0表示没有相关性,即两个变量的变化是独立的。

相关系数的计算公式通常使用皮尔逊相关系数(Pearson correlation coefficient),其公式为:

r = (nΣxy - (ΣxΣy)) / (√(nΣx² - (Σx)²) √(nΣy² - (Σy)²))

其中,n是样本数量,x和y分别是两个变量的值,x和y分别是x和y的平均值,Σ是求和符号。

这个公式计算的是两个变量之间的皮尔逊相关系数,它衡量的是两个变量之间的线强度和方向。

假设有两个变量x和y,它们的值如下:

x: 3, 5, 7, 9, 11

y: 2, 4, 6, 8, 10

计算皮尔逊相关系数的步骤如下:

1. 计算x和y的平均值:

x的平均值 = (3 + 5 + 7 + 9 + 11) / 5 = 7

y的平均值 = (2 + 4 + 6 + 8 + 10) / 5 = 6

2. 计算x和y的乘积之和:

Σxy = 32 + 54 + 76 + 98 + 1110 = 200

3. 计算x和y的和:

Σx = 3 + 5 + 7 + 9 + 11 = 35

Σy = 2 + 4 + 6 + 8 + 10 = 30

4. 计算x和y的平方和:

Σx² = 3² + 5² + 7² + 9² + 11² = 235

Σy² = 2² + 4² + 6² + 8² + 10² = 260

5. 将上述值代入皮尔逊相关系数的公式:

r = (5200 - (53530)) / (√(5235 - (535)²) √(5260 - (530)²))

经过计算,我们得到r的值为1。变量x和y是完全正相关的,这意味着当x增加时,y也增加,反之亦然。

需要注意的是,相关系数只能衡量两个变量之间的线,不能衡量非线。相关系数也受到样本数量、数据分布等因素的影响,因此在实际应用中需要谨慎解释。