相关系数的取值范围是多少?附计算公式与实例解析
相关系数的取值范围通常介于-1和1之间,包括-1、-1到1的区间(不包含-1和1)、以及1。这个取值范围反映了两个变量之间关系的强度和方向。
-1表示完全负相关,意味着当一个变量增加时,另一个变量减少,反之亦然。
1表示完全正相关,意味着当一个变量增加时,另一个变量也增加,反之亦然。
-1到1之间的值表示不同程度的正相关或负相关。0表示没有相关性,即两个变量的变化是独立的。
相关系数的计算公式通常使用皮尔逊相关系数(Pearson correlation coefficient),其公式为:
r = (nΣxy - (ΣxΣy)) / (√(nΣx² - (Σx)²) √(nΣy² - (Σy)²))
其中,n是样本数量,x和y分别是两个变量的值,x和y分别是x和y的平均值,Σ是求和符号。
这个公式计算的是两个变量之间的皮尔逊相关系数,它衡量的是两个变量之间的线强度和方向。
假设有两个变量x和y,它们的值如下:
x: 3, 5, 7, 9, 11
y: 2, 4, 6, 8, 10
计算皮尔逊相关系数的步骤如下:
1. 计算x和y的平均值:
x的平均值 = (3 + 5 + 7 + 9 + 11) / 5 = 7
y的平均值 = (2 + 4 + 6 + 8 + 10) / 5 = 6
2. 计算x和y的乘积之和:
Σxy = 32 + 54 + 76 + 98 + 1110 = 200
3. 计算x和y的和:
Σx = 3 + 5 + 7 + 9 + 11 = 35
Σy = 2 + 4 + 6 + 8 + 10 = 30
4. 计算x和y的平方和:
Σx² = 3² + 5² + 7² + 9² + 11² = 235
Σy² = 2² + 4² + 6² + 8² + 10² = 260
5. 将上述值代入皮尔逊相关系数的公式:
r = (5200 - (53530)) / (√(5235 - (535)²) √(5260 - (530)²))
经过计算,我们得到r的值为1。变量x和y是完全正相关的,这意味着当x增加时,y也增加,反之亦然。
需要注意的是,相关系数只能衡量两个变量之间的线,不能衡量非线。相关系数也受到样本数量、数据分布等因素的影响,因此在实际应用中需要谨慎解释。
