皮尔逊相关系数和斯皮尔曼相关系数的区别
1.连续数据,正态分布,线性关系,pearson相关系数最合适,当然也可以用spearman相关系数,效率没有pearson相关系数高。
2.如果上述任何条件不满足,使用spearman相关系数,而不是pearson相关系数。
3.spearman相关系数也用于两个有序测量数据之间,但不能使用pearson相关系数。
扩展知识:
皮尔逊相关通常用于计算等距等比数据或连续数据之间的相关性。这种数据的值不限于整数。比如皮尔逊相关适用于前两次考试成绩的相关。
Spearman相关性专门用于计算等级数据之间的关系。这类数据的特点是数据有连续的等级,但两个连续等级的具体分数差不一定相等。例如,第一名和第二名之间的分数差可能不等于第二名和第三名之间的分数差。两次考试的排名数据适用于spearman相关。
Spearman相关只能计算分层数据,而pearson相关既可以计算分层相关,也可以计算连续数据相关,但pearson相关一般默认用于计算连续数据的相关。
你在线吗?在统计学中,以查尔斯·斯皮尔曼命名的斯皮尔曼相关系数就是斯皮尔曼相关系数。通常用希腊字母ρ表示。它是衡量两个变量相关性的一个非参数指标。它使用单调方程来评估两个统计变量之间的相关性。如果数据中没有重复值,且两个变量完全单调相关时,Spearman相关系数为+1或?1。
皮尔逊相关系数(Pearson CorrelationCoefficient)用于衡量两个数据集是否在同一直线上,用于衡量定距变量之间的线性关系。
如测算国民收入与居民储蓄存款、身高体重、高中成绩、高考成绩的线性相关关系。当两个变量都是正态连续变量且两者之间存在线性关系时,用积矩相关系数来表示两个变量之间的相关程度,主要是皮尔逊简单相关系数。
参考资料:
斯皮尔曼相关系数_百度百科
皮尔逊相关系数_百度百科