Skip to main content

Pearson Correlation Tool Icon 皮尔逊相关系数工具

单个工具示例

“皮尔逊相关系数”提供单个工具示例。转至示例工作流以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。

使用皮尔逊相关系数衡量 2 个变量之间的相关性。

皮尔逊相关系数工具使用皮尔逊积差相关系数(有时称为 PMCC,通常用 r 表示)来衡量两个变量 X 和 Y 之间的相关性(线性相关性),给出一个介于 +1 和 -1 之间的值。在科学领域,它被广泛用于衡量两个变量之间线性相关性的强度。*

相关性(通常用相关系数 ρ 来衡量)表示两个随机变量之间线性关系的强度和方向。相关性值的范围为 -1.00(完美负相关性)到 +1.00(完美正相关性)。值为 0 表示完全没有相关性。

皮尔逊系数是由这两个变量的协方差除以它们标准偏差的乘积得到的。

配置工具

  • 为所选变量生成相关系数:从输入流中选择两个或多个字段(列)进行相关性计算。字段必须为数字字段。包含唯一标识符的列(如代理主键和自然主键)不应用于统计分析。它们没有预测值,并可能导致运行时异常。

  • 指定要运行的计算类型:

    • 计算相关系数:计算皮尔逊相关系数。

    • 计算协方差:计算不同字段之间的协方差。协方差的类型是“样本协方差”,与 Excel 统计公式“COVARIANCE.S”相同。

皮尔逊相关系数工具要求输入非 Null 值。如果数据中有 Null 值,最好先使用数值替换工具来替换 Null 值。

*http://zh.wikipedia.org/wiki/皮尔逊积矩相关系数