单个工具示例
“关联分析”具有单个工具示例。转至示例工作流以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。
“关联分析”可确定数据库中的哪些字段具有双变量关联关系。该评估可基于以下任一方法:皮尔逊积差(“常规”)相关系数*、斯皮尔曼等级相关系数**,或霍夫丁 D 统计量***(一种可以发现倒 U 型关系等非单调关系的非参数测试)。此外,还会确定每个关联度量的统计显著性。
该工具始终提供完整的关系集,并可选择性地深入分析感兴趣的目标字段及其与其他数值变量的关系。感兴趣的目标字段可以是数值变量或二元分类变量。如果将二元分类变量用作目标字段,它将被转换为一个 0-1 数值字段;当该字段的某个级别与目标级别匹配时,赋值为 1,否则赋值为 0。
注意
此工具使用 R 工具。转至选项 > 下载预测工具,并登录到 Alteryx 下载和许可证门户以安装 R 和 R 工具使用的软件包。请访问下载和使用预测工具。
选择目标字段以获得更多详细分析:此选项让您可以对数据中一个感兴趣的字段和其他字段运行更有针对性的分析。如果分析的目标是确定要在后续预测模型中使用的一组字段,则此选项特别有用。选择此选项时,您必须提供目标字段的名称,该名称可以是数值或二元分类。如果该字段是二元分类,请选择该字段的值,此值将被重新编码为 1,而其他值将编码为 0。如果提供的字段是分类字段,并且包含两个以上的不同值,将会返回错误。包含唯一标识符的列(如代理主键和自然主键)不应在统计分析中使用。它们没有预测值,并可能导致运行时异常。
字段(选择两个或更多):选择用于关联分析的字段。如果选择了“目标”字段,则该字段将自动包含在此列表中。非目标字段必须为数值。
关联度量:选择其中一项...
R 锚点:报告输出包含 3 个表,这些表共同组成了皮尔逊相关系数分析的结果:
重点分析字段事务
完全相关系数矩阵
相应 P 值矩阵
I 锚点:交互式报告包含一个相关系数矩阵以及一个随鼠标位置而变化的散点图。