Skip to main content

Distribution Analysis Tool Icon 分布分析工具

单个工具示例

“分布分析”具有单个工具示例。转至示例工作流以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。

利用“分布分析”工具将一个或多个分布匹配至输入数据,并根据一系列拟合优度统计数据*进行比较。根据这些测试结果的统计意义(p 值),您可以确定哪些分布最能代表这些数据。

“分布分析”工具可帮助您了解数据的整体性质,以及决定具体数据分析方法。例如,呈正态分布的数据可能更适合使用线性回归进行分析,而呈伽马分布的数据则更适合使用“伽马回归”工具进行分析。

此工具使用 R 工具。转至选项 > 下载预测工具,并登录到 Alteryx 下载和许可证门户以安装 R 和 R 工具使用的软件包。请访问下载和使用预测工具

配置工具

“配置”选项卡

使用配置选项卡为分布分析设置必备控件。

  1. 选择字段进行分析:从传入数据中选择字段进行分析。

  2. 选择要对比的分布:选择一个或多个分布进行比较。分布选项包括:

    • 正态:一种常见的连续概率分布,常用于在自然科学和社会科学中表示实值随机变量(即,可以取正值或负值的连续随机变量)。

    • 对数正态:一种随机变量(其对数呈正态分布)的连续概率分布。此类分布非常适合描述生长率和大小分布等自然现象。此外,它还常用于描述大型人口群体的收入分布情况。

    • 威布尔(Weibull):一种相对灵活且与指数分布密切相关的分布。它常用于描述某种“失败”率数据,例如随机机械故障率、死亡率、流失率、机械磨损率等。

    • 伽马:一种连续概率分布,其特征是在非整数、非负的较低值处有明显的集中趋势,同时也允许出现远高于这些值的合理可能性。伽马分布用途广泛,常用于描述每个案例的汇总或平均金额数据,例如按个人计算的平均保险索赔金额。

对数正态、Weibull 和伽马分布仅适用于非负数据。

包含唯一标识符的列(如代理主键和自然主键)不应在统计分析中使用。它们没有预测值,并可能导致运行时异常。

图表选项卡

使用图表选项选项卡设置图表输出控件(可选)。

  • 图表大小:为图表大小选择英寸厘米单位,并设置宽度高度值。

  • 图表分辨率:选择图表的分辨率(以每英寸点数为单位):1x (96 dpi)2x (192 dpi);或 3x (288 dpi)

    • 较低的分辨创建相对较小的文件,最适合在显示器上查看。

    • 更高的分辨率可以创建一个更大的文件,具有更好的打印质量。

查看输出

一组报告片段,其中包括直方图、测试结果的基本统计摘要、拟合优度统计数据、每个分布的数据分位数以及分布参数。

*D'Agostino, R., Stephens, M.A. (1986) Goodness of Fit Techniques.