Skip to main content

Score Tool 评分工具

单个工具示例

评分工具具有一个单个工具示例。访问示例工作流以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。

评分工具通过将 R 模型应用于一组提供的预测变量来创建目标变量的估计值。如果目标变量是分类的,则评分工具提供记录(基于预测变量)属于每个类别的概率。如果目标变量是连续的,则评分工具会估计目标变量的值。尽管评分工具可用于评估模型性能,但是不能单独使用它来进行评估。

此工具使用 R 工具。请转到选项 > 下载预测工具并登录到 Alteryx 下载和许可证门户以安装 R 和 R 工具使用的软件包。请访问下载和使用预测工具

模型类型

评分工具可以从多个位置评估模型:

  • 本地模型:将模型从本地计算机拉入工作流或在数据库中访问模型。

  • Promote 模型:模型存储在 Promote 模型管理系统中。

本地模型下的配置

可为通过标准工作流访问的模型或使用数据库内套件访问的模型配置评分工具。

常规处理下的工具配置

连接输入

评分工具需要两个输入:

  • 基于 R 的预测工具生成的模型对象。

  • 包含模型配置选择的预测因子字段的数据流。可以是标准的 Alteryx 数据流或 XDF 元数据流。

将这些输入连接到评分工具输入即可开始配置。

支持的模型

即使预测模型的估计使用了 RevoScaleR 函数,评分工具也可以使用来自该模型的数据流。当建模工具的输入来自 XDF 输出工具或 XDF 输入工具并且使用 RevoScaleR 函数估计模型时,评分工具则只能使用 XDF 元数据流。

Oracle R Enterprise 使用与 Oracle 数据源连接的数据库内预测工具估计的模型,不能用于为标准 Alteryx 数据流评分,不过,使用标准 Alteryx 数据流估计的模型可用来为 Oracle 数据源评分。

配置

只有目标是二进制分类变量时,通过此选项作出的调整才有效。

  • 新字段名称(连续目标)或前缀(分类目标):字段名称或前缀必须以字母开头,并且可以包含字母、数字以及特殊字符句点(“.”)和下划线(“_”)。R 区分大小写。

  • 目标字段具有过采样值:这些字段用于调整拟合概率,以匹配真实样本百分比。选择以提供:

    • 过采样的目标字段值:过采样字段的名称。

    • 过采样前原始数据中过采样值的百分比:过采样过程中重复的值的百分比。

  • 仅限非正则线性回归选项:

    ORE 创建的模型

    如果使用 ORE 创建的模型,原始估计表格必须存在于数据库中才能计算置信区间。

    • 目标字段已进行自然对数转换:选择此选项可应用转换,将值拟合回原始范围,并使用 Smearing 估计量来考虑后续转换偏差。

    • 包含预测置信区间:选择此选项,可指定用于计算置信区间的值。

  • 特定于 XDF 输入的选项:

    • 将分数附加到输入 XDF 文件:选择此选项,可将分数附加到输入 XDF 文件,而不是将其放在 Alteryx 数据流中。

  • 每次评分的记录数:选择一个组中的记录数。一次对一组输入数据进行评分,以免超出 R 的内存处理限制。

用于数据库内处理的工具配置

评分工具支持 Oracle、Microsoft SQL Server 2016 和 Teradata 数据库内处理。有关数据库内支持和工具的详细信息,请访问数据库内概述

如需访问评分工具的数据库内版本:

  • 请将数据库内工具放在画布上。评分工具会自动转换为数据库内版本。

  • 右键单击评分工具,指向“选择工具版本”,然后选择数据库内版本。

有关预测型数据库内支持的详细信息,请访问预测分析

连接输入

评分工具需要两个输入:

  • 基于 R 的预测工具生成的模型对象。

  • 包含模型配置选择的预测因子字段的数据流。可以是标准的 Alteryx 数据流或 XDF 元数据流。

将这些输入连接到评分工具输入即可开始配置。

支持的模型

即使预测模型的估计使用了 RevoScaleR 函数,评分工具也可以使用来自该模型的数据流。当建模工具的输入来自 XDF 输出工具或 XDF 输入工具并且使用 RevoScaleR 函数估计模型时,评分工具则只能使用 XDF 元数据流。

ORE 使用与 Oracle 数据源相连接的数据库内预测工具估计的模型,不能用于为标准 Alteryx 数据流评分,不过,使用标准 Alteryx 数据流估计的模型可用来为 Oracle 数据源评分。

配置

不允许使用其它特殊字符,R 区分大小写。

  • 输出表格名称:键入数据库中用于保存结果的表格的名称。

  • 新字段名称(连续目标)或前缀(分类目标):字段名称或前缀必须以字母开头,并且可以包含字母、数字以及特殊字符句点(“.”)和下划线(“_”)。

  • 目标字段具有过采样值:这些字段用于调整拟合概率,以匹配真实样本百分比。只有目标是二进制分类变量时,通过此选项作出的调整才有效。选择以提供:

    • 过采样的目标字段值:过采样字段的名称。

    • 过采样前原始数据中过采样值的百分比:过采样过程中重复的值的百分比。

  • 仅限线性回归选项:

    ORE 创建的模型

    如果使用 ORE 创建的模型,原始估计表格必须存在于数据库中才能计算置信区间。

    • 目标字段已进行自然对数转换:选择此选项可应用转换,将值拟合回原始范围,并使用 Smearing 估计量来考虑后续转换偏差。

    • 包含预测置信区间:选择此选项,可指定用于计算置信区间的值。

  • Teradata 特定配置:Microsoft Machine Learning Server 需要有关要使用的特定 Teradata 平台的其他配置信息。此信息通常由本地 Teradata 管理员提供。

    • Teradata 服务器上指向 R 的二进制可执行文件的路径。

    • Microsoft Machine Learning Server 使用的临时文件写入位置。

模型来源(仅限 Oracle)

  • 模型来源:选择传递到评分工具 (M) 输入的模型对象的来源。可通过以下方法辨识:

    • 在数据库中,通过数据流“名称”字段中的值辨识。

    • 包含在数据流的“对象”字段中。

查看输出

输出包括带有模型预测值的原始数据流。对于使用分类目标的模型,由用户提供的前缀和目标变量可能级别对应字段的后缀组成的字段名称,会提供目标变量每个级别的预测概率。

Promote 模型下的配置

Promote 是一个用于部署、管理和扩展预测模型的平台。Alteryx 可以连接到 Promote 平台,以访问存储的模型并为它们评分。

Promote 凭证

  • 建立 Alteryx Promote 连接

  • Alteryx Promote 连接:用于选择已保存的 Promote 连接的下拉列表。

  • 添加连接:将连接添加至可用 Promote 连接列表的选项。Promote 连接管理器的运行独立于工作流。

添加 Promote 连接

  1. 单击添加连接

  2. 在“添加连接”窗口中,输入 Alteryx Promote URL,该 URL 指向模型的存储位置。

  3. 选择下一步

  4. 在“Alteryx Promote 凭证”窗口中,输入您的用户名API 密钥

  5. 选择连接

  6. 如连接成功,请在“连接已建立”窗口中选择完成。新连接被选中并显示在下拉列表中。

删除 Promote 连接

  1. 选择一个可用连接。

  2. 选择移除连接

  3. 在“确认”窗口中,核实 URL 和用户名是否与要移除的连接相关联。

  4. 选择确定。该连接在下拉列表中不再可用。

Promote 访问权限

如不确定是否有访问 Promote 功能的权限,或在查找所需凭证时需要帮助,请联系您当地的管理员或支持代表。

模型选择

生成您有权访问的模型列表。滚动浏览列表或使用搜索功能查找要评分的模型并选择模型路径。

选中模型路径后,有关模型的信息会显示出来。

  • 名称:模型名称。

  • 所有者:模型所有者。

  • 状态:模型的当前状态,反映其可访问性。

    • 在线:模型是最新的,可随时处理数据。

    • 构建:模型当前正在更新之中,无法处理数据。

    • 失败单元测试:模型构建完成,但组件构建失败。模型无法处理数据。

    • 失败:模型构建失败,无法处理数据。

    • 离线:模型尚未生成,无法处理数据。

  • 上次更新时间:最后一次构建模型的时间戳。

验证模型是否可用于处理数据,然后选择“完成”。

配置摘要

配置摘要提供已选模型所用凭证的摘要和模型摘要。