Skip to main content

Neural Network Tool Icon “神经网络”工具

单个工具示例

“记录 ID”具有一个单个工具示例。访问示例工作流以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。

“神经网络”工具使用单个隐藏层创建前馈感知器神经网络模型。隐藏层中的神经元使用SIGMOD激活函数,输出激活函数则取决于目标字段的性质。具体而言,对于二进制分类问题(例如,客户购买或不购买的概率),使用的输出激活函数是Logistic,对于多项分类问题(例如,客户选择选项A,B, 或C)使用的输出激活函数是softmax,对于回归问题(目标为连续数字字段),则使用线性激活函数进行输出。

神经网络是第一个用于预测建模的 Machine Learning算法(与传统的统计方法相反)。这种方法背后的动机是模仿大脑中神经元的结构(因此方法的名字)。神经网络的基本结构涉及一组输入(预测变量字段),这些输入可馈入一个或多个"隐藏"图层,每个隐藏图层都有一个或多个"节点"(也称为"神经元")。

在第一个隐藏图层中,输入是线性组合(每个节点中每个输入分配一个权重),并且"激活函数"应用于预测变量的权重线性组合。在第二个和后续隐藏图层中,来自先前隐藏图层节点的输出在隐藏图层的每个节点中进行线性组合(同样使用先前隐藏图层中分配给每个节点的权重),并对加权线性组合应用激活函数。最后,最终隐藏图层节点的结果将组合到最终输出图层中,该图层使用与目标类型一致的激活函数。

估计(或神经网络文献词汇中的"学习")涉及为每个输入或先前的层节点值找到一组权重,以最小化模型的目标函数。在连续数值字段的情况下,这意味着与实际值相比,将最终模型预测误差的平方和最小化,而分类网络尝试将二进制和多项分类问题的熵度量最小化。如上所述,神经网络工具(依赖于 R nnet软件包)只允许单个隐藏层(可以具有任意数量的节点),并且始终在隐藏层节点中使用逻辑传输功能。尽管存在这些局限性,我们的研究表明,nnet软件包是目前 R中最强大的神经网络软件包。

而更现代的统计学习方法(例如由提升,森林, 和样条模型工具)通常提供比神经网络模型更强的预测效果,在某些特定应用中(在实际应用之前无法确定),神经网络模型在分类和回归模型中都优于其他方法。此外,在某些领域,例如在财务风险评估中,神经网络模型被认为是一种被广泛接受的"标准"方法。此工具使用 R 工具。转至选项下载预测工具,并登录到 Alteryx 下载和许可证门户以安装 R 工具以及 R 工具使用的软件包。请访问下载和使用预测工具

配置工具

  • 模型名称:需要为每个模型命名,以便以后可以对其进行识别。模型名称必须以字母开头,可包含字母、数字和特殊字符句点 (“.”)和下划线 (“_”)。不允许使用其它特殊字符,R 区分大小写。

  • 选择目标变量:从要预测的数据流中选择字段。此目标变量必须是字符串类型。

  • 选择预测变量:从您认为“导致”目标变量值更改的数据流中选择字段。包含唯一标识符的列(如代理主键和自然主键)不应用于统计分析。它们没有预测价值,并可能导致运行时异常。

  • 使用采样权重进行模型估计:单击该复选框,然后从数据流中选择权重字段以估计使用采样权重的模型。

  • 隐藏图层中的节点数:模型单个隐藏图层中的节点数(神经元)。默认值为10。

  • 包括边际效应图?:在报告中包括一个选项,显示预测变量和目标之间的关系图,对其他预测域的影响进行平均化。要生成的地块数量由"要包含在地块中的田地的最低重要性水平"控制。 这表示特定射野必须对模型作出贡献才能为该射野生成边际效应图的模型总预测功效的百分比。此选项的值越高,生成的边缘效应图的数量就越少。

  • 自定义缩放/标准化...: 如果输入(预测变量字段)在不同的尺度上(例如,收入范围在七千到一百万之间,加上家庭成员数量在一到七之间),则模型权重的最优化基础的数值方法可能会有问题。

  • 无(默认)

  • Z评分:所有预测变量字段都进行了缩放,使其均值为零,标准差为1。

  • 单位间隔:所有预测变量字段的缩放使其最小值为零,最大值为1,所有其他值介于0和1之间。

  • 零居中:所有预测变量字段都进行缩放,使其最小值为负1,最大值为1,所有其他值介于负值和正值1之间)。

  • 重量衰减:衰变重量限制了估计过程中每次迭代(也称为"时代")时新的重量值的移动。衰变权重的值应介于0和1之间,较大的值会对可能的权重移动施加更大的限制。一般而言,介于0.01和0.2之间的重量衰减值通常效果良好。

  • 初始(随机)权重的+/-范围为零:每个隐藏的节点中输入变量的权重使用随机数初始化。此选项允许用户设置使用的随机数的范围。通常,值应接近0.5。但是,如果所有输入变量的大小都较大,则值越小越好。值0实际上是一个特殊值,它使工具在给定输入数据的情况下找到一个良好的构成值。

  • 模型中允许的最大权重数:当隐藏图层中有大量预测变量字段和节点时,该选项变得相关。减少权重数量可加快模型估计速度,同时也可降低算法为权重找到局部最佳(相对于全局最佳)的可能性。从模型中排除的权重被隐式设置为零。

  • 模型估计的最大迭代次数:该值控制算法尝试查找模型权重集相对于上一组权重的改进时可以进行的尝试次数。如果在最大迭代次数之前未发现权重的改进,则算法将终止并返回最佳权重集。此选项默认为100次迭代。一般而言,根据算法的行为,如果需要增加该值可能是有意义的,其代价是延长创建模型的运行时间。

  • 图大小:选择英寸或厘米来丈量图表大小。

  • 图表分辨率:选择图表的分辨率(以每英寸点数为单位):1 x(96 dpi);2 x(192 dpi);或 3 x(288 dpi)。

    • 较低的分辨创建相对较小的文件,最适合在显示器上查看。

    • 更高的分辨率可以创建一个更大的文件,具有更好的打印质量。

  • 基本字体大小(点):选择图表中字体的大小。

查看输出

  • O 锚点:对象。包含序列化模型及其模型名称的表。

  • R 锚点:报告。由“朴素贝叶斯分类器”工具生成的报告片段组成:基本模型摘要,以及每类目标变量的主要效果图。

https://en.wikipedia.org/wiki/Confusion_matrix