Skip to main content

Text Summary under Text Mining_256baa0.png 文本摘要

“文本摘要”工具对文本正文进行总结。使用“文本摘要”工具可以更好地理解文本正文,或将该工具作为辅助手段来完成包含大量文本正文的更多下游任务。该工具利用 Summa - Textrank 中的文本摘要功能。

要求 Alteryx Intelligence Suite

此工具是 Alteryx Intelligence Suite 的一部分。Intelligence Suite 需要单独的许可证,并需要以 Designer 附加组件进行安装。安装 Designer 后,请安装 Intelligence Suite 并 开始您的免费试用

语言支持

“文本摘要”工具支持英语、法语、德语、意大利语、葡萄牙语和西班牙语。

工具组件

"文本摘要"工具有 2 个锚点(1 个输入和 1 个输出):

  • 输入锚点:使用输入锚点以连接要汇总的文本数据。

  • 输出锚点:使用输出锚点以将汇总后的文本传递到下游。

配置工具

  1. 在画布上添加文本摘要工具。

  2. 使用输入锚点将文本摘要工具连接到要工作流中使用的文本数据。

    1. 要将文本数据导入 Designer,请使用 输入数据 文本输入 工具。

    2. 我们建议您移除句子之间的特殊标记。例如,移除 [number]、(number) 和 number 等句子末尾的引用编号。您可以使用 正则表达式工具 移除此类文本。

  3. 选择输入文本 语言 。如果您的文本包含多种语言,请选择最普遍的语言。

  4. 选择要汇总的 包含文本的列

  5. 输入 摘要长度 的句子数。文本摘要中的句子数必须少于文本中的句子数。

  6. 选择 摘要方法

  7. 运行 工作流。

摘要方法

文本摘要输出可能因您选择的算法或模型而异。我们默认推荐使用 TextRank。此列表包括我们支持的当前摘要方法:

  • TextRank:一种基于图形的算法,可以根据重要的句子创建文本摘要。TextRank 使用 提取摘要方法 。此方法会将重要句子标识出来并按照重要程度原文返回这些句子。这种摘要可能不像人类生成的摘要那样清晰明了。TextRank 对于成块的文本效果最佳。移除标题、脚注和文档中不属于文本主体的其他部分。对于支持多种语言的文本,TextRank 对于最常用的语言效果最佳。

输出

输出中包含 1 个列,其中包含文本摘要。连接 “报告文本”工具 ,将原始文本与文本摘要进行比较。