Skip to main content

Image Processing Tool Icon 图像处理

使用“图像处理”工具对图像执行各种操作。利用此工具可以对齐、二值化、缩放、移位、裁剪图像。您还可以平衡图像亮度并将其转换为灰色。

要求 Alteryx Intelligence Suite

此工具是 Alteryx Intelligence Suite 的一部分。Intelligence Suite 需要单独的许可证,并需要以 Designer 附加组件进行安装。安装 Designer 后,请安装 Intelligence Suite 并 开始您的免费试用

工具组件

“图像处理”工具有 3 个锚点(2 个输入和 1 个输出):

  • 输入锚点:利用输入锚点连接要处理的图像。

  • 可选输入锚点:从 “图像模板”工具 连接注释。您可以将这些注释用作 移位 步骤的锚点。

  • 输出锚点:通过输出锚点将已处理图像传递到下游。

    • 注意:“image_processed”列包含您的已处理图像。

配置工具

  1. 在画布上添加一个“图像处理”工具。

  2. 使用输入锚点来连接要处理的图像。

  3. 图像 字段中,选择要处理的图像。

  4. 选择 添加步骤 按钮打开一个下拉列表,从中选择以下任一步骤:

    此工具按从上到下的顺序处理每个步骤。您可以拖动已添加的步骤来重新对这些步骤排序。选择垃圾桶图标可删除单个步骤。

    • 对齐

    • 亮度平衡

    • 裁剪

    • 增强

    • 灰度

    • 光学字符识别优化

    • 缩放

    • 移位

    • 二值化

  5. 运行 工作流

高级

图像处理的每个步骤都有高级配置选项。

对齐

使用 对齐 步骤旋转图像或扫描的文档。此步骤可以优化倾斜的扫描文档的光学字符识别结果。

对齐 有 2 种模式:

  • 自动 :为您的光学字符识别工作流自动旋转扫描的文档或图像。 自动 功能对包含文本的图像效果最好。请注意,自动旋转仅适用于旋转 45 度或 45 度以下的图像。

  • 自定义 :使用滑块选择工具旋转图像的角度和方向。选择刷新图标可重置滑块。如果您知道确切的旋转角度或图像旋转超过 45 度时,请使用 自定义

亮度平衡

自动或手动调整图像的亮度。

将多通道图像转换为单通道。 自动 选项使工具自动平衡图像的亮度。如果选择 自定义 选项,则可以使用滑块指定图像的亮度或暗度。

裁剪

删除部分图像。

要裁剪图像,请选择要保留多少图像。您可以通过以像素或百分比表示宽度和高度来进行选择。然后使用定位网格来选择裁剪后要保留的图像部分。

增强

提高图像分辨率并改善图像质量。使用 增强 来改善您的计算机视觉任务(比如光学字符识别)的结果。以下是可用的图像增强模式:

  • 用于光学字符识别的文本 :对于包含键入文本的图像,将分辨率提升 400%。此选项可以改善光学字符识别结果。请注意, 用于光学字符识别的文本 仅针对小于或等于 1000 × 1000 像素的图像应用增强功能。通过该工具更大的图像不予以增强。

重要

请注意,由于 增强 依赖于深度学习模式,因此它可能需要比其他步骤更长的处理时间。

灰度

将多通道图像转换为单通道。您不必进行任何配置。

光学字符识别优化

优化扫描的 PDF 文件以进行光学字符识别 (OCR)。只能对带有扫描伪影、打印背景纹理和非白色背景的嘈杂文档使用 OCR 优化 。我们不建议对干净文档使用 OCR 优化

OCR 优化 具有 3 种模式:

  • 自动 :该工具就各文档自动决定是 还是 处理。

  • :用于密度较高和干扰因素较多的文档。

  • :用于相对干净的文档。

如果文档背景不全是白色,请选择 某些文本背景非白色 。例如,如果您的文档具有蓝色背景的白色文本,请选择此选项。

缩放

调整图像大小。

选择要将图像调整到怎样的大小。您可以指定宽度和高度(以像素为单位),也可以指定相对于原始图像大小的百分比。

您也可以选择锁定图像的宽高比,这意味着即使您更改高度或宽度,图像的比例也不会改变。

移位

自动对扫描时未对齐的文档移位处理。使用 移位 功能来优化扫描后文档的光学字符识别结果。按照以下步骤使用 移位 功能:

  1. “图像模板”工具 中创建注释以充当锚点。 移位 功能使用锚点对齐其他扫描的文档。注意: 移位 功能不适用于 表格检测 。仅使用在手动注释模式下添加的注释。

  2. 将“图像模板”工具连接至可选的输入锚点。

  3. 添加 移位 步骤。

  4. 选择 移位 下的 锚点 ,以自动移位扫描的文档。

  5. 从步骤 1 中创建的注释中选择 锚点名称

  6. 运行 工作流。

二值化

设置将图像转换为二进制图像(如黑白)的阈值,应用于每个通道。

我们提供了多种您可用的算法,来对图像二值化。在大多数情况下,我们建议您对文本图像(如书籍的扫描页面)使用 自适应Gaussian ,对其他图像(如照片)使用 二进制 。有关二值化的更深入讨论,请访问 OpenCV 二值化文档

注意 - 自适应阈值设置方法要求图像为单通道(即灰色)。如果您在 二值化 步骤之前没有添加 灰度 步骤,我们会为您执行灰度设置,但不会在“配置”窗口中添加灰度步骤。