Skip to main content

Gray icon with file graphic inside Microsoft Azure 数据湖文件输出工具

使用 Azure 数据湖 (ADL) 文件输出工具将 Alteryx 工作流中的数据写入 Azure Data Lake Store (ADLS) 中的文件。支持的文件格式包括 CSV、XLSX、JSON 或 Avro(“附加”操作仅支持 CSV 格式)。

重要

此工具不会随 Alteryx Designer 自动安装。要使用此工具,请从 Alteryx Marketplace 下载。

身份验证方法

要登录 Azure Data Lake Store,您需要指定要连接的存储类型。如果您不确定使用的存储类型,可以询问 Azure 管理员或在 Microsoft Azure 门户 上检查。

“终端用户(基本)”身份验证类型

此方法只能用于公共 Azure 云。要连接到国家云或自定义 URL,请使用“终端用户(高级)”方法。

您需要 Azure 管理员的帮助,以在您组织的 Azure 租户中允许公共 Alteryx 应用程序。描述这些步骤的 Microsoft 文档可在 在 Microsoft Azure 门户上构建 URL 以授予租户范围内的管理员同意 中找到。

租户:Gen1 Alteryx 应用程序的 通用 ADLS 客户端 ID:

Gen2 Alteryx 应用程序的 ADLS 客户端 ID: 2584cace-63ff-47cb-96d2-d153704f4d75

完成此设置后,您可以使用正常的 Microsoft 凭证访问 ADLS 数据。

要登录,只需选择 连接 ,然后输入您的 Microsoft 凭证以访问 ADLS 数据。

“终端用户(高级)”身份验证类型

高级终端用户身份验证支持单租户和多租户身份验证,可用于公共和私有应用程序。 Azure 门户 中的凭证设置。

  1. 选择 身份验证授权端点 ,或通过填写 端点 URL (以 http:// 或 https:// 开头)设置 自定义 端点。

  2. 填写 租户(目录)ID - Azure Active Directory 实例的唯一标识符。此标识符控制 ADLS 所属的 Azure 订阅。如需详细了解如何查找租户 ID,请参阅 Microsoft Azure 文档中的 获取租户 ID 。对于公共应用程序,您可以使用“common”。

  3. 客户端(应用程序)ID

  4. 对于私有应用程序,必须提供 客户端密钥

    注意

    对于 2020.3 之前的 Designer 版本,将显示 重定向 URI 字段,并将预填充此字段。在正常使用模式下无需进一步配置。

  5. 选择 连接

服务到服务身份验证类型

“服务到服务”身份验证适用于在 Server 和 Hub 上发布工作流。有关凭证设置,请参阅 Azure 门户 上的说明。

  1. 选择 身份验证授权端点 ,或通过填写 端点 URL (以 http:// 或 https:// 开头)设置 自定义 端点。

  2. 填写 租户(目录)ID - Azure Active Directory 实例的唯一标识符。此标识符控制 ADLS 所属的 Azure 订阅。如需详细了解如何查找租户 ID,请参阅 Microsoft Azure 文档中的 获取租户 ID

  3. 客户端(应用程序)ID

  4. 对于私有应用程序,必须提供 客户端密钥

  5. 选择 连接

共享密钥身份验证类型

“共享密钥”身份验证只能与 Gen2 存储一起使用。对于 Azure 存储账户,Microsoft 将生成两个访问密钥,可用于通过“共享密钥”授权对 Azure 数据湖的访问。您可以在 Azure 门户 中找到有关共享密钥及其用法的更多信息。

  1. 选择 存储 端点 ,或者通过填写 自定义存储 端点 来设置 自定义 端点。

  2. 填写 存储账户名称 - 为您的存储提供的唯一名称。

  3. 输入 存储账户密钥 - 授权访问的访问密钥。

  4. 选择 连接

工具配置

数据 选项卡中,可以指定要使用的数据:

  1. 指定 存储账户名称 。此存储需要与“身份验证”页面上选择的类型相同(分别为 Gen1 和 Gen2)。

  2. 对于 Gen2 存储,请选择 文件系统名称

  3. 选择 Gen2 的存储和文件系统后,您可以配置要写入的文件的路径。您可以通过直接输入 文件路径 字段或使用文件浏览器指定路径,您可以使用相同的机制创建新文件。

  4. 对于 Excel 文件,可以在文件浏览器下的 工作表 字段中指定工作表名称。如果留空,则自动选择第一个工作表。如果是新文件,工作表将被分配默认名称“Sheet”。

选项 选项卡中,您可以设置输出选项(以下选项特定于使用的某些扩展):

  • 文件格式 (支持的文件格式包括 CSV、XLSX、JSON 或 Avro)

  • 代码页 - 输出字符编码。

  • 现有文件处理方式 (仅 CSV 格式 支持 附加 操作)

  • 上传块大小 - 输入一个值以优化上传速度和内存消耗。

  • 缓冲区大小 - 允许的值为 1 到 256MB。推荐值为 16MB。