Skip to main content

合并表格

库内写入数据 工具支持连接到 Databricks Unity Catalog 的工作流的合并表ge。此选项根据传入记录( )将一组更新或删除合并到目标 Delta 表格( 目标 )中。

它使用 Databricks 文档 中所述的 MERGE INTO 语句。

要在库内写入数据工具中配置合并表格:

  1. 通过“管理库内连接”对话框,创建 Databricks Unity Catalog 连接。

  2. 要创建源数据,请从以下选项中选择一项:

    • 库内连接工具 连接到 Databricks Unity Catalog 连接,并将其映射到将用作合并表格源数据的表格中。

    • 或者使用 数据流传入工具 ,将外部数据集中的数据导入 Databricks 以用作源数据。

  3. 库内写入数据工具 连接到工作流,然后选择 合并表格 作为输出模式。

    • 合并表格只有在工具能检测到 Databricks Unity Catalog 连接时才可用。

  4. 输入 目标表格名称 。这是要修改的表格。该表格必须是 Delta 表格。

  5. 选择 应用 以保存目标表格名称并更新合并字段。

  6. 从下拉列表中选择 合并字段 。必须至少选择一组合并字段。

  7. 选择 匹配操作

    • 删除 :删除目标表格中所有匹配的表格行。

    • 更新 :使用源数据更新匹配的目标表格内的行。

      • 按名称自动配置 :自动将源数据中的字段映射到目标表格。源数据中的额外字段将被忽略。缺失字段会导致工作流失败。

      • 自定义 :手动将源数据中的字段与目标表格匹配。必须映射所有字段,目标字段不能为 [无] 。缺失字段会导致工作流失败。