Skip to main content

Mesclar tabelas

A ferramenta Gravar Dados In-DB é compatível com a mesclagem de tabelas para fluxos de trabalho conectados ao Unity Catalog do Databricks. Essa opção mescla um conjunto de atualizações ou exclusões com base nos registros de entrada (a origem ) em uma tabela Delta de destino (o alvo ).

Ela usa uma instrução MERGE INTO, conforme descrito na documentação do Databricks .

Para configurar a funcionalidade "Mesclar tabelas" na ferramenta Gravar Dados In-DB:

  1. Crie uma conexão com o Unity Catalog do Databricks através da caixa de diálogo "Gerenciar conexões in-DB".

  2. Para criar os dados de origem, escolha uma destas opções:

    • Conecte uma ferramenta Conectar In-DB ao Unity Catalog do Databricks e faça o mapeamento para a tabela que será usada como os dados de origem na funcionalidade "Mesclar Tabelas".

    • Use uma ferramenta Entrada do Fluxo de Dados para trazer dados de um conjunto externo para o Databricks para serem usados como os dados de origem.

  3. Conecte uma ferramenta Gravar Dados In-DB ao fluxo de trabalho e selecione Mesclar tabelas como o modo de saída.

    • A opção "Mesclar Tabelas" só estará disponível se a ferramenta puder detectar uma conexão ao Unity Catalog do Databricks.

  4. Insira o Nome da tabela-alvo . Esta é a tabela que está sendo modificada. A tabela deve ser uma tabela Delta.

  5. Clique em Aplicar para salvar o nome da tabela-alvo e atualizar os campos de mescla.

  6. Escolha os Campos de mescla no menu suspenso. Pelo menos um conjunto de campos de mescla deve ser selecionado.

  7. Selecione a Ação para correspondência

    • Excluir : exclua todas as linhas que apresentam correspondência na tabela-alvo.

    • Atualizar : atualize as linhas da tabela-alvo que apresentam correspondência com os dados da origem.

      • Configurar automaticamente por nome : mapeie os campos automaticamente, dos dados de origem à tabela-alvo. Campos extra nos dados de origem são ignorados. Campos ausentes causam falha no fluxo de trabalho.

      • Personalizado : faça a correspondência dos campos manualmente, dos dados de origem à tabela-alvo. Todos os campos devem ser mapeados; os campos-alvo não podem ser [nenhum] . Campos ausentes causam falha no fluxo de trabalho.