Skip to main content

Volumes do Databricks

Tipo de conexão

ODBC (64 bits)

Requisitos de configuração do driver

O host deve ser um hostname do Server JDBC/ODBC do cluster do Unity Catalog do Databricks.

Tipo de suporte

Gravação in-DB

Validado em

Cluster do Databricks e SQL Warehouse, Driver do Simba Apache Spark 2.6.23.1039

Detalhes do driver

O processamento in-DB requer drivers de banco de dados de 64 bits.

Ferramentas do Alteryx usadas para conexão

Processamento de fluxos de trabalho no banco de dados

Ferramenta Conectar In-DB

Blue icon with database being plugged in.

Ferramenta Entrada do Fluxo de Dados

Blue icon with a stream-like object flowing into a database.

Cuidado

  • O Volumes do Databricks só é compatível usando DCM.

  • O Volumes do Databricks só é compatível usando conexões sem DSN.

  • O Volumes do Databricks só é compatível com o Unity Catalog.

  • A gravação no Unity Catalog do Databricks só tem suporte usando as ferramentas in-DB.

  • A Alteryx oferece suporte ao MergeInDB para o Unity Catalog do Databricks. Vá para a ferramenta Gravar Dados In-DB.

Configurar conexão in-DB

  1. Abra a janela Gerenciar conexões in-DB.

  2. Selecione Unity Catalog do Databricks no menu suspenso Fonte de dados.

  3. Clique em Nova para criar uma nova conexão.

  4. Insira um nome de conexão.

  5. Na guia Leitura, selecione Configurar conexão para abrir o Gerenciador de Conexões do DCM para o Unity Catalog do Databricks. O Gerenciador de Conexões do DCM é pré-filtrado para mostrar apenas conexões ODBC do Apache Spark sem DSN com Simba (Unity Catalog do Databricks).

  6. Selecione uma conexão existente ou clique em + Novo para criar uma nova conexão. Acesse Unity Catalog do Databricks para configurar uma nova conexão usando o DCM.

  7. Na guia Gravar, selecione Carregador em massa do Volumes do Databricks UC (Avro) no menu suspenso.

  8. Selecione Configurar conexão para abrir o Gerenciador de Conexões do DCM para a conexão do Databricks. O Gerenciador de Conexões do DCM é pré-filtrado para mostrar apenas conexões ODBC do Apache Spark em massa sem DSN com Volumes do Databricks UC.

  9. Selecione uma conexão existente ou clique em + Novo para criar uma nova conexão. Veja abaixo como configurar uma nova conexão usando o DCM.

  10. Clique em Aplicar e OK para salvar a conexão e fechar a janela.

  11. Se o Gerenciador de Conexões in-DB foi acessado através da ferramenta Conectar In-DB, a janela Escolher tabela ou especificar consulta é carregada e permite que você selecione as tabelas.

Configurar o ODBC do Apache Spark em massa sem DSN com Volumes do Databricks UC no DCM

Essa conexão é usada para gravar dados no Unity Catalog do Databricks usando o preparo do Volumes.

  1. Abra o Gerenciador de Conexões de Dados e navegue até o ODBC do Apache Spark em massa sem DSN com Volumes do Databricks UC.

    - A partir de uma ferramenta de entrada ou do Gerenciador de Conexões in-DB, o DCM é pré-filtrado.

    - No menu "Arquivo", vá para Arquivo > Gerenciar conexões > + Novo > Apache Spark > ODBC do Apache Spark em massa sem DSN com Volumes do Databricks UC.

  2. Insira um Nome da fonte de dados.

  3. Insira o nome do host do Unity Catalog do Databricks.

  4. A porta está definida como 443 por padrão. Altere conforme necessário.

  5. Insira o caminho http. O caminho http é o URL de recursos de computação do Databricks.

  6. Insira o Catálogo. Isso define o catálogo que é usado para gravar dados e criar tabelas.

  7. Insira o Esquema. Isso define o esquema que é usado para gravar dados e criar tabelas.

  8. Introduza o caminho completo para o Volumes do Databricks no formato/Volumes/<catalog>/<schema>/<volume>/<path/to/folder>.

  9. Selecione Salvar para salvar a fonte de dados.

  10. Selecione + Conectar credencial para adicionar uma credencial.

    1. Selecione um Método de autenticação.

    2. Para usar um token de acesso pessoal, selecione Nome de usuário e senha como método de autenticação e selecione "token" como o nome de usuário.

    3. Para usar o Azure AD, acesse Autenticação OAuth para o Databricks Azure.

    4. Selecione uma Credencial existente ou clique em Criar nova credencial para criar uma nova credencial e insira o token de acesso pessoal ou as informações para o Azure AD.

  11. Clique em Vincular para vincular a credencial à fonte de dados.

  12. Clique em Conectar.