Skip to main content

Databricks Volumes

Type de connexion

ODBC (64 bits)

Configuration requise pour le pilote

L'hôte doit correspondre à un nom d'hôte JDBC/ODBC Server du cluster Databricks Unity Catalog.

Type de prise en charge

Écriture en base de données

Validé le

Cluster Databricks et SQL Warehouse, pilote Simba Apache Spark 2.6.23.1039

Détails du pilote

Le traitement dans la base de données nécessite des pilotes de base de données de 64 bits.

Outils Alteryx utilisés pour la connexion

Traitement de workflow en base de données

Outil Connecter en BDD

Blue icon with database being plugged in.

Outil Entrée du flux de données

Blue icon with a stream-like object flowing into a database.

Attention

  • Databricks Volumes est uniquement pris en charge avec DCM.

  • Databrick Volumes n'est pris en charge qu'à l'aide de connexions sans DSN.

  • Databricks Volumes est uniquement pris en charge pour Unity Catalog.

  • L'écriture dans Databricks Unity Catalog est uniquement prise en charge à l'aide des outils En BDD.

  • Alteryx prend en charge MergeInDB pour Databricks Unity Catalog, accédez à l'outil Écrire des données en BDD.

Configurer une connexion en BDD

  1. Ouvrez la fenêtre Gérer les connexions en BDD.

  2. Sélectionnez Databricks Unity Catalog dans la liste déroulante Source de données.

  3. Sélectionnez Nouveau pour créer une nouvelle connexion.

  4. Entrez un nom de connexion.

  5. Dans l'onglet Lire, sélectionnez Configurer la connexion pour ouvrir le gestionnaire de connexions DCM pour le Databricks Unity Catalog. Le gestionnaire de connexions DCM est pré-filtré pour afficher uniquement les connexions à Apache Spark ODBC sans DSN avec Simba Databricks Unity Catalog.

  6. Sélectionnez une connexion existante ou sélectionnez +Nouveau pour créer une nouvelle connexion. Accédez à Databricks Unity Catalog pour configurer une nouvelle connexion à l'aide de DCM.

  7. Dans l'onglet Écriture, sélectionnez Chargeur en masse des volumes Databricks Unity Catalog (Avro) dans la liste déroulante.

  8. Sélectionnez Configurer la connexion pour ouvrir le gestionnaire de connexions DCM pour la connexion Databricks. Le gestionnaire de connexions DCM est pré-filtré pour afficher uniquement les connexions à ODBC Apache Spark en masse sans DSN avec les volumes Databricks Unity Catalog.

  9. Sélectionnez une connexion existante ou sélectionnez +Nouveau pour créer une nouvelle connexion. Voir ci-dessous pour la configuration d'une nouvelle connexion à l'aide de DCM.

  10. Sélectionnez Appliquer et OK pour enregistrer la connexion et fermer la fenêtre.

  11. Si le gestionnaire de connexions en BDD a été accessible via l'outil Connecter en BDD, la fenêtre Choisir une table ou spécifier la requête se charge et vous permet de sélectionner des tables.

Configuration d'Apache Spark ODBC en masse sans DSN avec les volumes Databricks Unity Catalog dans DCM

Cette connexion est utilisée pour écrire des données dans Databricks Unity Catalog à l'aide de la préparation des volumes.

  1. Ouvrez le Gestionnaire de connexions de données et accédez à Apache Spark ODBC en masse avec les volumes Databricks Unity Catalog.

    - À partir d'un outil Entrée ou Gestionnaire de connexion en DBB, DCM est pré-filtré.

    - Dans le menu Fichier, accédez à la section Fichier > Gérer les connexions > +Nouveau > Apache Spark > Apache Spark ODBC sans DSN avec volumes Databricks Unity Catalog.

  2. Saisissez un nom de source de données.

  3. Entrez le nom d'hôte Databricks Unity Catalog.

  4. Le port est défini par défaut sur 443. Modifiez-le au besoin.

  5. Entrez le chemin http. Le chemin http est l'URL des ressources de calcul Databricks.

  6. Entrez le Catalogue. Ceci définit le catalogue utilisé pour l'écriture de données et la création de tables.

  7. Entrez le Schéma. Ceci définit le schéma utilisé pour l'écriture de données et la création de tables.

  8. Entrez le chemin complet du volume Databricks au format /Volumes/<catalog>/<schema>/<volume>/<chemin/du/dossier>.

  9. Sélectionnez Enregistrer pour enregistrer la source de données.

  10. Sélectionnez +Connecter les informations d'identification pour ajouter des informations d'identification.

    1. Sélectionnez une Méthode d'authentification.

    2. Pour utiliser un jeton d'accès personnel, sélectionnez Nom d'utilisateur et mot de passe comme méthode d'authentification et définissez le nom d'utilisateur par « jeton ».

    3. Pour utiliser Azure AD, accédez à Authentification Databricks Azure OAuth.

    4. Sélectionnez des informations d'identification existantes ou sélectionnez Créer Nouvelles informations d'identification pour créer de nouvelles informations d'identification et entrez le jeton d'accès personnel ou les informations pour Azure AD.

  11. Sélectionnez Lier pour lier les informations d'identification à la source de données.

  12. Sélectionnez Se connecter.