Skip to main content

Databricks Volumes

Verbindungstyp

ODBC (64 Bit)

Anforderungen an die Treiberkonfiguration

Der Host muss ein JDBC/ODBC-Serverhostname des Databricks Unity Catalog-Clusters sein.

Typ der Unterstützung

In-DB Schreiben

Validiert am

Databricks Cluster und SQL Warehouse Simba Apache Spark Driver 2.6.23.1039

Treiberdetails

Die In-DB-Verarbeitung erfordert 64-Bit-Datenbanktreiber.

Alteryx-Tools für die Verbindung

In-DB-Workflow-Verarbeitung

In-DB-verbinden-Tool

Blue icon with database being plugged in.

Eingehender-Datenstrom-Tool

Blue icon with a stream-like object flowing into a database.

Achtung

  • Databricks Volumes wird nur mit dem DCM unterstützt.

  • Databricks Volumes wird nur mit DSN-losen Verbindungen unterstützt.

  • Databricks Volumes wird nur für Unity Catalog unterstützt.

  • Das Schreiben in Databricks Unity Catalog wird nur mit den In-DB-Tools unterstützt.

  • Alteryx unterstützt MergeInDB für Databricks Unity Catalog. Gehen Sie zu In-DB-Daten-schreiben-Tool.

In-DB-Verbindung konfigurieren

  1. Öffnen Sie das Fenster In-DB-Verbindungen verwalten.

  2. Wählen Sie Databricks Unity Catalog im Dropdown Datenquelle aus.

  3. Wählen Sie Neu aus, um eine neue Verbindung zu erstellen.

  4. Geben Sie einen Verbindungsnamen ein.

  5. Wählen Sie auf der Registerkarte Lesen die Option Verbindung einrichten aus, um den DCM-Verbindungsmanager für Databricks Unity Catalog zu öffnen. Der DCM Connection Manager ist so vorgefiltert, dass nur Verbindungen vom Typ Apache Spark ODBC ohne DSN mit Simba Databricks Unity Catalog angezeigt werden.

  6. Wählen Sie eine vorhandene Verbindung aus, oder erstellen Sie mit +Neu eine neue Verbindung. Gehen Sie zu Databricks Unity Catalog, um eine neue Verbindung mit dem DCM zu konfigurieren.

  7. Wählen Sie auf der Registerkarte Schreiben in der Dropdown-Liste Databricks UC Volumes Bulk-Loader (Avro) aus.

  8. Wählen Sie die Option Verbindung einrichten aus, um den DCM-Verbindungsmanager für die Databricks-Verbindung zu öffnen. Der DCM-Verbindungsmanager ist so vorgefiltert, dass nur Verbindungen vom Typ Apache Spark ODBC Bulk DSN-los mit Simba Databricks UC Volumes angezeigt werden.

  9. Wählen Sie eine vorhandene Verbindung aus, oder erstellen Sie mit +Neu eine neue Verbindung. Informationen zum Konfigurieren einer neuen Verbindung mit DCM finden Sie weiter unten.

  10. Wählen Sie Anwenden und OK aus, um die Verbindung zu speichern und das Fenster zu schließen.

  11. Wenn über das In-DB-verbinden-Tool auf den In-DB-Verbindungsmanager zugegriffen wurde, wird das Fenster Tabelle auswählen oder Abfrage angeben geladen und ermöglicht es Ihnen, Tabellen auszuwählen.

Apache Spark ODBC Bulk DSN-los mit Databricks UC Volumes im DCM konfigurieren

Diese Verbindung wird zum Schreiben von Daten in Databricks Unity Catalog mit Volumes-Staging verwendet.

  1. Öffnen Sie den Data Connection Manager und navigieren Sie zu Apache Spark ODBC Bulk DSN-los mit Databricks UC Volumes.

    - Über ein Eingabe-Tool oder den In-DB Connection Manager wird der DCM vorgefiltert.

    - Gehen Sie im Dateimenü auf Datei > Verbindungen verwalten > +Neu > Apache Spark > Apache Spark ODBC DSN-los mit Databricks UC Volumes.

  2. Geben Sie einen Datenquellennamen ein.

  3. Geben Sie den Hostnamen für Databricks Unity Catalog ein.

  4. Der Port ist standardmäßig auf 443 gesetzt. Bei Bedarf ändern.

  5. Geben Sie den HTTP-Pfad ein. Der HTTP-Pfad ist die URL für die Computing-Ressourcen von Databricks.

  6. Geben Sie den Katalog ein. Legt den Katalog fest, der zum Schreiben von Daten und Erstellen von Tabellen verwendet wird.

  7. Geben Sie das Schema ein. Legt das Schema fest, das zum Schreiben von Daten und Erstellen von Tabellen verwendet wird.

  8. Geben Sie den vollständigen Pfad für das Databricks Volume im Format /Volumes/<catalog>/<schema>/<volume>/<path/to/folder> ein.

  9. Wählen Sie Speichern aus, um die Datenquelle zu speichern.

  10. Wählen Sie +Anmeldedaten verbinden aus, um Anmeldedaten hinzuzufügen.

    1. Wählen Sie eine Authentifizierungsmethode aus.

    2. Um ein persönliches Zugriffstoken zu verwenden, wählen Sie Benutzername und Kennwort als Authentifizierungsmethode aus. Setzen Sie den Benutzernamen auf „Token“.

    3. Informationen zur Verwendung von Azure AD finden Sie unter Databricks Azure OAuth-Authentifizierung.

    4. Wählen Sie Vorhandene Anmeldedaten aus, oder nutzen Sie neue Anmeldedaten erstellen und geben Sie das persönliche Zugriffstoken bzw. die Informationen für Azure AD ein.

  11. Wählen Sie Verknüpfen aus, um die Anmeldedaten mit der Datenquelle zu verknüpfen.

  12. Wählen Sie Verbinden aus.