Skip to main content

Tabellen zusammenführen

Das In-DB-Daten-schreiben-Tool unterstützt die Tabellenzusammenführung für Workflows, die mit Databricks Unity Catalog verbunden sind. Mit dieser Option werden eine Reihe von Aktualisierungen oder Löschungen basierend auf den eingehenden Datensätzen (die Quelle) in einer Ziel-Deltatabelle (das Ziel) zusammengeführt.

Verwendet wird eine MERGE-INTO-Anweisung, wie in der Databricks-Dokumentation beschrieben.

So wird die Funktion „Tabellen zusammenführen“ im In-DB-Daten-schreiben-Tool konfiguriert:

  1. Erstellen Sie eine Databricks Unity Catalog-Verbindung über das Dialogfeld „In-DB-Verbindungen verwalten“.

  2. Um die Quelldaten zu erstellen, wählen Sie eine der folgenden Optionen:

    • Verbinden Sie ein In-DB-verbinden-Tool mit der Databricks Unity Catalog-Verbindung und ordnen Sie es der Tabelle zu, die als Quelldaten für „Tabellen zusammenführen“ verwendet wird.

    • Verwenden Sie ein Eingehender-Datenstrom-Tool, um Daten aus einem externen Dataset in Databricks zu übertragen, die als Quelldaten verwendet werden.

  3. Verbinden Sie ein In-DB-Daten-schreiben-Tool mit dem Workflow und wählen Sie Tabellen zusammenführen als Ausgabemodus aus.

    • „Tabellen zusammenführen“ ist nur verfügbar, wenn das Tool eine Databricks Unity Catalog-Verbindung erkennen kann.

  4. Geben Sie den Zieltabellennamen ein. Dies ist die Tabelle, die geändert wird. Die Tabelle muss eine Deltatabelle sein.

  5. Wählen Sie Anwenden aus, um den Zieltabellennamen zu speichern und die Zusammenführungsfelder zu aktualisieren.

  6. Wählen Sie die Zusammenführungsfelder aus der Dropdown-Liste. Mindestens ein Paar von Zusammenführungsfeldern muss ausgewählt werden.

  7. Wählen Sie Übereinstimmungsaktion aus.

    • Löschen: Löscht alle übereinstimmenden Tabellenzeilen in der Zieltabelle.

    • Aktualisieren: Aktualisiert die Zeile der übereinstimmenden Zieltabelle mit den Quelldaten.

      • Automatisch nach Name konfigurieren: Ordnet die Felder aus den Quelldaten automatisch der Zieltabelle zu. Zusätzliche Felder in den Quelldaten werden ignoriert. Fehlende Felder führen dazu, dass der Workflow fehlschlägt.

      • Benutzerdefiniert: Stimmt die Felder aus den Quelldaten manuell mit der Zieltabelle ab. Alle Felder müssen zugeordnet werden, Zielfelder dürfen nicht [none] sein. Fehlende Felder führen dazu, dass der Workflow fehlschlägt.