Skip to main content

Apache Spark Code Tool Icon Apache Spark-Code

Das Apache-Spark-Code-Tool ist ein Code-Editor zum Erstellen eines Apache-Spark-Kontexts und zum Ausführen von Apache-Spark-Befehlen direkt über Alteryx Designer. Dieses Tool verwendet die R-Programmiersprache.

Weitere Informationen finden Sie unter Apache Spark Direct#apache-spark-auf-databricks, Apache Spark auf Databricks und Apache Spark auf Microsoft Azure HDInsight.

Verbindung zu Apache Spark

Option 1

Direkt mit Ihrem Apache-Spark-Cluster bestellen.

  1. Ziehen Sie ein In-DB-verbinden-Tool oder Eingehender-Datenstrom-Tool auf den Canvas.

  2. Klicken Sie auf den Dropdown-Pfeil Verbindungsname und wählen Sie Verbindung verwalten aus.

Option 2

Alternativ können Sie eine direkte Verbindung zum Apache-Spark-Code-Tool herstellen.

  1. Ziehen Sie das Apache-Spark-Code-Tool auf den Canvas.

  2. Klicken Sie unter Datenverbindung auf den Dropdown-Pfeil Verbindungsname und wählen Sie Verbindungen verwalten aus.

Bei beiden Methoden wird das Fenster In-DB-Verbindungen verwalten geöffnet. Wählen Sie unter In-DB-Verbindungen verwalten eine Datenquelle aus.

Code Editor

Bei aufgebauter Apache-Spark-Direct-Verbindung wird der Code-Editor aktiviert. Verwenden Sie Code eingeben zum Erstellen von Funktionsvorlagen im Code-Editor.

Bibliothek importieren erstellt eine Importanweisung.

Paket importieren

Daten lesen erstellt eine readAlteryxData-Funktion, um die eingehenden Daten als Apache SparkSQL DataFrame auszugeben.

WertdataFrame = readAlteryxData(1)

Daten schreiben erstellt eine writeAlteryxData-Funktion zur Ausgabe eines Apache SparkSQL DataFrame.

writeAlteryxData(dataFrame, 1)

Protokollmeldung erstellt eine logAlteryxMessage-Funktion, um eine Zeichenfolge als Meldung im Protokoll aufzuzeichnen.

logAlteryxMessage("Example message")

Protokollwarnung erstellt eine logAlteryxWarning-Funktion, um eine Zeichenfolge als Warnung im Protokoll aufzuzeichnen.

logAlteryxWarning("Example warning")

Protokollfehler erstellt eine logAlteryxError-Funktion, um eine Zeichenfolge als Fehler im Protokoll aufzuzeichnen.

logAlteryxError("Example error")

Bibliothek importieren erstellt eine Importanweisung.

aus Modul Bibliothek importieren

Daten lesen erstellt eine readAlteryxData-Funktion, um die eingehenden Daten als Apache SparkSQL DataFrame auszugeben.

dataFrame= readAlteryxData(1)

Daten schreiben erstellt eine writeAlteryxData-Funktion zur Ausgabe eines Apache SparkSQL DataFrame.

writeAlteryxData(dataFrame, 1)

Protokollmeldung erstellt eine logAlteryxMessage-Funktion, um eine Zeichenfolge als Meldung im Protokoll aufzuzeichnen.

logAlteryxMessage("Example message")

Protokollwarnung erstellt eine logAlteryxWarning-Funktion, um eine Zeichenfolge als Warnung im Protokoll aufzuzeichnen.

logAlteryxWarning("Example warning")

Protokollfehler erstellt eine logAlteryxError-Funktion, um eine Zeichenfolge als Fehler im Protokoll aufzuzeichnen.

logAlteryxError("Example error")

Bibliothek importieren erstellt eine Importanweisung.

Bibliothek (jsonlite)

Daten lesen erstellt eine readAlteryxData-Funktion, um die eingehenden Daten als Apache SparkSQL DataFrame auszugeben.

dataFrame<- readAlteryxData(1)

Daten schreiben erstellt eine writeAlteryxData-Funktion zur Ausgabe eines Apache SparkSQL DataFrame.

writeAlteryxData(dataFrame, 1)

Protokollmeldung erstellt eine logAlteryxMessage-Funktion, um eine Zeichenfolge als Meldung im Protokoll aufzuzeichnen.

logAlteryxMessage("Example message")

Protokollwarnung erstellt eine logAlteryxWarning-Funktion, um eine Zeichenfolge als Warnung im Protokoll aufzuzeichnen.

logAlteryxWarning("Example warning")

Protokollfehler erstellt eine logAlteryxError-Funktion, um eine Zeichenfolge als Fehler im Protokoll aufzuzeichnen.

logAlteryxError("Example error")

Code importieren

Verwenden Sie Code Importieren, um einen extern erstellten Code zu übernehmen.

  • Aus Datei öffnet einen Dateiexplorer zum Öffnen Ihrer Datei.

  • Aus Jupyter Notebook öffnet einen Dateiexplorer zum Öffnen Ihrer Datei.

  • Aus URL öffnet ein Feld zur Eingabe eines Dateispeicherorts.

Wählen Sie das Zahnradsymbol aus, um die Anzeigeeinstellungen des Code-Editors zu ändern.

  • Verwenden Sie die Schaltflächen Textgröße zum Vergrößern oder Verkleinern des Texts im Editor.

  • Verwenden Sie Farbschema zum Umschalten zwischen einem dunklen und einem hellen Farbschema.

  • Wählen Sie Lange Zeilen umbrechen aus, damit lange Zeilen im Code-Editor-Fenster ohne horizontales Scrollen sichtbar bleiben.

  • Wählen Sie Zeilennummern anzeigen aus, um die Zeilennummern im Editor zu sehen.

Ausgabe-Metainfo

Wählen Sie die zu verwaltende Ausgabekanal-Metainfo. Ändern Sie manuell den Apache-Spark-Datentyp bestehender Daten.

Wählen Sie das Plus-Symbol zum Hinzufügen einer Datenzeile aus.

  • Geben Sie den Feldnamen ein.

  • Wählen Sie den Apache-Spark-Datentyp aus.

  • Geben Sie die Größe in Bits ein.