Apache Spark-Code

Das Apache-Spark-Code-Tool ist ein Code-Editor zum Erstellen eines Apache-Spark-Kontexts und zum Ausführen von Apache-Spark-Befehlen direkt über Alteryx Designer. Dieses Tool verwendet die R-Programmiersprache.

Weitere Informationen finden Sie unter Apache Spark Direct #apache-spark-auf-databricks, Apache Spark auf Databricks und Apache Spark auf Microsoft Azure HDInsight.

Verbindung zu Apache Spark

Option 1

Direkt mit Ihrem Apache-Spark-Cluster bestellen.

Ziehen Sie ein In-DB-verbinden-Tool oder Eingehender-Datenstrom-Tool auf den Canvas.
Klicken Sie auf den Dropdown-Pfeil Verbindungsname und wählen Sie Verbindung verwalten aus.

Option 2

Alternativ können Sie eine direkte Verbindung zum Apache-Spark-Code-Tool herstellen.

Ziehen Sie das Apache-Spark-Code-Tool auf den Canvas.
Klicken Sie unter Datenverbindung auf den Dropdown-Pfeil Verbindungsname und wählen Sie Verbindungen verwalten aus.

Bei beiden Methoden wird das Fenster In-DB-Verbindungen verwalten geöffnet. Wählen Sie unter In-DB-Verbindungen verwalten eine Datenquelle aus.

Code Editor

Bei aufgebauter Apache-Spark-Direct-Verbindung wird der Code-Editor aktiviert. Verwenden Sie Code eingeben zum Erstellen von Funktionsvorlagen im Code-Editor.

Skala

Bibliothek importieren erstellt eine Importanweisung.

Paket importieren

Daten lesen erstellt eine readAlteryxData-Funktion, um die eingehenden Daten als Apache SparkSQL DataFrame auszugeben.

WertdataFrame = readAlteryxData(1)

Daten schreiben erstellt eine writeAlteryxData-Funktion zur Ausgabe eines Apache SparkSQL DataFrame.

writeAlteryxData(dataFrame, 1)

Protokollmeldung erstellt eine logAlteryxMessage-Funktion, um eine Zeichenfolge als Meldung im Protokoll aufzuzeichnen.

logAlteryxMessage("Example message")

Protokollwarnung erstellt eine logAlteryxWarning-Funktion, um eine Zeichenfolge als Warnung im Protokoll aufzuzeichnen.

logAlteryxWarning("Example warning")

Protokollfehler erstellt eine logAlteryxError-Funktion, um eine Zeichenfolge als Fehler im Protokoll aufzuzeichnen.

logAlteryxError("Example error")

Python

Bibliothek importieren erstellt eine Importanweisung.

aus Modul Bibliothek importieren

Daten lesen erstellt eine readAlteryxData-Funktion, um die eingehenden Daten als Apache SparkSQL DataFrame auszugeben.

dataFrame= readAlteryxData(1)

Daten schreiben erstellt eine writeAlteryxData-Funktion zur Ausgabe eines Apache SparkSQL DataFrame.

writeAlteryxData(dataFrame, 1)

Protokollmeldung erstellt eine logAlteryxMessage-Funktion, um eine Zeichenfolge als Meldung im Protokoll aufzuzeichnen.

logAlteryxMessage("Example message")

Protokollwarnung erstellt eine logAlteryxWarning-Funktion, um eine Zeichenfolge als Warnung im Protokoll aufzuzeichnen.

logAlteryxWarning("Example warning")

Protokollfehler erstellt eine logAlteryxError-Funktion, um eine Zeichenfolge als Fehler im Protokoll aufzuzeichnen.

logAlteryxError("Example error")

R

Bibliothek importieren erstellt eine Importanweisung.

Bibliothek (jsonlite)

Daten lesen erstellt eine readAlteryxData-Funktion, um die eingehenden Daten als Apache SparkSQL DataFrame auszugeben.

dataFrame<- readAlteryxData(1)

Daten schreiben erstellt eine writeAlteryxData-Funktion zur Ausgabe eines Apache SparkSQL DataFrame.

writeAlteryxData(dataFrame, 1)

Protokollmeldung erstellt eine logAlteryxMessage-Funktion, um eine Zeichenfolge als Meldung im Protokoll aufzuzeichnen.

logAlteryxMessage("Example message")

Protokollwarnung erstellt eine logAlteryxWarning-Funktion, um eine Zeichenfolge als Warnung im Protokoll aufzuzeichnen.

logAlteryxWarning("Example warning")

Protokollfehler erstellt eine logAlteryxError-Funktion, um eine Zeichenfolge als Fehler im Protokoll aufzuzeichnen.

logAlteryxError("Example error")

Code importieren

Verwenden Sie Code Importieren, um einen extern erstellten Code zu übernehmen.

Aus Datei öffnet einen Dateiexplorer zum Öffnen Ihrer Datei.
Aus Jupyter Notebook öffnet einen Dateiexplorer zum Öffnen Ihrer Datei.
Aus URL öffnet ein Feld zur Eingabe eines Dateispeicherorts.

Wählen Sie das Zahnradsymbol aus, um die Anzeigeeinstellungen des Code-Editors zu ändern.

Verwenden Sie die Schaltflächen Textgröße zum Vergrößern oder Verkleinern des Texts im Editor.
Verwenden Sie Farbschema zum Umschalten zwischen einem dunklen und einem hellen Farbschema.
Wählen Sie Lange Zeilen umbrechen aus, damit lange Zeilen im Code-Editor-Fenster ohne horizontales Scrollen sichtbar bleiben.
Wählen Sie Zeilennummern anzeigen aus, um die Zeilennummern im Editor zu sehen.

Ausgabe-Metainfo

Wählen Sie die zu verwaltende Ausgabekanal-Metainfo. Ändern Sie manuell den Apache-Spark-Datentyp bestehender Daten.

Wählen Sie das Plus-Symbol zum Hinzufügen einer Datenzeile aus.

Geben Sie den Feldnamen ein.
Wählen Sie den Apache-Spark-Datentyp aus.
Geben Sie die Größe in Bits ein.

Apache Spark-Code

Verbindung zu Apache Spark

Option 1

Option 2

Code Editor

Skala

Python

R

Code importieren

Ausgabe-Metainfo

Suchresultat