Herramienta Código de Apache Spark

La herramienta Código de Apache Spark es un editor de código que crea un contexto de Apache Spark y ejecuta comandos de Apache Spark directamente desde Alteryx Designer. Esta herramienta usa el lenguaje de programación R.

Para obtener más información, ve a Apache Spark Direct, Apache Spark en Databricks y Apache Spark en Microsoft Azure HDInsight.

Conéctate a Apache Spark

Opción 1

Conéctate directamente a tu clúster de Apache Spark.

Arrastra una herramienta Conexión En-BD o una herramienta Entrada de flujo de datos en el lienzo.
Selecciona la flecha desplegable Nombre de conexión y, luego, selecciona Administrar conexiones.

Opción 2

De forma alternativa, conéctate directamente con la herramienta Código de Apache Spark.

Arrastra la herramienta Código de Apache Spark al lienzo.
En Conexión de datos, selecciona la flecha desplegable Nombre de conexión: y selecciona Administrar conexiones.

Ambos métodos muestran la ventana Administrar conexiones En-BD. En Administrar conexiones En-BD, selecciona una fuente de datos.

Editor de códigos

Con una conexión de Apache Spark Direct establecida, el Editor de códigos se activa. Usa Insertar código para generar funciones de plantilla en el editor de códigos.

Scala

Importar biblioteca crea una instrucción de importación.

import package (importar paquete)

Leer datos crea una función readAlteryxData para devolver los datos entrantes como un DataFrame de Apache SparkSQL.

valdataFrame = readAlteryxData(1)

Escribir datos crea una función writeAlteryxData para generar un DataFrame de Apache SparkSQL.

writeAlteryxData(dataFrame, 1)

Mensaje del archivo de registro crea una función logAlteryxMessage para escribir una cadena en el registro como un mensaje.

logAlteryxMessage("Example message")

Advertencia del archivo de registro crea una función logAlteryxWarning para escribir una cadena en el registro como una advertencia.

logAlteryxWarning("Example warning")

Error del archivo de registro crea una función logAlteryxError para escribir una cadena en el registro como un error.

logAlteryxError("Example error")

Python

Importar biblioteca crea una instrucción de importación.

from module import library (desde el módulo importar biblioteca)

Leer datos crea una función readAlteryxData para devolver los datos entrantes como un DataFrame de Apache SparkSQL.

dataFrame= readAlteryxData(1)

Escribir datos crea una función writeAlteryxData para generar un DataFrame de Apache SparkSQL.

writeAlteryxData(dataFrame, 1)

Mensaje del archivo de registro crea una función logAlteryxMessage para escribir una cadena en el registro como un mensaje.

logAlteryxMessage("Example message")

Advertencia del archivo de registro crea una función logAlteryxWarning para escribir una cadena en el registro como una advertencia.

logAlteryxWarning("Example warning")

Error del archivo de registro crea una función logAlteryxError para escribir una cadena en el registro como un error.

logAlteryxError("Example error")

R

Importar biblioteca crea una instrucción de importación.

library(jsonlite)

Leer datos crea una función readAlteryxData para devolver los datos entrantes como un DataFrame de Apache SparkSQL.

dataFrame<- readAlteryxData(1)

Escribir datos crea una función writeAlteryxData para generar un DataFrame de Apache SparkSQL.

writeAlteryxData(dataFrame, 1)

Mensaje del archivo de registro crea una función logAlteryxMessage para escribir una cadena en el registro como un mensaje.

logAlteryxMessage("Example message")

Advertencia del archivo de registro crea una función logAlteryxWarning para escribir una cadena en el registro como una advertencia.

logAlteryxWarning("Example warning")

Error del archivo de registro crea una función logAlteryxError para escribir una cadena en el registro como un error.

logAlteryxError("Example error")

Importar código

Utiliza Importar código para extraer el código creado externamente.

Desde archivo abre un explorador de archivos para navegar a tu archivo.
Desde Jupyter Notebook abre un explorador de archivos para navegar a tu archivo.
Desde la URL proporciona un campo para escribir o pegar una ubicación de archivo.

Selecciona el ícono de engranaje para cambiar los aspectos cosméticos del editor de código.

Usa los botones Tamaño del texto para aumentar o disminuir el tamaño del texto en el editor.
Usa Tema de colores para alternar entre un esquema de color oscuro y claro.
Seleccionar Ajustar líneas largas hace que las líneas largas permanezcan visibles dentro de la ventana del editor de código, en lugar de requerir un desplazamiento horizontal.
Selecciona Mostrar números de línea para ver los números de línea del editor.

Metainformación de la salida

Selecciona la metainformación del canal de salida que deseas administrar. Cambia manualmente el Apache Spark Data Type (Tipo de dato de Apache Spark) de los datos existentes.

Selecciona el ícono de más para agregar una fila.

Ingresa el Field Name (Nombre del campo).
Selecciona el Apache Spark Data Type (Tipo de dato de Apache Spark).
Introduce el Size (Tamaño) en bits.

Herramienta Código de Apache Spark

Conéctate a Apache Spark

Opción 1

Opción 2

Editor de códigos

Scala

Python

R

Importar código

Metainformación de la salida

Resultados de la búsqueda