Ferramenta Código do Apache Spark

A ferramenta Código do Apache Spark é um editor de código que cria um contexto e executa comandos do Apache Spark diretamente do Alteryx Designer. Essa ferramenta usa a linguagem de programação R.

Para obter informações adicionais, vá para Apache Spark Direct, Apache Spark no Databricks e Apache Spark no Microsoft Azure HDInsight.

Conectar-se ao Apache Spark

Opção 1

Conecte-se diretamente ao cluster do Apache Spark.

Arraste uma ferramenta Connect In-DB ou uma ferramenta Entrada do Fluxo de Dados para a tela.
Clique na seta suspensa Nome da conexão e selecione Gerenciar conexões.

Opção 2

Se preferir, conecte-se diretamente com a ferramenta Código do Apache Spark.

Arraste a ferramenta Código do Apache Spark para a tela.
Em Conexão de dados, clique na seta suspensa Nome da conexão e selecione Gerenciar conexões.

Os dois métodos mostram a janela Gerenciar conexões in-DB. Em Gerenciar conexões in-DB, selecione uma fonte de dados.

Editor de código

Com uma conexão do Apache Spark Direct estabelecida, o Editor de código é ativado. Use Inserir código para gerar funções de modelo no editor de código.

Scala

Importar biblioteca cria um comando de importação.

import package

Ler dados cria uma função readAlteryxData para retornar os dados recebidos como um dataframe Apache SparkSQL.

valdataFrame = readAlteryxData(1)

Gravar dados cria uma função writeAlteryxData para gerar um dataframe Apache SparkSQL.

writeAlteryxData(dataFrame, 1)

Mensagem de log cria uma função logAlteryxMessage para gravar uma cadeia de caracteres (string) no log como uma mensagem.

logAlteryxMessage("Example message")

Aviso de log cria uma função logAlteryxWarning para gravar uma cadeia de caracteres (string) no log como um aviso.

logAlteryxWarning("Example warning")

Erro de log cria uma função logAlteryxError para gravar uma cadeia de caracteres (string) no log como um erro.

logAlteryxError("Example error")

Python

Importar biblioteca cria um comando de importação.

from module import library (de módulo importar biblioteca)

Ler dados cria uma função readAlteryxData para retornar os dados recebidos como um dataframe Apache SparkSQL.

dataFrame= readAlteryxData(1)

Gravar dados cria uma função writeAlteryxData para gerar um dataframe Apache SparkSQL.

writeAlteryxData(dataFrame, 1)

Mensagem de log cria uma função logAlteryxMessage para gravar uma cadeia de caracteres (string) no log como uma mensagem.

logAlteryxMessage("Example message")

Aviso de log cria uma função logAlteryxWarning para gravar uma cadeia de caracteres (string) no log como um aviso.

logAlteryxWarning("Example warning")

Erro de log cria uma função logAlteryxError para gravar uma cadeia de caracteres (string) no log como um erro.

logAlteryxError("Example error")

R

Importar biblioteca cria um comando de importação.

library(jsonlite)

Ler dados cria uma função readAlteryxData para retornar os dados recebidos como um dataframe Apache SparkSQL.

dataFrame<- readAlteryxData(1)

Gravar dados cria uma função writeAlteryxData para gerar um dataframe Apache SparkSQL.

writeAlteryxData(dataFrame, 1)

Mensagem de log cria uma função logAlteryxMessage para gravar uma cadeia de caracteres (string) no log como uma mensagem.

logAlteryxMessage("Example message")

Aviso de log cria uma função logAlteryxWarning para gravar uma cadeia de caracteres (string) no log como um aviso.

logAlteryxWarning("Example warning")

Erro de log cria uma função logAlteryxError para gravar uma cadeia de caracteres (string) no log como um erro.

logAlteryxError("Example error")

Importar código (import code)

Use Importar código para coletar o código criado externamente.

Do arquivo abre um Explorador de arquivos para procurar seu arquivo.
Do Jupyter Notebook abre um Explorador de arquivos para procurar seu arquivo.
Do URL exibe um campo para digitar ou colar o local de um arquivo.

Selecione o ícone de engrenagem para alterar aspectos estéticos do editor de código.

Use os botões de Tamanho do texto para aumentar ou diminuir o tamanho do texto no editor.
Use o Tema de cores para alternar entre o esquema de cores escuro e claro.
Selecione Quebrar linhas longas faz com que as linhas longas se mantenham visíveis dentro da janela do editor de código em vez de exigir a rolagem horizontal.
Selecione Mostrar números das linhas para ver os números de linha do editor.

Metainformações de saída

Selecione as metainformações do canal de saída que deseja gerenciar. Altere manualmente os Tipos de dados do Apache Spark existentes.

Selecione o ícone de mais para adicionar uma linha de dados.

Insira o Nome do campo.
Selecione os Tipos de dados do Apache Spark.
Insira o Tamanho em bits.

Ferramenta Código do Apache Spark

Conectar-se ao Apache Spark

Opção 1

Opção 2

Editor de código

Scala

Python

R

Importar código (import code)

Metainformações de saída

Resultados da procura