Skip to main content

Visão geral do processamento em banco de dados

O processamento em banco de dados (in-DB) permite a combinação e a análise de grandes conjuntos de dados sem a necessidade de extrair os dados de um banco, o que possibilita melhorias de desempenho significativas em relação aos métodos tradicionais de análise que necessitam que os dados sejam movidos para um ambiente separado a fim de que sejam processados.

A execução da análise no banco de dados pode economizar tempo de processamento. Utilizando o Designer como interface, os fluxos de trabalho in-DB integram-se facilmente com os fluxos padrão para mais recursos de análise e combinação de dados.

Limitações

Objetos geográficos não são compatíveis no momento com as ferramentas da categoria No Banco de Dados.

Se você tiver múltiplas instâncias abertas do mesmo fluxo de trabalho, alterar uma delas e executar todas, pode ocorrer um comportamento inesperado. Feche todas as versões do mesmo fluxo de trabalho antes de alterá-lo.

Bancos de dados compatíveis

Suporte ao driver

  • O processamento in-DB requer o Alteryx de 64 bits com drivers de banco de dados de 64 bits.

  • Para executar fluxos de trabalho no Alteryx Server, o driver ODBC deve ser configurado como um DSN do sistema. Para o processamento in-DB, o tipo de conexão deve ser "Sistema", além da conexão ODBC ser configurada como um DSN do sistema.

Acesse Fontes de dados e formatos de arquivo compatíveis para obter a lista completa de plataformas com suporte pela Alteryx.

Ferramentas in-DB

Revise as listas abaixo das ferramentas capazes de processamento em banco de dados.

Boosted Model Tool Icon
Decision Tree Tool Icon
Forest Model Tool Icon
Linear Regression Tool Icon
Logistic Regression Icon
Score Tool

Alterar versão da ferramenta

Quando uma ferramenta preditiva compatível com o processamento em banco de dados é colocada na tela com uma ferramenta da categoria No Banco de Dados, a ferramenta preditiva muda automaticamente para sua versão in-DB. Para mudar a versão da ferramenta manualmente…

  1. Clique sobre ela com o botão direito do mouse.

  2. Selecione Escolher versão da ferramenta .

  3. Selecione uma versão diferente da ferramenta.

Acesse Análise preditiva para obter mais informações sobre suporte à análise preditiva no banco de dados.

Âncoras e conexões de ferramentas com processamento in-DB

Como o processamento de fluxos de trabalho in-DB ocorre dentro do banco de dados, as ferramentas in-DB não são compatíveis com as ferramentas padrão do Alteryx. Vários indicadores visuais mostram a compatibilidade da conexão.

Visualization of Standard tool connection.

As ferramentas padrão usam uma âncora de seta verde para se conectar a outra ferramenta. A conexão é exibida como uma única linha.

Visualization of In-Database tool connection.

As ferramentas in-DB usam uma âncora de quadrado azul para se conectar a outra ferramenta in-DB. A conexão entre duas ferramentas in-DB é exibida como uma linha dupla. Devido à natureza do processamento em banco de dados, o progresso da conexão não é exibido.

Para conectar ferramentas padrão a ferramentas in-DB, use as ferramentas Entrada Dinâmica In-DB e Saída Dinâmica in-DB ou as ferramentas Entrada do Fluxo de Dados e Saída do Fluxo de Dados.

Como funciona o processamento em banco de dados

Os dados são transmitidos para dentro e para fora de um fluxo de trabalho in-DB usando as ferramentas Entrada do Fluxo de Dados e Saída do Fluxo de Dados ou conectando-se diretamente a um banco de dados usando a ferramenta Conectar In-DB . As ferramentas Entrada do Fluxo de Dados e Saída do Fluxo de Dados tem uma âncora in-DB para se conectar a ferramentas in-DB  e uma âncora padrão para se conectar a ferramentas padrão.

Chart showing many different connections

Como funciona

  1. Defina a conexão com o banco de dados usando a ferramenta Conectar In-DB ou use a ferramenta Entrada do Fluxo de Dados para transmitir dados de um fluxo de trabalho padrão para uma tabela temporária dentro do banco de dados.

  2. Conecte outras ferramentas in-DB ao fluxo de trabalho para processar os dados.

  3. Use a ferramenta Gravar Dados In-DB para criar ou atualizar uma tabela no banco de dados ou use a ferramenta Saída do Fluxo de Dados para transmitir os resultados in-DB para um fluxo de trabalho para processamento padrão.

  4. Execute o fluxo de trabalho para processar os dados na plataforma. Nenhum resultado será retornado ao Alteryx Engine até que o fluxo de trabalho completo seja processado no banco de dados.

Benefícios do processamento in-DB para o desempenho

O processamento do fluxo de trabalho pode demorar mais quando uma grande quantidade de dados é transmitida para dentro e para fora de um banco de dados. Você pode usar o processamento in-DB para acelerar um fluxo de trabalho.

Por exemplo, em um fluxo de trabalho padrão, uma tabela de banco de dados grande é puxada para a memória para ser combinada a uma planilha pequena. A maior parte do tempo de execução é gasto na transmissão dos registros do banco de dados. Em um fluxo de trabalho in-DB, a pequena planilha é transmitida para o banco de dados, reduzindo substancialmente o tempo de execução.

Perguntas frequentes

São necessários privilégios de leitura para acessar o banco de dados subjacente.

São necessários privilégios de gravação para criar uma tabela no banco de dados.

As tabelas temporárias são excluídas no final da execução. Se o Alteryx travar enquanto a ferramenta Entrada do Fluxo de Dados estiver sendo executada, na próxima vez que um fluxo de trabalho in-DB for executado, todos os arquivos temporários criados pelo Alteryx no banco de dados nos três dias anteriores serão excluídos.

Para permitir a visibilidade de uma tabela temporária entre as sessões, o Alteryx deve criar uma tabela permanente que é excluída no final da execução de um fluxo de trabalho. É necessário ter permissões de criação (CREATE) para transmitir e gravar dados em um banco de dados. A exceção é o Microsoft SQL Server.

As regras subjacentes são mantidas durante o processo, da mesma forma que acontece com as conexões de banco de dados por meio das ferramentas padrão Dados de Entrada e Dados de Saída. Se houver um tempo limite do banco de dados ou se houver um limite para o número de consultas que podem ser executadas por dia, isso afetará sua conexão.

Uma instrução SELECT é acionada pela ferramenta Conectar In-DB e consultas adicionais são criadas por ferramentas em etapas posteriores e aninhadas nessa consulta. A adição de uma das três ferramentas a seguir completa a consulta e a envia ao banco de dados subjacente: Gravar In-DB, Saída do Fluxo de Dados, Navegar In-DB.

Você pode inserir sua própria instrução SQL na caixa "Consulta" da ferramenta Conectar In-DB, que também é incorporada à instrução SELECT.

A consulta SQL para o banco de dados subjacente é acionada no momento da execução para cada ferramenta Navegar In-DB, Saída do Fluxo de Dados ou Gravar Dados In-DB.

A ferramenta Navegar In-DB pode ser configurada para armazenar os dados em cache como um arquivo .yxdb quando o fluxo de trabalho é executado.

Depois de os dados serem armazenados em cache, se o fluxo de trabalho for executado novamente e a conexão ou consulta ao banco de dados não tiver sido alterada (incluindo o número de registros a serem navegados), a consulta não será executada novamente. Em vez disso, os dados serão extraídos do cache.

Uma mensagem de saída indica se os dados foram ou não armazenados em cache. Clique no link para abrir os resultados como um arquivo .yxdb em uma janela separada.

O cache in-DB é usado sempre que um fluxo de trabalho é executado novamente sem alterações nas ferramentas de etapas anteriores. Fazer uma alteração em qualquer ferramenta de etapas anteriores acionará uma nova consulta e um novo cache será criado.

Não, a opção "Navegar pelos primeiros [100] registros" limita apenas o número de registros exibidos na ferramenta Navegar In-DB. Outras ferramentas no fluxo de trabalho processarão o número real de registros que passam por qualquer ponto específico.

O campo tem o tipo de dados CLOB/LOB e não funcionará com a maioria dos operadores de comparação nas ferramentas Filtrar ou Fórmula. O erro reflete que nenhuma coluna é retornada, mesmo quando os dados correspondem à comparação. Esse é o comportamento esperado com SQL e Oracle, pois eles não oferecem suporte a comparações com dados LOB.