Skip to main content

Gamma Regression Tool Icon Ferramenta Regressão Gama

Fluxo de trabalho de exemplo

A ferramenta Regressão Gama tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.

A ferramenta Regressão Gama relaciona uma variável de interesse com distribuição gama e estritamente positiva (variável-alvo) a uma ou mais variáveis (variáveis preditoras) que podem ter influência sobre a variável-alvo.

Em diversas aplicações, os valores da variável-alvo são sempre estritamente positivos (ou seja, nunca são zero ou negativos), mas tendem a se agrupar em direção à faixa inferior dos valores observados. No entanto, em uma pequena minoria de casos, assumem valores grandes. Variáveis-alvo dessa natureza representam um processo de geração de dados que não é consistente com as suposições de normalidade inerentes ao modelo de regressão linear tradicional. Entretanto, os valores são sempre positivos e nem sempre serão números inteiros, dessa forma, eles não seguem um processo baseado em distribuição de Poisson ou distribuição binomial negativa. Eles são consistentes com um processo baseado em uma distribuição gama e podem ser estimados usando métodos semelhantes à regressão linear, por meio da estrutura de modelo linear generalizado.

Com essa ferramenta, se os dados de entrada vierem de um fluxo de dados regular do Alteryx, será usada a função open-source GLM do R para o treinamento do modelo. Se a entrada vier de uma ferramenta Entrada XDF ou de Saída XDF, será usada a função Revo ScaleR rxGlm para o treinamento do modelo. A vantagem de usar a função baseada em Revo ScaleR é que, com ela, é possível analisar conjuntos de dados muito maiores, mas ela tem custos extras para criar um arquivo XDF, e não cria algumas das saídas de diagnóstico do modelo que estão disponíveis com as funções open-source do R.

Essa ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Visite Baixar e utilizar ferramentas preditivas.

Conectar uma Entrada

Um fluxo de dados do Alteryx ou fluxo de metadados XDF que inclui um campo-alvo de interesse juntamente com um ou mais campos possíveis campos preditores.

Configurar a Ferramenta

Use a guia Configuração para definir os controles para sua ferramenta Regressão Gama.

  • Nome do modelo: cada modelo precisa de um nome para que possa ser identificado mais tarde. Os nomes de modelo devem começar com uma letra e podem conter letras, números e os caracteres especiais ponto (".") e sublinhado ("_"). Nenhum outro caractere especial é permitido, e a ferramenta R diferencia maiúsculas de minúsculas.

  • Selecione a variável-alvo: selecione o campo do fluxo de dados que você deseja prever.

  • Selecione as variáveis preditoras: escolha os campos do fluxo de dados que você pressupõe causem alterações no valor da variável-alvo. Colunas que contêm identificadores exclusivos, como chaves primárias alternativas e chaves primárias naturais, não devem ser usadas em análises estatísticas. Elas não têm nenhum valor preditivo e podem causar exceções de tempo de execução.

  • Tipo de modelo: uma caixa suspensa com as opções "log", "inverso" e "identidade". Essa opção determina a função de ligação usada com a família Gama no treinamento do modelo linear generalizado.

  • Usar pesos de amostragem no treinamento do modelo?(Opcional)...: marque a caixa de seleção e selecione um campo de peso do fluxo de dados para treinar o modelo.

Use a guia Opções de gráfico para definir os controles para o gráfico de saída.

  • Resolução do gráfico: selecione a resolução do gráfico em pontos por polegada: 1x (96 dpi), 2x (192 dpi) ou 3x (288 dpi).

    • Resoluções mais baixas geram um arquivo menor, melhor para visualização em um monitor.

    • Resoluções mais altas geram um arquivo maior e com melhor qualidade de impressão.

Visualizar a Saída

  • Âncora O: consiste em uma tabela do modelo serializado com o nome correspondente.

  • Âncora R: consiste em fragmentos de relatório gerados pela ferramenta Regressão Gama: um resumo estatístico, uma análise de desvio do tipo II (ANOD) e gráficos de diagnóstico básicos. A tabela de análise de desvio do tipo II e os gráficos de diagnóstico básicos não são gerados quando a entrada do modelo vem de uma ferramenta Saída XDF ou Entrada XDF.