Fluxo de trabalho de exemplo
A ferramenta Gráfico de Dispersão tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.
Use a ferramenta Gráfico de Dispersão para criar gráficos de dispersão avançados, com opções para incluir diagramas de caixa nas margens, uma linha de regressão linear, uma curva suave via regressão não paramétrica, uma propagação condicional suavizada, identificação de atípicos (outliers) e uma linha de regressão.
A curva suave pode ajudar os usuários a visualizar melhor a natureza da relação entre duas variáveis em comparação com um gráfico de dispersão tradicional, particularmente em casos com muitas observações ou um alto nível de dispersão dos dados.
Essa ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no Portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Visite Baixar e utilizar ferramentas preditivas.
Use a guia Configuração para definir os controles obrigatórios para o gráfico de dispersão.
Campo X (horizontal): o campo (coluna) a ser usado no eixo horizontal do gráfico. A escolha é limitada a campos numéricos.
Campo Y (vertical): o campo (coluna) a ser usado no eixo vertical do gráfico. Pode ser usado um campo numérico ou um campo categórico binário. Se for selecionado um campo categórico binário, um novo campo (com o sufixo ".num" adicionado ao nome do campo original) será criado com valores numéricos de zero ou um. Se uma variável categórica com mais de dois valores for selecionada, o nó retornará um erro.
O campo Y é uma variável categórica binária: uma caixa de seleção para indicar que o campo Y é uma variável categórica binária. Quando marcada, você deve indicar o valor do campo que corresponderá a um valor um (o "alvo"), com entradas com o outro valor do campo assumindo o valor zero.
Use a guia Elementos do gráfico para definir as regras de como os dados são plotados.
Linha (de regressão) de mínimos quadrados: exibe uma linha de regressão linear simples entre os campos X e Y. Incluído por padrão.
Linha suave: exibe uma linha não linear entre os campos X e Y, criada usando um loess (modelo de regressão local não paramétrica). Incluído por padrão.
Ampliar para suavizar: um parâmetro que controla o tamanho da área local usada para construir as estimativas de loess. Quanto menor o número, menor a área usada.
Mostrar espalhamento: duas curvas que mostram os resultados dos modelos loess para os resíduos positivos e negativos da raiz do erro quadrático da linha loess original para exibir dispersão condicional e assimetria nos erros. Incluído por padrão.
Diagramas de caixa marginais: isso inclui diagramas de caixa univariados dos campos X e Y ao longo de cada eixo respectivo. São úteis para avaliar a distribuição de valores para ambos os campos, e eles são incluídos por padrão.
Adicionar ruído (jitter) ao eixo X: quando selecionado, os valores de X oscilam aleatoriamente em pequenas quantidades. Isso é útil se um número maior de registros no campo X assumir um ou um pequeno número de valores. Afeta apenas a aparência dos pontos nos gráficos, mas afeta não as linhas de regressão ajustadas e de loess.
Adicionar ruído (jitter) ao eixo Y: quando selecionado, os valores de Y oscilam aleatoriamente em pequenas quantidades. Isso é útil se um número maior de registros no campo Y assumir um ou um pequeno número de valores. Afeta apenas a aparência dos pontos nos gráficos, mas não afeta as linhas de regressão ajustadas e de loess.
Transformação logarítmica do eixo X: se selecionado, uma transformação logarítmica natural é aplicada aos valores X. Isso é geralmente útil para explorar certos tipos de relações não lineares.
Transformação logarítmica do eixo Y: se selecionado, uma transformação logarítmica natural é aplicada aos valores Y. Isso é geralmente útil para explorar certos tipos de relações não lineares.
Plotar gráfico por grupos: esta opção permite examinar o efeito de um campo categórico na relação entre os campos X e Y, com cada valor do categórico resultando em um grupo de valores X e Y. Os grupos são plotados com cores e caracteres de plotagem diferentes. Se essa opção for selecionada, você deverá fornecer o campo categórico a ser usado na criação dos grupos, (opcionalmente) se desejar que as curvas de regressão e de loess sejam plotadas para cada grupo, e fornecer a localização da legenda que identifica os diferentes grupos.
Use a guia Opções de estilo para definir os controles de gráfico, como rótulos e escala.
Rótulo do eixo X (opcional): um rótulo opcional para o eixo X (horizontal). Por padrão, o nome do campo X é usado.
Rótulo do eixo Y (opcional): um rótulo opcional para o eixo Y (vertical). Por padrão, o nome do campo Y é usado.
Escala de tamanho de ponto: controla o tamanho dos pontos dentro do visor, com valores maiores resultando em pontos maiores.
Escala de tamanho do texto nos eixos: controla o tamanho dos números e marcas de escala ao longo de cada eixo, com valores maiores resultando em texto maior.
Escala do tamanho do texto nos rótulos do eixo: controla o tamanho do texto do rótulo ao longo de cada eixo, com valores maiores resultando em texto maior.
Escala do tamanho do texto no título principal: controla o tamanho do texto do título principal, com valores maiores resultando em texto maior.
Use a guia Opções de gráfico para definir os controles para o gráfico de saída.
Tamanho do gráfico: selecione polegadas ou centímetros e especifique a largura e altura para o tamanho do gráfico.
Resolução do gráfico: selecione a resolução do gráfico em pontos por polegada: 1x (96 dpi), 2x (192 dpi) ou 3x (288 dpi).
Resoluções mais baixas geram um arquivo menor que é melhor para visualização em um monitor.
Resoluções mais altas geram um arquivo maior e com melhor qualidade de impressão.
Tamanho da fonte base (pontos): selecione o tamanho da fonte para o gráfico.
Gera um objeto gráfico R do Alteryx que pode ser usado para ajudar na criação de relatórios personalizados.