Fluxo de trabalho de exemplo
A ferramenta Análise de Associação tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.
Use a ferramenta Análise de Associação para determinar quais campos em um banco de dados têm uma associação bivariada entre si. A avaliação pode se basear nos coeficientes de correlação produto-momento de Pearson (“regular”),* nos coeficientes de correlação posto-classificação de Spearman,** ou na estatística D de Hoeffding*** (um teste não paramétrico que pode encontrar relações não monotônicas, como as formas de U invertido). Além disso, a significância estatística de cada medida de associação é determinada.
A ferramenta sempre fornece o conjunto completo de relações e, opcionalmente, pode fornecer uma análise aprofundada de um campo-alvo de interesse e sua relação com outras variáveis numéricas. O campo-alvo de interesse pode ser uma variável numérica ou uma variável categórica binária. Se uma variável categórica binária for usada como campo-alvo, ela será convertida em um campo numérico zero-um com o valor um imputado nos casos em que o campo tiver um nível que corresponda a um nível-alvo. Caso contrário, um valor zero será imputado.
Nota
Essa ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no Portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Visite Baixar e utilizar ferramentas preditivas.
Direcionar um campo para uma análise mais detalhada: isso permite que você execute uma análise mais focada de um campo de interesse e de outros campos nos dados. Isso é particularmente útil se o objetivo da análise é determinar o conjunto de campos a ser usado em um modelo preditivo subsequente. Se essa opção for selecionada, será necessário fornecer o nome do campo-alvo, que pode ser numérico ou categórico binário. Se o campo for categórico binário, selecione o valor desse campo que será recodificado como um, com o outro valor sendo codificado como zero. Se o campo fornecido for categórico e contiver mais de dois valores diferentes, será retornado um erro. As colunas que contêm identificadores exclusivos, como chaves primárias alternativas e chaves primárias naturais, não devem ser usadas em análises estatísticas. Elas não têm nenhum valor preditivo e podem causar exceções de tempo de execução.
Campos (selecione dois ou mais): selecione os campos para a análise de associação. Se um campo "alvo" for selecionado, ele será automaticamente incluído nessa lista. Os campos não-alvo devem ser numéricos.
Medida de associação: selecione uma entre...
Âncora R: a saída do relatório inclui três tabelas que compõem uma análise da correlação de Pearson:
Análise focada de transições de campo
Matriz de correlação completa
Matriz de valores p correspondentes
Âncora I: o relatório interativo inclui uma matriz de correlação com gráfico de dispersão que muda com base na posição do mouse.