Skip to main content

Pearson Correlation Tool Icon Ferramenta Correlação de Pearson

Fluxo de trabalho de exemplo

A ferramenta Correlação de Pearson tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.

Use a ferramenta Correlação de Pearson para medir a correlação entre duas variáveis.

Essa ferramenta usa o coeficiente de correlação produto-momento de Pearson (às vezes referido como PMCC e normalmente denotado por r) para medir a correlação (dependência linear) entre duas variáveis X e Y, fornecendo um valor entre +1 e −1, inclusive. É amplamente utilizado nas ciências como uma medida da força da dependência linear entre duas variáveis.*

A correlação (muitas vezes medida como um coeficiente de correlação, ρ) indica a força e a direção de uma relação linear entre duas variáveis aleatórias. Os valores de correlação variam de –1.00 (uma correlação negativa perfeita) a +1.00 (uma correlação positiva perfeita). Zero indica ausência de correlação.

O coeficiente de Pearson é obtido dividindo-se a covariância das duas variáveis pelo produto de seus desvios padrão.*

Configurar a ferramenta

  • Gerar correlação para variáveis selecionadas: selecione dois ou mais campos (colunas) do fluxo de entrada para executar a correlação. Os campos têm de ser numéricos. As colunas que contêm identificadores exclusivos, como chaves primárias alternativas e chaves primárias naturais, não devem ser usadas em análises estatísticas. Elas não têm nenhum valor preditivo e podem causar exceções de tempo de execução.

  • Especifique o tipo de cálculo a ser executado:

    • Calcular correlação: mede a Correlação de Pearson.

    • Calcular covariância: mede a covariância entre diferentes campos. O tipo de covariância é a "covariância da amostra", que é a mesma fórmula estatística usada no Excel chamada "COVARIAÇÃO.S".

A ferramenta Coeficiente de Correlação de Pearson espera valores não nulos. Se houver nulos (nulls) nos dados, é recomendável usar a ferramenta Imputação para substituir os nulos primeiro.

*https://pt.wikipedia.org/wiki/Coeficiente_de_correlação_de_Pearson