Skip to main content

Pearson Correlation Tool Icon Outil Corrélation de Pearson

Exemple d'outil unique

L'outil Corrélation de Pearson dispose d'un exemple d'outil unique. Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.

Utilisez l'outil Corrélation de Pearson pour mesurer la corrélation entre 2 variables.

L’outil Corrélation de Pearson utilise le coefficient de corrélation produit-moment de Pearson (parfois appelé « PMCC », et généralement désigné par r) pour mesurer la corrélation (dépendance linéaire) entre deux variables X et Y, fournissant une valeur comprise entre +1 et −1 inclus. Il est couramment utilisé dans le domaine des sciences pour mesurer la force de la dépendance linéaire entre deux variables.*

La corrélation (souvent mesurée sous la forme du coefficient de corrélation ρ) indique la force et la direction d’une relation linéaire entre deux variables aléatoires. Les valeurs de corrélation vont de –1.00 (corrélation négative parfaite) à +1.00 (corrélation positive parfaite). La valeur zéro indique l’absence de corrélation.

Le coefficient de Pearson est obtenu en divisant la covariance des deux variables par le produit de leur écart-type.*

Configuration de l'outil

  • Générer la corrélation pour les variables sélectionnées : sélectionnez dans le flux d'entrée deux champs (colonnes) ou plus sur lesquels exécuter la corrélation. Les champs doivent être numériques. Les colonnes contenant des identifiants uniques, tels que les clés primaires de substitution et les clés primaires naturelles, ne doivent pas être utilisées dans les analyses statistiques. Elles ne comportent pas de valeur prédictive et peuvent entraîner des exceptions lors de l'exécution.

  • Spécifiez le type de calcul à exécuter :

    • Calculer la corrélation : mesure la corrélation de Pearson.

    • Calculer la covariance : mesure la covariance entre différents champs. Le type de covariance est « Covariance d'échantillon », qui correspond à la formule statistique Excel « COVARIANCE.S ».

L’outil Coefficient de corrélation de Pearson attend des valeurs non-Null. Si vos données contiennent des valeurs nulles, il peut être utile d'utiliser l'outil Imputation pour remplacer d'abord les valeurs nulles.

*http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient