Skip to main content

Magnifying glass over a rain drop and umbrella symbol Outil Analyse d'association

Exemple d'outil unique

L'outil Analyse d'association dispose d'un exemple d'outil unique. Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.

Utilisez l'outil Analyse d'association pour identifier les champs d'une base de données qui possèdent une association bivariée entre eux. L’évaluation peut être basée sur les coefficients de corrélation produit-moment de Pearson (« régulier »)*, sur les coefficients de corrélation rang-ordre de Spearman** ou sur les statistiques D d’Hoeffding*** (un test non paramétrique capable de trouver des relations non monotones telles que les formes en U inversées). En outre, le caractère statistiquement significatif de chaque mesure d’association est déterminé.

L'outil fournit toujours l'ensemble complet de relations. Il peut même assurer une analyse approfondie d'un champ cible d'intérêt et de sa relation avec d'autres variables numériques. Le champ cible d’intérêt peut être soit une variable numérique, soit une variable catégorielle binaire. Si une variable catégorielle binaire est utilisée comme champ cible, elle est convertie en champ numérique 0-1, la valeur 1 étant imputée lorsque le champ possède un niveau correspondant à un niveau cible.

Note

Cet outil utilise l'outil R. Accédez à Options > Télécharger les outils prédictifs et connectez-vous au Portail de licences et de téléchargements Alteryx pour installer R et les paquets utilisés par l'outil R. Consultez Télécharger et utiliser les outils prédictifs.

Configuration de l'outil

  1. Cibler un champ pour une analyse plus détaillée : cela vous permet d'exécuter une analyse plus ciblée d'un champ d'intérêt et d'autres champs dans les données. Cette fonction est particulièrement utile lorsque l’analyse a pour but de déterminer le jeu de champs à utiliser dans un modèle prédictif ultérieur. Lorsque cette option est activée, vous devez indiquer le nom du champ cible, qui peut être catégoriel de type numérique ou binaire. Si le champ est catégoriel binaire, vous devez sélectionner sa valeur qui sera réencodée en 1, l'autre valeur étant encodée en 0. Si le champ indiqué est catégoriel et contient plus de deux valeurs différentes, une erreur est générée. Les colonnes contenant des identifiants uniques, tels que les clés primaires de substitution et les clés primaires naturelles, ne doivent pas être utilisées dans les analyses statistiques. Elles ne comportent pas de valeur prédictive et peuvent entraîner des exceptions lors de l'exécution.

  2. Champs (au moins deux) : sélectionnez les champs pour l'analyse d'association. Si un champ « cible » est sélectionné, il est automatiquement inclus dans cette liste. Les champs autres que cibles doivent être numériques.

  3. Mesure d'association : sélectionnez une des...

Visualisation de la sortie

  • Ancrage R : la sortie de rapport inclut 3 tableaux formant une analyse de corrélation de Pearson :

    • Analyse approfondie de Trans de champ

    • Matrice de corrélation complète

    • Matrice des valeurs P correspondantes

  • Ancrage I : un rapport interactif inclut une matrice de corrélation avec un nuage de points qui évolue en fonction de la position de la souris.