Skip to main content

Scatterplot Tool Icon Outil Nuage de points

Exemple d'outil unique

L'outil Nuage de points dispose d'un exemple d'outil unique. Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.

Utilisez l'outil Nuage de points pour générer des nuages de points avancés, avec la possibilité d'inclure des diagrammes en boîte dans les marges, une ligne de régression linéaire, une courbe lisse via une régression non paramétrique, une diffusion conditionnelle lissée, une identification des valeurs aberrantes et une ligne de régression.

La courbe lisse peut aider les utilisateurs à voir plus facilement la nature de la relation entre deux variables relatives à un nuage de points traditionnel, particulièrement dans les cas où l'on rencontre de nombreuses observations ou un haut niveau de dispersion dans les données.

Cet outil utilise l'outilR. Accédez à Options > Télécharger les outils prédictifs et connectez-vous au Portail de licences et de téléchargements Alteryx pour installer R et les paquets utilisés par l'outil R. Consultez Télécharger et utiliser les outils prédictifs.

Configuration de l'outil

Onglet Configuration

Utilisez l'onglet Configuration pour définir les contrôles obligatoires du nuage de points.

  • Champ X (horizontal) : champ (colonne) à utiliser sur l'axe horizontal du diagramme. Le choix se limite aux champs numériques.

  • Champ Y (vertical) : champ (colonne) à utiliser sur l'axe vertical du diagramme. Un champ numérique ou un champ catégoriel binaire. Si un champ catégoriel binaire est sélectionné, un nouveau champ (avec le suffixe « .num » apposé au nom du champ d'origine) est créé avec des valeurs numériques de zéro ou un. Si une variable catégorielle avec plus de deux valeurs est sélectionnée, le nœud renvoie une erreur.

  • Le champ Y est une variable catégorielle binaire : case à cocher pour indiquer que le champ Y est une variable catégorielle binaire. Lorsque cette option est activée, vous devez indiquer la valeur de champ qui correspond à une valeur de un (la « cible »), les entrées liées à l'autre valeur de champ prenant la valeur zéro.

Onglet Éléments du tracé

Utilisez l'onglet Éléments du tracé pour définir les règles régissant la manière dont les données sont tracées.

  • Ligne des moindres carrés (régression) : affiche une ligne de régression linéaire simple entre les champs X et Y. Élément inclus par défaut.

  • Lisser la ligne : affiche une ligne non linéaire entre les champs X et Y, créée en utilisant un modèle de Loess (régression locale non paramétrique). Élément inclus par défaut.

  • Intervalle pour lissage : paramètre qui détermine la taille de la zone locale utilisée pour construire les estimations de Loess. Plus le nombre est petit, plus la zone utilisée est petite.

  • Afficher la diffusion : deux courbes illustrant les résultats des modèles de Loess à la fois aux résidus positifs et négatifs de la valeur moyenne quadratique à partir de la ligne de Loess d'origine pour afficher la diffusion conditionnelle et l'asymétrie dans les erreurs. Élément inclus par défaut.

  • Diagrammes en boîte dans les marges : comprennent des diagrammes en boîte univariés des champs X et Y le long de chaque axe respectif. Ils sont utiles lorsqu'il s'agit d'évaluer la distribution des valeurs pour les deux champs et sont inclus par défaut.

  • Gigue X : lorsque cet élément est sélectionné, les valeurs X sont perturbées de manière aléatoire par un petit nombre. Ceci est utile si un plus grand nombre d'enregistrements dans le champ X porte sur une valeur ou sur un petit nombre de valeurs. Cet élément n'influe que sur les points d'aspect sur les graphiques, et non sur les lignes de régression et de Loess ajustées.

  • Gigue Y : lorsque cet élément est sélectionné, les valeurs Y sont perturbées de manière aléatoire par un petit nombre. Ceci est utile si un plus grand nombre d'enregistrements dans le champ Y porte sur une valeur ou sur un petit nombre de valeurs. Cet élément n'influe que sur les points d'aspect sur les graphiques, et non sur les lignes de régression et de Loess ajustées.

  • Log axe des X : si cet élément est sélectionné, une transformation des logarithmes naturels est appliquée aux valeurs X. Cela est souvent utile pour explorer certains types de relations non linéaires.

  • Log axe des Y : si cet élément est sélectionné, une transformation des logarithmes naturels est appliquée aux valeurs Y. Cela est souvent utile pour explorer certains types de relations non linéaires.

  • Tracé par groupes : cette option permet d'observer l'effet d'un champ catégoriel sur la relation entre les champs X et Y, avec chaque valeur du champ catégoriel résultant en un groupe de valeurs X et Y. Les groupes sont tracés avec des couleurs et des caractères de traçage différents. Si cette option est sélectionnée, vous êtes invité à indiquer un champ catégoriel à utiliser pour la création des groupes, (facultatif) à spécifier si vous souhaitez tracer des courbes de régression et des courbes de Loess pour chaque groupe, et à déterminer l'emplacement de la légende qui identifie les différents groupes.

Onglet Options de style

Utilisez l'onglet Options de style pour définir les commandes du graphique, telles que les étiquettes et l'échelle.

  • Étiquette de l'axe X (facultatif) : étiquette facultative pour l'axe des X (horizontal). Par défaut, le nom du champ X est utilisé.

  • Étiquette de l'axe Y (facultatif) : étiquette facultative pour l'axe des Y (vertical). Par défaut, le nom du champ Y est utilisé.

  • Échelle de la taille des points : détermine la taille des points au sein de l'affichage, avec des valeurs plus grandes si on choisit une taille de point plus grande.

  • Échelle de la taille du texte de l'axe : détermine la taille des nombres et des marques pointillées le long de chaque axe, avec des valeurs plus grandes si on choisit un texte plus grand.

  • Échelle de la taille du texte des étiquettes de l'axe : détermine la taille de l'étiquette de l'axe le long de chaque axe, avec des valeurs plus grandes si on choisit un texte plus grand.

  • Échelle de la taille du texte du titre principal : détermine la taille du texte du titre principal, avec des valeurs plus grandes si on choisit un texte plus grand.

Onglet Options graphiques

Dans l'onglet Options des graphiques, définissez les contrôles de la sortie graphique.

  • Taille du tracé : sélectionnez comme unité les pouces ou les centimètres et spécifiez la largeur et la hauteur de la taille du graphique.

  • Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 dpi), 2x (192 dpi) ou 3x (288 dpi).

    • Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur.

    • Une résolution élevée produit un fichier de plus grande taille avec une qualité d'impression supérieure.

  • Taille de la police de base (points) : sélectionnez la taille de la police dans le graphique.

Visualisation de la sortie

Génère un objet R-Graph Alteryx pouvant être utilisé pour aider à la création de rapports personnalisés.