Exemple d'outil unique
L'outil Récapitulatif des champs dispose d'un exemple d'outil unique. Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.
Utilisez l'outil Récapitulatif des champs pour analyser les données et créer un rapport récapitulatif contenant les statistiques descriptives des données dans les colonnes sélectionnées. Son utilisation permet de tirer parti des données et de recevoir des recommandations pour la gestion des données.
Les données numériques, de type chaîne, géographiques et de date/heure sont prises en charge dans cet outil. Un ensemble unique de statistiques descriptives est indiqué pour chaque type de données. Consultez Types de données pour plus d'informations sur les types de données.
Sélectionner les champs à résumer : cochez la case associée aux champs (colonnes) pour lesquels vous souhaitez générer des informations récapitulatives.
Échantillonner les données d'entrée : cochez cette case pour prélever un échantillon d'enregistrements aléatoire. Cette action permet de réduire la durée d'exécution de votre workflow si vous disposez d'un jeu de données volumineux. Chaque fois que vous exécutez votre workflow, un échantillon de données différent est affiché. Vous disposez de 2 options d'échantillonnage :
Nenregistrements aléatoires : indiquez le nombre d'enregistrements que vous souhaitez échantillonner de manière aléatoire.
N% d'enregistrements aléatoires : indiquez le pourcentage d'enregistrements que vous souhaitez échantillonner de manière aléatoire.
L'outil Récapitulatif des champs a 3 sorties :
Ancrage O : flux de données Alteryx avec des statistiques descriptives pour les colonnes sélectionnées, ainsi que des recommandations, dans la colonne Remarques, pour la gestion des données.
Ancrage R : rapport statique avec un nuage de points et des statistiques descriptives pour les colonnes sélectionnées, ainsi que des recommandations (voir Remarques) pour la gestion des données d'une colonne. Pour afficher le rapport, ajoutez un outil Explorateur, puis connectez-le à la sortie R. Voir Outil Explorateur.
Ancrage I : tableau de bord interactif composé de volets déroulants pour chaque colonne. Pour afficher le rapport, ajoutez un outil Explorateur, puis connectez-le à la sortie I. Consultez Outil Explorateur pour plus d'informations. Chaque volet inclut un histogramme ou un graphique en colonnes, ainsi que des statistiques récapitulatives.
Survolez un volet avec le pointeur de la souris pour afficher des icônes supplémentaires.
Sélectionnez l'icône Informations pour afficher des informations supplémentaires.
Sélectionnez l'icône Développer pour ouvrir le rapport dans une vue détaillée.
Survolez une barre du graphique avec le pointeur de la souris pour afficher les détails.
Sélectionnez la variable à afficher pour mettre l'accent sur un petit ensemble de colonnes.
Triez les volets par ordre alphabétique ou par pourcentage de valeurs manquantes.
Les statistiques descriptives disponibles dans la sortie varient selon le type de données contenues dans les colonnes sélectionnées pour l’analyse. Les résultats sont affichés horizontalement. Faites défiler l’écran de gauche à droite pour parcourir les statistiques relatives à chaque type de données.
Si une colonne contient des valeurs numériques, les statistiques suivantes sont fournies :
Min : valeur minimum parmi les données.
Max : valeur maximum parmi les données.
Médiane : valeur médiane des données.
Écart type : mesure de la dispersion des valeurs dans les données.
Pourcentage de valeurs manquantes : pourcentage des valeurs nulles parmi les données.
Valeurs uniques : nombre de valeurs uniques parmi les données.
Moyenne : moyenne des données.
Mise en page : ajoutez un outil Explorateur, puis connectez-le à la sortie R pour afficher les statistiques dans un format visuel. Voir Outil Explorateur.
Remarques : recommandations pour la gestion des données, si celles-ci sont disponibles.
Si une colonne contient des données de type chaîne, les statistiques suivantes sont fournies :
Pourcentage de valeurs manquantes : pourcentage des valeurs nulles parmi les données.
Valeurs uniques : nombre de valeurs uniques parmi les données.
Plus courte valeur : valeur de type chaîne la plus courte (en longueur) parmi les données.
Plus longue valeur : valeur de type chaîne la plus longue (en longueur) parmi les données.
Comptage des valeurs minimum : nombre de valeurs égales à la valeur minimum.
Comptage des valeurs maximum : nombre de valeurs égales à la valeur maximum.
Remarques : recommandations pour la gestion des données, si celles-ci sont disponibles.
Si une colonne contient des données géographiques, les statistiques suivantes sont fournies :
Pourcentage de valeurs manquantes : pourcentage des valeurs nulles parmi les données.
Type d'objet : type d'objet géographique (par exemple, Point ou Polygone) dans les données.
Surface moyenne (miles carrés) : surface moyenne, en miles carrés, des valeurs dans les données.
Longueur moyenne (miles) : longueur moyenne, en miles, des valeurs dans les données.
Nombre moyen de points : nombre moyen des valeurs de données qui sont des points.
Remarques : recommandations pour la gestion des données, si celles-ci sont disponibles.
Si une colonne contient des données de type date/heure, les statistiques suivantes sont fournies :
Pourcentage de valeurs manquantes : pourcentage des valeurs nulles parmi les données.
Valeurs uniques : nombre de valeurs uniques parmi les données.
Date au plus tard : date la plus tardive, ou la plus éloignée dans l'avenir, parmi les données.
Date au plus tôt : date la plus proche parmi les données.
Intervalle : intervalle des dates (par exemple, Mensuel) dans les données.
Remarques : recommandations pour la gestion des données, si celles-ci sont disponibles.