Exemple d'outil unique
L'outil Profil de données de base a un exemple d'outil unique. Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.
Utilisez l'outil Profil de données de base pour afficher une vue d'ensemble, ou profil, des données et sortir les informations en vue d'une analyse ultérieure. L’outil Profil de données de base analyse les données et fournit des métadonnées pour chaque colonne (champ) de données. Pour afficher une représentation visuelle du profil de données, outre les métadonnées, utilisez un outil Explorateur.
Renseignez toutes les options de configuration facultatives :
Limite du comptage exact : pour garantir des performances optimales, il est recommandé de sélectionner la limite par défaut. Augmentez la limite pour afficher les informations de profil relatives à davantage de données. Saisissez du texte ou utilisez les boutons haut/bas pour sélectionner le nombre maximum de valeurs uniques qu'Alteryx doit identifier dans les données.
Limite de taille pour renvoyer toutes les valeurs uniques (Caractères) : pour garantir des performances optimales, il est recommandé de sélectionner la limite par défaut. Augmentez la limite pour afficher les informations de profil relatives à davantage de données. Saisissez du texte ou utilisez les boutons haut/bas pour sélectionner le nombre de caractères maximum qu'Alteryx doit vérifier dans une valeur pour déterminer si elle est unique.
Utiliser les unités métriques : sélectionnez cette option pour utiliser les unités métriques. Cette option s’applique uniquement aux données géographiques.
Les informations de profil des données affichées dans la fenêtre Résultats varient selon le type de données provenant de l'outil connecté. Consultez Types de données pour obtenir la liste des types de données.
Les résultats sont affichés verticalement. Faites défiler l’écran pour parcourir les métadonnées relatives à chaque colonne de données.
Si une colonne contient des valeurs de type chaîne, les métadonnées suivantes sont fournies :
Nom : le nom de la colonne.
Type de données : le type de données de la colonne sélectionnée.
Taille : la quantité de mémoire réservée à chaque enregistrement dans cette colonne.
Source : origine de la colonne. Il peut s'agir du nom de la source de données ou du chemin d'accès à l'emplacement où sont enregistrées les données.
Description : description de la colonne, si celle-ci est disponible. Si aucune description n'est disponible, ce champ est renseigné par [Null].
OK : le nombre de valeurs dans la colonne sans problème de qualité identifié, par exemple, des espaces blancs de début ou de fin.
NULLES : le nombre de valeurs dans la colonne qui sont NULL, à l'exclusion des valeurs vides.
Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
Vides : le nombre de valeurs vides.
Valeurs avec espace vide de début : le nombre de valeurs de chaîne contenant un espace avant la valeur. Utilisez l’outil Nettoyage des données ou la fonction d’ajustement de l’outil Formule pour résoudre le problème. Pour en savoir plus, consultez Outil Nettoyage des données et Outil Formule.
Valeurs avec espace vide de fin : le nombre de valeurs de chaîne suivies d'un espace.
Valeurs avec espace vide de début et de fin : le nombre de valeurs de chaîne contenant un espace avant et/ou après la valeur.
Longueur moyenne : la longueur moyenne des valeurs dans la colonne.
Longueur la plus longue : le nombre de caractères dans la plus longue valeur de la colonne.
Valeur la plus longue : la plus longue valeur de la colonne.
Longueur la plus courte (non vide) : le nombre de caractères dans la plus courte valeur de la colonne.
Valeur la plus courte : la plus courte valeur de la colonne.
Minimum : première entrée de type chaîne de la colonne dans l'ordre alphabétique.
Maximum : dernière entrée de type chaîne de la colonne dans l'ordre alphabétique.
Uniques : le nombre de valeurs uniques dans le champ. Utilisez l’outil Unique pour obtenir un comptage intégral des entrées uniques et des doublons. Consultez la section Outil Unique pour en savoir plus.
Valeurs uniques : toutes les valeurs uniques dans la colonne.
Si une colonne contient des valeurs numériques, les métadonnées suivantes sont fournies :
Nom : le nom de la colonne.
Type de données : le type de données de la colonne sélectionnée.
Taille : la quantité de mémoire réservée à chaque enregistrement dans cette colonne.
Source : origine de la colonne. Il peut s’agir du nom de la source de données ou du chemin d’accès à l’emplacement où sont enregistrées les données.
Description : description de la colonne, si celle-ci est disponible. Si aucune description n'est disponible, ce champ est renseigné par [Null].
OK : le nombre de valeurs dans la colonne sans problème de qualité identifié, par exemple, des espaces blancs de début ou de fin.
NULLES : le nombre de valeurs dans la colonne qui sont NULL, à l'exclusion des valeurs vides.
Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
Minimum : la plus petite valeur de la colonne.
Maximum : la plus grande valeur de la colonne.
Moyenne : la valeur moyenne des valeurs dans la colonne.
Somme : La somme des valeurs dans la colonne.
Écart-type : la mesure de la dispersion des valeurs dans le graphique.
Variance : la mesure de la distance selon laquelle un ensemble de nombres aléatoires sont dispersés par rapport à la moyenne.
Uniques : le nombre de valeurs uniques dans le champ. Utilisez l’outil Unique pour obtenir un comptage intégral des entrées uniques et des doublons. Consultez Outil Unique pour en savoir plus.
Valeurs uniques : toutes les valeurs uniques dans la colonne.
25e percentile : la valeur médiane dans la partie inférieure, ou la première moitié des données.
50e percentile : la valeur médiane des données.
75e percentile : la valeur médiane dans la partie supérieure, ou seconde moitié des données.
Histogramme : nombre de valeurs dans la colonne qui correspondent aux données regroupées de manière égale. Chaque groupe est indiqué par une valeur de départ et un comptage des valeurs dans le groupe, séparés par un signe deux-points. Un groupe contient des valeurs allant jusqu’à la valeur de départ du groupe suivant, cette valeur de départ étant exclue. 1:23, 2:15, 3:0 indique trois groupes commençant à 1, 2 et 3. Chaque groupe possède respectivement 23, 15 et 0 éléments.
Marge d'erreur : plage des valeurs possible en dessous et au-dessus de la valeur calculée.
Si une colonne contient des données de type date/heure, les métadonnées suivantes sont fournies :
Nom : le nom de la colonne.
Type de données : le type de données de la colonne sélectionnée.
Taille : la quantité de mémoire réservée à chaque enregistrement dans cette colonne.
Source : origine de la colonne. Il peut s’agir du nom de la source de données ou du chemin d’accès à l’emplacement où sont enregistrées les données.
Description : description de la colonne, si celle-ci est disponible. Si aucune description n'est disponible, ce champ est renseigné par [Null].
OK : le nombre de valeurs dans la colonne sans problème de qualité identifié, par exemple, des espaces blancs de début ou de fin.
NULLES : le nombre de valeurs dans la colonne qui sont NULL, à l'exclusion des valeurs vides.
Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
Histogramme par date : (uniquement pour les données de type date) nombre de valeurs dans la colonne qui correspondent aux données regroupées de manière égale. Chaque groupe est indiqué par une valeur de départ et un comptage des valeurs dans le groupe, séparés par un signe deux-points. Un groupe contient des valeurs allant jusqu’à la valeur de départ du groupe suivant, cette valeur de départ étant exclue. 1:23, 2:15, 3:0 indique trois groupes commençant à 1, 2 et 3. Chaque groupe possède respectivement 23, 15 et 0 éléments.
Minimum : la plus petite valeur de la colonne.
Maximum : la plus grande valeur de la colonne.
Uniques : le nombre de valeurs uniques dans le champ. Utilisez l’outil Unique pour obtenir un comptage intégral des entrées uniques et des doublons. Consultez la section Outil Unique pour en savoir plus.
Valeurs uniques : toutes les valeurs uniques dans la colonne.
Si une colonne contient des objets spatiaux, les métadonnées suivantes sont fournies :
Nom : le nom de la colonne.
Type de données : le type de données de la colonne sélectionnée.
Taille : la quantité de mémoire réservée à chaque enregistrement dans cette colonne.
Source : origine de la colonne. Il peut s’agir du nom de la source de données ou du chemin d’accès à l’emplacement où sont enregistrées les données.
Description : description de la colonne, si celle-ci est disponible. Si aucune description n'est disponible, ce champ est renseigné par [Null].
OK : le nombre de valeurs dans la colonne sans problème de qualité identifié.
NULLES : le nombre de valeurs dans la colonne qui sont NULL, à l'exclusion des valeurs vides.
Non Nulles : le nombre d'entrées non nulles dans la colonne, y compris les valeurs vides.
Taille moyenne (octets) : taille moyenne en mémoire de l'objet.
Taille maximum (octets) : taille en mémoire de l'objet le plus volumineux dans la colonne.
Comptage des points : nombre d'objets spatiaux dans la colonne qui sont des points.
Comptage des lignes : nombre d'objets spatiaux dans la colonne qui sont des lignes.
Comptage des polylignes : nombre d'objets spatiaux dans la colonne qui sont des polylignes.
Comptage des rectangles : nombre d'objets spatiaux dans la colonne qui sont des rectangles.
Comptage des polygones : nombre d'objets spatiaux dans la colonne qui sont des polygones.
Comptage des multipoints : nombre d'objets spatiaux dans la colonne qui sont des multipoints.
Nombre moyen de parties : nombre moyen des parties des objets spatiaux dans la colonne.
Nombre maximum de parties : nombre de parties le plus grand des objets spatiaux dans la colonne.
Nombre moyen de points : nombre moyen des points des objets spatiaux dans la colonne.
Nombre maximum de points : nombre de points le plus élevé des objets spatiaux dans la colonne.
Longueur la plus longue : longueur maximale des objets spatiaux dans la colonne.
Surface maximum : surface maximum en miles carrés ou kilomètres carrés.