Skip to main content

Three partially full beakers Outil Échantillon

Exemple d'outil unique

L'outil Échantillon a un exemple d'outil unique. Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.

Utilisez l'outil Échantillon pour limiter le flux de données à un nombre spécifié, un pourcentage ou un ensemble aléatoire de lignes. De plus, l'outil Échantillon applique la configuration sélectionnée aux colonnes sélectionnées à grouper par.

Configuration de l'outil

  1. Dans la section Méthode d'échantillonnage , sélectionnez le type d'échantillon. Les options sont les suivantes :

    • N premières lignes : retourne chaque ligne des données depuis le début des données jusqu’à la ligne N.

    • N dernières lignes : à partir de la ligne qui se trouve à N lignes de la fin des données, retourne toutes les lignes jusqu’à la fin des données.

    • Ignorer les N 1ères lignes : retourne toutes les lignes des données à partir de la ligne N.

    • 1 de chaque N lignes : retourne la première ligne de chaque groupe de N lignes.

    • 1 sur N chance d'inclure chaque ligne : détermine de façon aléatoire si chaque ligne est incluse dans l'échantillon, indépendamment de l'inclusion de toutes les autres lignes. Cette méthode de sélection implique que N est une approximation.

      Astuce

      Si vous avez 1 000 lignes, sélectionnez un échantillon aléatoire et indiquez la valeur 10 pour N. Vous devriez obtenir 100 lignes. Toutefois, vous pouvez obtenir entre 75 et 150 enregistrements.

    • Premier N% de lignes  : retourne N pour cent de lignes. Cette option nécessite que les données passent deux fois dans l'outil : une fois pour calculer le nombre de lignes et une autre fois pour retourner le pourcentage spécifié de lignes.

  2. Saisissez un nombre dans la zone N= pour spécifier la valeur de N.

  3. Regrouper par colonne (facultatif)  : sélectionnez les colonnes de votre jeu de données par lesquelles vous souhaitez regrouper. Cochez la case Tout sélectionner si vous souhaitez regrouper par toutes les colonnes. Si un ou plusieurs groupes sont spécifiés, N lignes sont renvoyées pour chaque groupe.

    Astuce

    Si vous choisissez de regrouper par une colonne appelée Ville, que vous indiquez 2 pour la valeur de N et sélectionnez N premières lignes, Alteryx renvoie les 2 premières lignes pour chaque ville.