Skip to main content

Create Samples Tool Icon Outil Créer des échantillons

Exemple d'outil unique

L'outil Créer des échantillons a un exemple d'outil unique. Consultez la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.

Utilisez l'outil Créer des échantillons pour fractionner les enregistrements d'entrée en 2 ou 3 échantillons aléatoires. Dans l'outil, vous pouvez spécifier le pourcentage d'enregistrements devant figurer dans les échantillons d'estimation et de validation. Si le total est inférieur à 100 %, les enregistrements restants sont affectés à l’échantillon de garde.

Configuration de l'outil

  1. Pourcentage de l'échantillon d'estimation  : pourcentage des données à placer dans l'échantillon d'estimation (entre 1 et 99 %).

  2. Pourcentage de l'échantillon de validation  : pourcentage des données à placer dans l'échantillon de validation (entre 1 et 99 %).

  3. Amorce aléatoire  : entier compris entre 1 et 1000. Vous pouvez modifier cette valeur pour changer l'échantillon dans lequel une ligne de données est placée. Sauf si vous avez une bonne raison d’effectuer cette modification, la valeur par défaut (1) reste recommandée.

Visualisation de la sortie

Il existe 3 sorties pour l’outil Créer des échantillons :

  • Ancrage E  : le flux de sortie Estimation contient un échantillon aléatoire des enregistrements d'entrée. Le nombre d'enregistrements dans ce flux est égal au pourcentage du total des enregistrements spécifié dans la propriété Estimation ci-dessus.

  • Ancrage V  : le flux Validation contient un échantillon aléatoire des enregistrements d'entrée. Le nombre d'enregistrements dans ce flux est égal au pourcentage du total des enregistrements spécifié dans la propriété Validation ci-dessus.

  • Ancrage H  : le flux Exclusion contient tous les enregistrements restants qui n'ont pas été affectés aux échantillons d'estimation ou de validation.

Si les enregistrements sont en nombre impair et si les échantillons d'estimation et de validation sont définis sur 50 %, le flux de sortie Estimation possède un enregistrement de plus que le flux Validation.