Skip to main content

Simulation Sampling Tool Icon Outil Échantillonnage de simulation

L’outil Échantillonnage de simulation échantillonne les données en fonction des paramètres à partir d’une distribution, à partir de données d’entrée ou sous la forme d’une combinaison convenant le mieux à une distribution. Les données peuvent également être « dessinées » si vous n'êtes pas certain des paramètres d'une distribution et s'il vous manque des données.

Cet outil utilise l'outil R. Accédez à Options > Télécharger les outils prédictifs et connectez-vous au portail de licences et de téléchargements Alteryx pour installer R et les packages utilisés par l'outil R. Pour en savoir plus, consultez la page Télécharger et utiliser les outils prédictifs.

Connexion des entrées

  • Ancrage D (facultatif) : données d'échantillon. Cette entrée est obligatoire si vous effectuez l’échantillonnage à partir de données brutes ou stockées.

  • Ancrage S (facultatif) : Données de simulation. Si d’anciens outils de simulation ont été utilisés, les données provenant de ces outils peuvent être connectées à cette entrée afin d’ajouter ces informations et d’obtenir le comptage des itérations et l’amorce.

Configuration de l'outil

  • Sélectionner un mécanisme d'échantillonnage : Échantillonnage de Monte Carlo/Simple ou échantillonnage Latin HyperCube/Stratifié. Pour l’échantillonnage stratifié des données, la taille des strates maximum est déterminée par la taille de fragment choisie.

  • Taille du fragment : taille maximale des données à évaluer simultanément. Ce paramètre permet d’éviter la limite de traitement en mémoire de R. Pour l’échantillonnage stratifié des données, ce paramètre indique également la taille maximale des strates.

  • Amorce : amorce aléatoire utilisé pour l'échantillonnage. Cette option n'est pas disponible si un jeu de données contenant un champ d'amorce est connecté à l'entrée S, car cette amorce est incrémentée et utilisée à la place.

  • Nombre d'itérations : nombre d'échantillons à sélectionner. Cette option n'est pas disponible si un jeu de données est connecté à l'entrée S, car la taille de ce jeu de données détermine le nombre d'itérations.

  • Sélectionner le mode d'échantillonnage :

    • Échantillonner en fonction des paramètres

      • Pour l'échantillonnage en fonction des paramètres, ne connectez pas un flux de données à l'entrée D.

        • Entrer un nom pour les données sortantes : spécifiez un nom de champ pour le champ de sortie.

        • Sélectionner la distribution : effectuez une sélection dans la liste des distributions prises en charge. Avec les paramètres, cette option détermine le tracé de la densité cumulative/fonction de masse décrites.

        • Saisir les paramètres et les limites : pour définir les paramètres de la distribution, utilisez les curseurs ou les flèches haut/bas pour ajuster les valeurs ou saisissez ces dernières manuellement. Avec la distribution sélectionnée, cette option détermine le tracé de la densité cumulative/fonction de masse décrites. Vous pouvez également, en option, indiquer les limites de la distribution. Si des limites sont spécifiées, l'échantillonnage de rejet est utilisé pour veiller à ce que les échantillons extraits soient compris entre les limites supérieure et inférieure. Les limites sont inclusives.

    • Échantillonnage à partir des données

      • Connectez un flux de données à l'entrée D ou effectuez l'échantillonnage par saisie manuelle.

        • Échantillonnage avec remplacement : sélectionnez cette option pour effectuer un échantillonnage avec remplacement.

        • Spécifier le type de données : sélectionnez l'une des options de données.

          • Données brutes (non stockées) : sélectionnez les champs à échantillonner, puis une stratégie d'échantillonnage (voir ci-dessous).

          • Données stockées : exige un champ d'ID et un champ de valeur avec des emplacements de stockage placés à distance égale. Les ID sont des nombres placés à distance égale. Indiquez le nom des données sortantes (nom du champ de sortie), la stratégie d’échantillonnage (voir ci-dessous), ainsi que le champ d’ID et le champ de valeur des données stockées.

          • Saisie manuelle : saisissez manuellement des données via un widget Roulette. Saisissez le nom des données sortantes (nom du champ de sortie) et les paramètres du widget Roulette. Utilisez les options Inférieur, Supérieur, Hauteur et Emplacements num pour configurer la taille de la grille. Cliquez ensuite dans la grille pour indiquer la hauteur des emplacements de stockage.

        • Sélectionner les champs à échantillonner : sélectionnez les colonnes à partir desquelles échantillonner les données.

        • Sélectionner la stratégie d'échantillonnage : indiquez comment échantillonner vos données. Échantillonnez des lignes entières, chaque colonne indépendamment ou à partir de la distribution du meilleur ajustement. Si vous choisissez d’effectuer l’échantillonnage à partir de la distribution du meilleur ajustement, sélectionnez les distributions selon lesquelles ajuster les données.

Visualisation de la sortie

Connectez un outil Explorateur à l'ancrage de sortie pour afficher les résultats.

  • Ancrage D : sortie de données. Il s’agit du résultat de la simulation.