L’outil Score de simulation effectue l’échantillonnage à partir d’une approximation de la distribution d’une erreur d’objet modèle. Alors que la notation standard tente de prédire la valeur prédictive moyenne, l’outil Score de simulation tient également compte de la distribution d’erreur pour proposer une plage de valeurs possibles.
Cet outil utilise l'outil R. Accédez à Options > Télécharger les outils prédictifs et connectez-vous au portail de licences et de téléchargements Alteryx pour installer R et les packages utilisés par l'outil R. Pour en savoir plus, consultez la page Télécharger et utiliser les outils prédictifs.
Ancrage M : objet modèle produit par un des outils de modélisation prédictifs sous R.
Ancrage V (Facultatif) : jeu de données de validation à utiliser lors de la connexion d'un modèle non linéaire (non LM). Les outils Alteryx qui créent des modèles non LM sont : Régression logistique, Régression de comptage, Régression Gamma, Modèle boosté, Arbre de décision, Modèle de forêt, Classificateur bayésien naïf, Réseau neural, Modèle Spline, Pas à pas et Machine à vecteurs de support.
En cas de notation d’un modèle LM, la distribution d’erreur peut être directement échantillonnée du fait des propriétés des LM.
En cas de notation d’autres modèles (non-LM), on suppose l’homoscédasticité des distributions d’erreur par rapport aux prédicteurs. Cela permet de calculer une distribution d’erreur unique en notant le modèle par rapport à un jeu de validation. Cette distribution d’erreur est ensuite échantillonnée, puis ajoutée aux résultats de la notation des données entrantes.
Avertissement
Ne connectez pas cette entrée si l'objet modèle entrant utilise un outil Régression linéaire.
Ancrage S : données de simulation à noter. Ce paramètre doit contenir tous les champs (types et noms identiques) utilisés pour créer le modèle prédictif associé.
Nommer les résultats de la simulation du score : nom du champ pour les résultats générés. Le nom de champ doit commencer par une lettre et peut contenir des lettres, des chiffres ainsi que les caractères spéciaux point (« . ») et trait de soulignement (« _ »). Notez que R respecte la casse.
Nombre d'enregistrements dont le score doit être calculé à la fois : cet outil peut diviser les données d'entrée en fragments, en notant un fragment à la fois et donc en évitant la limite de traitement en mémoire de R. Cette option détermine le nombre maximal d’enregistrements entrants contenus dans chaque fragment de données.
Nombre d'échantillons provenant de la distribution d'erreur par itération : nombre d'éléments extraits de la distribution d'erreur du modèle pour chaque enregistrement entrant.
Définir l'amorce aléatoire (facultatif) : spécifiez une amorce aléatoire. Cette option est masquée si les données contiennent un champ d’amorce à noter.
Ancrage D : données à noter, ainsi que le score simulé.