Skip to main content

Score Tool Outil Évaluation

Exemple d'outil unique

L'outil Jointure comporte un exemple d'outil unique. Consultez la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.

L'outil Évaluation crée une estimation d'une cible en appliquant un modèle R à un ensemble de prédicteurs. Si la variable cible est catégorique, elle fournit des probabilités qu'un enregistrement (basé sur la variable prédictive) appartient à chaque catégorie. Si la variable cible est continue, il en estime la valeur. L'outil Évaluation permet d'évaluer les performances du modèle, mais ne le fait pas seul.

Cet outil utilise l'outil R. Accédez à Options Télécharger les outils prédictifs et connectez-vous au portail Alteryx Downloads and Licenses pour installer R et les paquets utilisés par l'outil R. Consultez  Télécharger et utiliser les outils prédictifs.

Type de modèle

L’outil Score est capable d’analyser des modèles provenant de divers emplacements :

  • Le modèle est soit ajouté au workflow depuis une machine locale, soit tiré de la base de données.

  • Le modèle est stocké dans un système de gestion de modèles Promote.

Configurer pour un modèle local

L’outil Score peut utiliser des modèles inclus à un workflow, ou des modèles accessibles à partir de la suite en BDD.

Configurer l'outil pour le traitement standard

Connexion des entrées

L’outil Score utilise deux entrées :

  • L’objet modèle produit par un outil prédictif compatible avec le code R.

  • Un flux de données contenant les champs prédicteurs sélectionnés dans la configuration du modèle. Il peut s’agir d’un flux de données Alteryx standard ou d’un flux de métadonnées XDF.

Connectez ces entrées à celle de l’outil Score afin de démarrer la configuration.

Modèles pris en charge

L’outil Score peut utiliser un flux de données issu d’un modèle prédictif, même si l’estimation a été réalisée à l’aide d’une fonction RevoScaleR. L'outil Évaluation peut utiliser un flux de métadonnées XDF uniquement si l'entrée envoyée à l'outil de modélisation provient d'un outil Sortie XDF ou Entrée XDF, et si l'estimation du modèle a été réalisée à l'aide d'une fonction RevoScaleR.

Les modèles estimés par ORE utilisant un outil prédictif en BDD connecté à une source de données Oracle ne peuvent pas être utilisés pour noter un flux de données Alteryx standard, toutefois les modèles estimés avec un flux de données Alteryx standard peuvent être utilisés pour noter des sources de données Oracle.

Configuration

Ces ajustements ne sont valides que si la cible est une variable catégorielle binaire.

  • Le préfixe ou le nom de champ doit commencer par une lettre et peut contenir des lettres, des chiffres, ainsi que les caractères spéciaux suivants : point (« . ») et trait de soulignement (« _ »). Le code R est sensible à la casse.

  • Ces champs permettent d’ajuster les probabilités qui ont été adaptées, afin qu’elles correspondent aux véritables pourcentages d’échantillon. Sélectionnez l’option :

    • La valeur du champ cible qui a été suréchantillonné », pour obtenir le nom du champ concerné.

    • Le pourcentage de la valeur suréchantillonnée dans les données d’origine avant le suréchantillonnage », pour obtenir le pourcentage des valeurs qui ont été répétées au cours du suréchantillonage.

  • Options de régression linéaire uniquement non régularisées :

    Modèles créés

    En vue de ce calcul, si vous utilisez un modèle créé par ORE, la table des estimations d’origine doit être présente dans la base de données.

    • Sélectionnez cette option pour transformer les valeurs en réappliquant l’échelle d’origine, et pour utiliser un estimateur de persistance afin de tenir compte des écarts liés à la transformation.

    • Inclure un intervalle de confiance de prédiction : sélectionnez cette option pour spécifier la valeur utilisée pour calculer les intervalles de confiance.

  • Options spécifiques à l’entrée XDF :

    • Sélectionnez cette option pour ajouter des scores au fichier XDF d’entrée, au lieu de les placer dans un flux de données Alteryx.

  • Le nombre d'enregistrements à noter à la fois : sélectionnez le nombre d'enregistrements dans un groupe. Les données en entrée sont traitées groupe par groupe, afin de ne pas dépasser la limite de traitement en mémoire de R.

Configurer l'outil pour le traitement en BDD

L’outil Score prend en charge le traitement en BDD Oracle, Microsoft SQL Server 2016 et Teradata. Visitez Vue d'ensemble des outils en base de données pour plus d'informations sur les outils et la prise en charge en base de données.

Pour accéder à la version en BDD de l’outil Score :

  • Placez un outil en BDD dans le canevas. L’outil Score bascule automatiquement vers la version en BDD.

  • Effectuez un clic droit sur l’outil Score, pointez le curseur sur Sélectionner la version de l’outil, puis sélectionnez la version en BDD.

Consultez la page Analyses prédictives pour en savoir plus sur la prise en charge du traitement prédictif en BDD.

Connexion d'une entrée

L’outil Score utilise deux entrées :

  • L’objet modèle produit par un outil prédictif compatible avec le code R.

  • Un flux de données contenant les champs prédicteurs sélectionnés dans la configuration du modèle. Il peut s’agir d’un flux de données Alteryx standard ou d’un flux de métadonnées XDF.

Connectez ces entrées à celle de l’outil Score afin de démarrer la configuration.

Modèles pris en charge

L’outil Score peut utiliser un flux de données issu d’un modèle prédictif, même si l’estimation a été réalisée à l’aide d’une fonction RevoScaleR. L'outil Évaluation peut utiliser un flux de métadonnées XDF uniquement si l'entrée envoyée à l'outil de modélisation provient d'un outil Sortie XDF ou Entrée XDF, et si l'estimation du modèle a été réalisée à l'aide d'une fonction RevoScaleR.

Les modèles estimés par ORE utilisant un outil prédictif en BDD connecté à une source de données Oracle ne peuvent pas être utilisés pour noter un flux de données Alteryx standard, toutefois les modèles estimés avec un flux de données Alteryx standard peuvent être utilisés pour noter des sources de données Oracle.

Configuration

Aucun autre caractère spécial n'est autorisé et R est sensible à la casse.

  • Saisissez le nom de la table dans laquelle sont enregistrés les résultats dans la base de données.

  • Le préfixe ou le nom de champ doit commencer par une lettre et peut contenir des lettres, des chiffres, ainsi que les caractères spéciaux suivants : point (« . ») et trait de soulignement (« _ »).

  • Ces champs permettent d’ajuster les probabilités qui ont été adaptées, afin qu’elles correspondent aux véritables pourcentages d’échantillon. Ces ajustements ne sont valides que si la cible est une variable catégorielle binaire. Sélectionnez l’option :

    • La valeur du champ cible qui a été suréchantillonné », pour obtenir le nom du champ concerné.

    • Le pourcentage de la valeur suréchantillonnée dans les données d’origine avant le suréchantillonnage », pour obtenir le pourcentage des valeurs qui ont été répétées au cours du suréchantillonage.

  • Options de régression linéaire uniquement :

    Modèles créés

    En vue de ce calcul, si vous utilisez un modèle créé par ORE, la table des estimations d’origine doit être présente dans la base de données.

    • Sélectionnez cette option pour transformer les valeurs en réappliquant l’échelle d’origine, et pour utiliser un estimateur de persistance afin de tenir compte des écarts liés à la transformation.

    • Inclure un intervalle de confiance de prédiction : sélectionnez cette option pour spécifier la valeur utilisée pour calculer les intervalles de confiance.

  • Microsoft R Server doit disposer d’informations supplémentaires concernant la plateforme Teradata à utiliser : Ces informations sont généralement communiquées par un administrateur Teradata local.

    • Les chemins qui, sur le serveur Teradata, mènent aux exécutables binaires de R ;

    • L’emplacement des fichiers temporaires utilisé par Microsoft R Server.

Source du modèle (Oracle uniquement)

  • Sélectionnez la source de l’objet modèle qui est transmis à l’entrée (M) de l’outil Score. Celui-ci peut se trouver :

    • Dans la base de données (il s’agit de la valeur située dans le champ Nom du flux de données).

    • Dans le champ Objet du flux de données.

Visualisation de la sortie

La sortie contient les flux de données d’origine, incluant les valeurs prédictives du modèle. Dans le cas d’un modèle qui utilise une cible catégorielle, une probabilité prédite pour chaque niveau de la variable cible est indiquée dans un nom de champ. Ce dernier inclut le préfixe fourni par l’utilisateur, ainsi que le suffixe correspondant au niveau possible de la variable cible.

Configurer pour un modèle Promote

Promote est une plate-forme permettant le déploiement, la gestion et la mise à l’échelle des modèles prédictifs. Alteryx est capable de s’y connecter afin d’évaluer les modèles qui y sont stockés.

Identifiants de Promote

  • Établir une Connexion Promote d’Alteryx.

  • Connexion Alteryx Promote : liste déroulante utilisée pour faire un choix parmi les connexions de Promote enregistrées.

  • Ajouter une connexion : option à ajouter à la liste des connexions Promote disponibles. Le gestionnaire de connexion Promote fonctionne indépendamment des workflows.

Ajouter une connexion Promote

  1. Cliquez sur Ajouter une connexion.

  2. Dans la fenêtre Ajouter une connexion, entrez une URL Alteryx Promote , qui pointe vers l’emplacement de stockage de votre modèle.

  3. Sélectionnez Suivant.

  4. Dans la fenêtre Identifiants d’Alteryx Promote, tapez votre Nom d'utilisateur et votre clé API.

  5. Sélectionnez Se connecter.

  6. Si vous êtes connecté, dans la fenêtre Connexion établie, sélectionnez Terminer. La nouvelle connexion est sélectionnée et visible dans la liste déroulante.

Supprimer une connexion Promote

  1. Sélectionnez une connexion disponible.

  2. Cliquez sur Supprimer la connexion.

  3. Dans la fenêtre de Confirmation, vérifiez que l’URL et le nom d’utilisateur sont associés à la connexion que vous voulez supprimer.

  4. Sélectionnez ok. La connexion n'est plus disponible dans la liste déroulante.

Accès Promote

Si vous ne savez pas si vous avez accès à la fonction Promote ou si vous avez besoin d’aide pour trouver les informations d’identification nécessaires, contactez votre administrateur local ou votre représentant de l'assistance.

Sélection de modèle

Une liste des modèles auxquels vous avez accès est générée. Faites défiler cette liste ou utilisez la fonction de recherche pour localiser le modèle à utiliser, puis sélectionnez le chemin associé.

Une fois le chemin sélectionné, les informations concernant le modèle sont collectées.

  • Nom : le nom de la colonne.

  • Propriétaire: le propriétaire du modèle.

  • Statut du modèle, permettant de connaître sa disponibilité.

    • Le modèle est à jour et prêt pour le traitement des données.

    • Le modèle est en cours d’actualisation et n’est pas en mesure de traiter des données.

    • Le modèle est finalisé, mais certains composants n’ont pas été correctement créés. Le modèle n’est pas en mesure de traiter des données.

    • Le modèle n’a pas pu être finalisé et n’est pas en mesure de traiter des données.

    • Le modèle n’a pas été finalisé et n’est pas en mesure de traiter des données.

  • Date de la dernière actualisation du modèle.

Vérifiez que le modèle permet le traitement des données et sélectionnez Terminé.

Résumé de la configuration

Le résumé de la configuration rappelle les identifiants utilisés et fournit une synthèse des informations relatives au modèle sélectionné.