Exemple d'outil unique
L'outil Diagramme de lift comporte un exemple d'outil unique. Consultez la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.
L'outil Diagramme de lift génère un diagramme cumulatif des réponses recueillies (également appelé « diagramme de gains ») et un diagramme du taux de réponse incrémentiel, qui permettent d'effectuer une évaluation visuelle de la précision comparative de différents modèles de classification binaire (oui/non) dans le but de prédire de nouvelles données ou d'effectuer une évaluation des implications économiques attendues de l'utilisation d'un modèle prédictif dans le cadre d'un processus métier.
Ces deux diagrammes reposent sur l’agrégation de données en 10 groupes (déciles) dont l’ordre varie selon la probabilité prévue d’une réponse favorable pour chaque modèle, puis sur la comparaison de cette réponse à la situation prévue en cas de sélection aléatoire de prospects. Dans le cas du diagramme cumulatif de réponses, le diagramme examine le pourcentage de réponses totales obtenues si tous les clients de la base de données d’une organisation étaient contactés, en contactant les 10 pour cent ou 20 pour cent les plus pertinents, etc. selon les prévisions du modèle. L'axe X (horizontal) du diagramme correspond au pourcentage de la base de données contacté, tandis que l'axe Y (vertical) correspond au pourcentage de réponses totales capturées en atteignant ce décile le plus pertinent de la base de données en fonction du modèle.
Par exemple, les 20 pour cent de prospects les plus pertinents en fonction du modèle peuvent représenter 50 pour cent de la réponse favorable qui serait obtenue si tous les prospects étaient contactés. Le diagramme du taux de réponse incrémentiel indique le taux de réponse favorable pour chaque groupe de déciles par modèle dans la base de données. En outre, l'outil génère une table de gains et des mesures de la zone sous la courbe, ainsi que le coefficient de Gini pour fournir des métriques de comparaison globales des performances des différents modèles lorsque l'option de diagramme cumulatif des réponses recueillies est sélectionnée, et une table de taux de réponse aux différents déciles pour chaque modèle lorsque l'option de taux de réponse incrémentiel est sélectionnée.
Cet outil utilise l'outil R. Accédez à Options > Télécharger les outils prédictifs et connectez-vous au portail Téléchargements et licences Alteryx pour installer R et les packages utilisés par l'outil R. Consultez la page Télécharger et utiliser les outils prédictifs.
L'outil nécessite…
Les modèles de classification binaire, tels que les outils Réseau neural, Régression logistique, Arbre de décision, Modèle de forêt, Modèle boosté, Modèle Spline ou Pas à pas, ont été réunis dans un flux de données unique.
Un flux de données Alteryx ou un flux de métadonnées XDF cohérent avec l'objet modèle (en termes de noms et de types de champ), et tous possèdent la même variable cible binaire.
Type de diagramme de lift : sélectionnez le diagramme Réponse cumulée totale ou le diagramme Taux de réponse incrémentiel.
Taux de réponse vraie (entre 0 et 1) : la base de données utilisée pour construire un modèle prédictif est souvent « suréchantillonnée » pour augmenter le pourcentage d'observations présentant l'une des deux catégories de réponse cible. En déterminant le taux de réponse vraie (originale) de la variable cible, le diagramme de lift construit tient compte du suréchantillonnage d'un niveau de la cible. En cas d'absence de suréchantillonnage, la valeur de cette option doit correspondre au taux de réponse de la base de données utilisée pour développer les modèles.
Niveau cible (étiquette pour la réponse souhaitée de la variable cible) : cette option permet de créer un diagramme de lift cohérent selon le contexte de décision, ainsi que de vérifier les erreurs afin de garantir la pertinence du diagramme créé.
Nom d'échantillon (facultatif) : cette option permet de placer une étiquette sur le diagramme créé afin d'indiquer l'échantillon du flux de données qui a servi à créer le diagramme, ou de fournir d'autres informations que l'artisan de données considère comme pertinentes pour le diagramme.
Nombre d'enregistrements à lire simultanément : permet de limiter le nombre d'enregistrements extraits du flux de données à la fois.
Taille du tracé : configurez la taille du tracé en pouces ou en centimètres.
Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 dpi) ; 2x (192 dpi) ou 3x (288 dpi).
Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur.
Une résolution élevée produit un fichier de plus grande taille avec une qualité d'impression supérieure.
Taille de la police de base (points) : configurez la taille de la police.
La sortie de l'outil est un champ de rapport Alteryx qui se compose d'un diagramme R et d'une table de lift/gains. Ces éléments peuvent servir à aider à créer des rapports personnalisés.