Skip to main content

Transformation Tool icon Outil Transformation

Utilisez l’outil Transformation pour effectuer ces tâches de préparation des données :

  • Définir les types de données.

  • Nettoyer les valeurs manquantes.

  • Sélectionner les caractéristiques.

  • Encoder les données.

Vous pouvez effectuer chacune de ces tâches dans n’importe quel ordre. L'ordre dépend de la façon dont vous voulez préparer les données.

Alteryx Intelligence Suite requis

Cet outil fait partie de Alteryx Intelligence Suite . Intelligence Suite nécessite une licence séparée et un programme d'installation complémentaire pour Designer. Après avoir installé Designer, installez Intelligence Suite et commencez votre essai gratuit .

Important

Les outils Transformation doivent être placés entre l’outil Modélisation assistée et l’outil Classification ou Régression.

Définir les types de données

  1. Dans le menu déroulant de la section Transformateur , sélectionnez Définir les types de données .

  2. Dans la section Paramètres , les noms des caractéristiques sont listés dans la colonne Caractéristique . Vous pouvez sélectionner le type de données pour une caractéristique à partir du menu déroulant de la colonne Définir les types de données . Les options sont Numérique , Catégorielle , Booléenne et ID .

Nettoyer les valeurs manquantes

  1. Dans le menu déroulant de la section Transformateur , sélectionnez Nettoyer les valeurs manquantes .

  2. Cochez les cases à côté des caractéristiques avec les valeurs manquantes que vous souhaitez nettoyer.

  3. Sélectionnez une méthode que vous souhaitez utiliser pour nettoyer les valeurs manquantes :

Si vous sélectionnez cette option, la Modélisation assistée remplacera les valeurs manquantes par la somme de toutes les lignes d'une caractéristique, divisée par le nombre total de lignes. Utilisez cette méthode uniquement pour les valeurs numériques. Cette option est recommandée lorsque vos données ont une distribution normale et ne présentent pas de valeurs aberrantes.

Si vous sélectionnez cette option, la Modélisation assistée remplacera les valeurs manquantes par le nombre représentant le point médian dans la distribution de votre caractéristique. Cette option est recommandée lorsque vos données sont asymétriques ou contiennent des valeurs aberrantes.

Si vous sélectionnez cette option, la Modélisation assistée remplacera les valeurs manquantes par le nombre revenant le plus fréquemment. Cette option est recommandée lorsque la caractéristique contient des valeurs catégorielles et que vous souhaitez la conserver. Vous pouvez aussi utiliser le mode pour renseigner les valeurs numériques manquantes.

Si vous sélectionnez cette option, la Modélisation assistée lira les champs vides comme s'il s'agissait de valeurs manquantes. Sélectionnez cette option si vous pensez que l'algorithme de modélisation peut trouver une signification dans les valeurs manquantes elles-mêmes, car il est parfois possible de trouver des schémas récurrents dans l'absence de données. Vous pouvez également sélectionner cette option si vous pensez que d'autres méthodes de traitement des données manquantes pourraient biaiser votre modèle.

Important

L’outil ne nettoiera pas les valeurs manquantes pour les caractéristiques avec des cases non cochées. Si une caractéristique contient des valeurs manquantes et que vous ne choisissez pas une méthode de nettoyage, une erreur se produit en aval dans le pipeline de machine learning.

Sélectionner les caractéristiques

  1. Dans le menu déroulant de la section Transformateur , sélectionnez Sélectionner les caractéristiques .

  2. Si vous ne souhaitez pas inclure une caractéristique dans le modèle, décochez la case à côté de son nom.

Encodage one-hot

  1. Dans le menu déroulant de la section Transformateur , sélectionnez Encodage one-hot .

  2. Utilisez le bouton de bascule pour masquer les caractéristiques non-encodables .

  3. Cochez la case à côté des caractéristiques que vous souhaitez encoder en format lisible par la machine.

  4. Utilisez le menu déroulant pour sélectionner la façon dont vous souhaitez que l’outil traite les caractéristiques encodées :

    • L'option Ignorer permet à l’outil Transformation de marquer les données en traitant les valeurs inconnues comme des constantes.

    • L'option Erreur indique à l'outil Transformation de renvoyer une erreur si elle rencontre des valeurs inconnues.