Outil Mise à l’échelle multidimensionnelle

La mise à l'échelle multidimensionnelle (MDS) est une méthode de séparation des données univariées en fonction de la variance. Du point de vue conceptuel, l’outil MDS prend les dissimilarités, ou les distances, entre les éléments décrits dans les données et génère une carte entre ces éléments. Le nombre de dimensions dans cette carte est souvent fourni avant la génération de la carte par l’analyste. La dimension de variance la plus élevée correspond généralement à la distance la plus longue décrite dans les données. Dans la mesure où la solution de cartographie repose sur des données univariées, la rotation et l'orientation des dimensions des cartes ne sont pas significatives. L’outil MDS applique une analyse dimensionnelle similaire aux Composants principaux. Pour plus d'informations, voir https://fr.wikipedia.org/wiki/Positionnement_multidimensionnel.

Deux types de MDS sont implémentés dans cet outil : MDS classique et MDS isométrique. La MDS classique est l’approche simple et rapide. La MDS classique génère une carte en réduisant l’erreur entre les distances données entre les éléments et la distance cartésienne entre les éléments sur la carte. La MDS isométrique est un peu plus complexe. Si la carte résultant de la MDS classique est prise, puis ajustée de sorte que les distances sur la carte entre des paires d’éléments apparaissent dans le même ordre décroissant que les données d’origine, on parle alors de MDS isométrique. Cette MDS isométrique est alors utile lorsque les unités de distance exactes sont moins importantes que le rang des paires d’éléments qui sont les plus éloignées ou les plus proches les unes des autres.

Par exemple, la MDS classique calcule la distance en ligne droite entre les villes des États-Unis pour générer une carte des États-Unis. La MDS isométrique produit un diagramme des aliments multidimensionnel en fonction des similarités ou des différences en termes de valeur nutritionnelle qui existent entre les aliments, le classement des distances étant plus important qu'une coordonnée unitaire spécifique. Ces méthodes sont souvent employées dans le cadre de la recherche marketing pour obtenir le nombre et la nature des dimensions perceptuelles que les clients mettent en œuvre pour déterminer la similarité entre différents éléments.

Outil Galerie

Cet outil n'est pas automatiquement installé avec Alteryx Designer ou les outils R. Pour utiliser cet outil, téléchargez-le à partir d'Alteryx Analytics Gallery.

Connexion d'une entrée

Un flux de données configuré de l'une des 2 manières suivantes :

Flux comprenant 3 colonnes, chaque entrée représentant les noms de paires d'éléments et leur dissimilarité.
Matrice MxM dont chaque colonne représente un élément, chaque ligne représente un élément et chaque intersection représente la valeur de dissimilarité. Pour plus d'informations, consultez la page https://en.wikipedia.org/wiki/Distance_matrix.

Configuration de l'outil

Onglet Options du modèle

Utilisez l'onglet Options du modèle pour configurer votre modèle.

Choisir le type d'entrée : sélectionnez l'utilisation de l'approche par paires à 3 colonnes ou l'approche par matrice de distance pour l'entrée des informations de dissimilarité. Dans l'un ou l'autre cas, vous devez définir toutes les distances entre les paires, sinon l'application renverra une erreur.
Nombre de dimensions à sortir : sélectionnez le nombre de dimensions que la carte et les données contiendront dans les sorties Données et Tracé. Il convient de prendre en considération le niveau de variance à l’aide du tracé de valeurs propres dans le rapport pour choisir le nombre de dimensions le plus approprié.
Choisir la méthode de mise à l'échelle multidimensionnelle : choisissez entre l'utilisation des algorithmes MDS classiques ou isométriques.

Onglet Options de tracé

Utilisez l'onglet Options de tracé pour définir les contrôles du tracé de sortie.

Liste séparée par des virgules des dimensions à inverser : tous les nombres figurant dans cette liste correspondront aux dimensions dont les coordonnées des éléments sont multipliées par -1. Les algorithmes MDS sélectionnent la polarité des dimensions de manière arbitraire et, parfois, peuvent s'appuyer sur les valeurs saisies par l'utilisateur. Par exemple, lors de la création d’une carte des États-Unis sur la base des distances entre les villes, la direction peut être inversée par rapport à ce qu’on sait.
Diagramme à barres des valeurs propres : cette case à cocher détermine si les valeurs propres et l'explication sont incluses ou non dans la sortie du rapport. Cela permet de choisir le nombre de dimensions à conserver dans la carte des données. Le diagramme à barres aide essentiellement à savoir à quel point des dimensions supplémentaires intègrent uniquement du bruit ou de fausses données dans la carte.
Remplacer les noms d'éléments par des nombres dans le graphique pour plus de visibilité ? : la carte peut contenir trop d'éléments pour distinguer un nom d'un autre. Cette case à cocher détermine si tous les noms d'éléments doivent être convertis ou non en ID numériques (par exemple, 'jack', 'jill', 'banana'... etc., au lieu de x1,x2,x3, ... x987, x988, etc.).

Onglet Options graphiques

Dans l'onglet Options des graphiques, définissez les contrôles de la sortie graphique.

Taille du tracé : sélectionnez « pouces » ou « centimètres » pour indiquer la taille du graphique.
Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 dpi) ; 2x (192 dpi) ; ou 3x (288 dpi).
- Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur.
- Une résolution élevée produit un fichier de plus grande taille avec une qualité d'impression supérieure.
Taille de la police de base (points) : sélectionnez la taille de la police dans le graphique.

Visualisation de la sortie

Connectez un outil Explorateur à chaque ancrage de sortie pour afficher les résultats.

Ancrage D (Données) : contient les entrées de chaque élément et la valeur des coordonnées de chaque dimension.
Ancrage P (Tracé) : contient les sorties de rapport avec les paramètres graphiques déclarés dans la configuration de l'outil. (Facultatif) Table et graphique illustrant la variance de chaque dimension avec une explication des valeurs propres. Tracés de chaque paire de dimensions (par exemple {1,2}; ;{1,3};{1,4};{2,3}{2,4};{3,4}) avec chaque élément représenté par un nom ou un identifiant numérique (facultatif).