El Multidimensional Scaling (MDS) es un método de separación de datos univariados basados en la varianza. Conceptualmente, el MDS toma las diferencias, o distancias, entre los elementos descritos en los datos y genera un mapa entre los elementos. El número de dimensiones en este mapa a menudo se proporciona antes de la generación por el analista. Por lo general, la dimensión de varianza más alta corresponde a las distancias más grandes que se describen en los datos. La solución de mapa se basa en datos univariados, por lo que la rotación y la orientación de las dimensiones del mapa no son significativas. El MDS utiliza análisis dimensionales similares a los componentes principales. Para obtener más información, consulta https://en.wikipedia.org/wiki/Multidimensional_scaling.
Dos tipos de MDS se implementan en esta herramienta: MDS clásico y MDS isométrico. El MDS clásico es el enfoque simple y rápido. El MDS clásico funciona generando un mapa mediante la reducción del error entre las distancias dadas entre los elementos y la distancia cartesiana entre los elementos en el mapa. El MDS isométrico es ligeramente más complejo. Si el mapa resultante del MDS clásico se toma y, luego, se ajusta de manera que las distancias de mapa entre los pares de elementos estén en el mismo orden de mayor a menor que los datos originales, es decir, el MDS isométrico. Este MDS isométrico es entonces útil cuando las unidades de distancia exacta son menos importantes que el rango del cual los pares de elementos están más separados o más cercanos.
Un ejemplo de uso del MDS clásico es la distancia en línea recta entre las ciudades de los EE. UU. para producir un mapa de los EE. UU. Un ejemplo de uso del MDS isométrico es producir un gráfico alimenticio multidimensional basado en cuán similar o diferente es el valor nutricional entre los alimentos, donde una clasificación de las distancias es más importante que una coordenada de unidad específica. Estos métodos se utilizan a menudo en un contexto de investigación de marketing para obtener el número y la naturaleza de las dimensiones perceptuales utilizadas por los clientes para juzgar la similitud entre los diferentes artículos.
Herramienta de Gallery
Esta herramienta no se instala automáticamente con Alteryx Designer o las herramientas R. Para utilizar esta herramienta, descárgala desde Alteryx Analytics Gallery.
Un flujo de datos configurado de cualquiera de estas dos maneras:
Un flujo de tres columnas con cada entrada que representa nombres de pares de elementos y su disimilitud.
Una matriz MxM con cada columna representando un elemento, cada fila representando un elemento, y cada intersección representando el valor de disimilitud. Para obtener más información, consulta https://en.wikipedia.org/wiki/Distance_matrix.
Usa la pestaña Opciones de modelos para configurar tu modelo.
Elegir tipo de entrada: selecciona si deseas utilizar el enfoque por pares de tres columnas o el enfoque de matriz de distancias para la entrada de información de disimilitud. Debes definir todas las distancias de par en cualquier caso; de lo contrario, se produce un error.
Número de dimensiones para la salida: selecciona el número de dimensiones que el mapa y los datos contendrán en las salidas de datos y gráficos. Debe tenerse en cuenta el nivel de varianza utilizando el gráfico de valores propios del informe para elegir el mejor número de dimensiones.
Elegir método de escalado multidimensional: elige entre usar algoritmos MDS clásicos o MDS isométricos.
Utiliza la pestaña Opciones de diagramas a fin de configurar los controles para el diagrama de salida.
Lista separada por comas de dimensiones para invertir: cualquier número de esta lista serán las dimensiones que tengan sus coordenadas de elemento multiplicadas por -1. Los algoritmos MDS seleccionan la polaridad de la dimensión de forma arbitraria y, a veces, pueden ser ayudados por la entrada del usuario. Por ejemplo, al crear un mapa de los Estados Unidos basado en las distancias entre ciudades, la dirección puede invertirse de lo que se sabe que es el caso.
Gráfico de barras de autovalores: esta marca de verificación decide si los valores propios y la explicación se incluyen o no en el resultado del informe. Esto es para ayudar a elegir el número de dimensiones a mantener en el mapa de los datos. Principalmente, el gráfico de barras ayuda a saber en qué punto las dimensiones adicionales incorporan solo datos de ruido o falsos en el mapa.
¿Reemplazar nombres de elementos por números en el gráfico para tener visibilidad?: el mapa puede contener demasiados elementos para identificar un nombre de otro. Esta marca de verificación decide si convertir o no todos los nombres de los elementos en identificadores de números (por ejemplo, “jack”, “jill”, “banana”, etc, versus x1, x2, x3, […] x987, x988, etc.).
Utiliza la pestaña Opciones de gráficos a fin de establecer los controles para la salida gráfica.
Tamaño del gráfico: selecciona pulgadas o centímetros para el tamaño del gráfico.
Resolución del gráfico: selecciona la resolución del gráfico en puntos por pulgada: 1x (96 dpi), 2x (192 dpi) o 3x (288 dpi).
La resolución más baja crea un archivo más pequeño y es mejor para ver en un monitor.
Una resolución más alta crea un archivo más grande con una mejor calidad para imprimir.
Tamaño de fuente base (puntos): selecciona el tamaño de la fuente del gráfico.
Conecta una herramienta Examinar a cada ancla de salida para ver los resultados.
Ancla D: (datos) contiene entradas para cada elemento y el valor de coordenadas de cada dimensión.
Ancla P: (grafico) contiene salidas de informe con configuraciones gráficas tal como se declararon en la configuración de la herramienta. (Opcional) tabla y gráfico que representan la varianza de cada dimensión con una explicación de qué son los valores propios. Graficos de cada par de dimensiones (por ejemplo, {1,2};{1,3};{1,4};{2,3};{2,4};{3,4}) con cada elemento representado por nombre u (opcionalmente) un identificador numérico.