Skip to main content

Multidimensional Scaling Tool Icon Ferramenta Escalonamento Multidimensional

O Escalonamento Multidimensional (MDS, Multidimensional Scaling) é um método de separação de dados univariados com base na variância. Conceitualmente, o MDS captura as dissimilaridades, ou distâncias, entre os itens descritos nos dados e gera um mapa entre os itens. O número de dimensões nesse mapa é geralmente fornecido pelo analista antes da geração. Normalmente, a dimensão de variância mais alta corresponde às maiores distâncias descritas nos dados. A solução de mapa é baseada em dados univariados, portanto, a rotação e a orientação das dimensões do mapa não são significativas. O MDS usa uma análise dimensional semelhante à da ferramenta Componentes Principais. Para obter mais informações, consulte https://en.wikipedia.org/wiki/Multidimensional_scaling.

Dois tipos de MDS são implementados nesta ferramenta: MDS clássico e MDS isométrico. O MDS clássico é a abordagem simples e rápida. Ele gera um mapa reduzindo o erro entre as distâncias fornecidas entre os itens e a distância cartesiana entre os itens no mapa. O MDS isométrico é um pouco mais complexo. Se o mapa resultante do MDS clássico é gerado e depois ajustado de modo que as distâncias do mapa entre os pares de itens estejam na mesma ordem de maior para menor como a dos dados originais, trata-se então do MDS isométrico. O MDS isométrico é útil quando as unidades de distância exatas são menos importantes do que o ranking de quais pares de itens estão mais distantes ou mais próximos.

Um exemplo de uso do MDS clássico é a distância em linha reta entre cidades nos EUA para gerar um mapa dos EUA. Um exemplo de uso do MDS isométrico é para desenvolver um gráfico alimentar multidimensional, que usa como base o grau de similaridade ou de diferença do valor nutricional entre os itens alimentares, em que um ranking das distâncias é mais importante do que uma coordenada unitária específica. Esses métodos costumam ser usados em um contexto de pesquisa de marketing para obter o número e a natureza das dimensões perceptivas usadas pelos clientes para avaliar a similaridade entre itens diferentes.

Ferramenta Gallery

Essa ferramenta não é instalada automaticamente com o Alteryx Designer, nem com as ferramentas R. Para usá-la, faça o download em Alteryx Analytics Gallery.

Conectar uma entrada

Um fluxo de dados configurado de uma destas duas formas:

  1. Um fluxo de três colunas com cada entrada representando os nomes dos pares de itens e a sua dissimilaridade.

  2. Uma matriz MxM com cada coluna e cada linha representando um item e cada interseção representando o valor de dissimilaridade. Para obter mais informações, consulte https://pt.wikipedia.org/wiki/Matriz_de_distâncias.

Configurar a ferramenta

Guia "Opções de modelo"

Use a guia Opções de modelo para configurar seu modelo.

  1. Escolher tipo da entrada: selecione se deseja usar a abordagem pareada ("pairwise") de três colunas ou a abordagem de matriz de distância para entrada de informações de dissimilaridade. Você deve definir as distâncias de todos os pares em ambos os casos, caso contrário, haverá um erro.

  2. Número de dimensões na saída: selecione o número de dimensões que o mapa e os dados incluirão nas saídas de dados e de gráficos. Convém considerar o nível de variância usando o gráfico de autovalor (eigenvalue) no relatório para escolher o melhor número de dimensões.

  3. Escolher o método de escalonamento multidimensional: escolha entre os algoritmos MDS clássico ou MDS isométrico.

Guia "Opções de gráfico"

Use a guia Opções de gráfico para definir os controles para o gráfico de saída.

  1. Lista separada por vírgula de dimensões para inverter: os números nessa lista são as dimensões que têm as coordenadas de seus itens multiplicadas por -1. Os algoritmos MDS escolhem arbitrariamente a polaridade da dimensão e, às vezes, podem ser ajudados pela entrada do usuário. Por exemplo, ao criar um mapa dos EUA com base nas distâncias entre as cidades, a direção pode ser a reversa da que é conhecida como a direção habitual.

  2. Gráfico de barras de autovalores: esta marca de verificação determina se os autovalores e a explicação serão ou não incluídos na saída do relatório. Isto serve para ajudar a escolher o número de dimensões que serão mantidas no mapa dos dados. Principalmente, o gráfico de barras ajuda a saber em que ponto as dimensões adicionais incorporam no mapa apenas dados com ruídos ou falsos.

  3. Substituir nomes de itens por números no gráfico para visibilidade?: o mapa pode conter um número excessivo de itens para identificar um nome de outro nome. Esta marca de verificação determina se é ou não para converter todos os nomes de itens em IDs numéricos (por exemplo, "jack", "jill", "banana" etc. convertidos em x1, x2, x3... x987, x988 etc.).

Guia "Opções de gráfico"

Use a guia Opções de gráfico para definir os controles para o gráfico de saída.

  • Tamanho do gráfico: selecione polegadas ou centímetros para o tamanho do gráfico.

  • Resolução do gráfico: selecione a resolução do gráfico em pontos por polegada: 1x (96 dpi), 2x (192 dpi) ou 3x (288 dpi).

    • Resoluções mais baixas geram um arquivo menor que é melhor para visualização em um monitor.

    • Resoluções mais altas geram um arquivo maior e com melhor qualidade de impressão.

  • Tamanho da fonte base (pontos): selecione o tamanho da fonte para o gráfico.

Visualizar a saída

Conecte uma ferramenta Navegar a cada âncora de saída para exibir os resultados.

  • Âncora D (Dados): contém entradas para cada item e o valor de coordenadas de cada dimensão.

  • Âncora P (Gráfico): contém saídas de relatório com configurações gráficas conforme declarado na configuração da ferramenta: (opcional) tabela e gráfico que representam a variância de cada dimensão com uma explicação do que são os autovalores. Gráficos de cada par de dimensões (por exemplo, {1,2};{1,3};{1,4};{2,3};{2,4};{3,4}) com cada item representado por nome ou (opcionalmente) por um identificador numérico.