Skip to main content

MB Affinity Tool Icon Herramienta Afinidad de MB

La herramienta Afinidad de MB toma datos de “transacciones” y construye una matriz en la que cada fila es una transacción y las columnas son el conjunto de “elementos” que podrían aparecer en la transacción. Si un elemento estaba presente en una transacción, tiene un valor de 1 en la matriz, y de 0 si no lo estaba. Posteriormente, la matriz se utiliza para construir una matriz de medidas de afinidad entre diferentes elementos con respecto a sus probabilidades de estar en la misma transacción. Como resultado, si hay 500 elementos, la matriz resultante tendrá 500 filas y columnas.

Esta herramienta se escala con la cantidad de registros de transacciones, pero está limitada en la cantidad de elementos únicos que puede manejar. En configuraciones comunes de computadoras portátiles y de escritorio, el límite probable es de 3000 a 5000 elementos únicos.

Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión en el portal Descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R. Consulta Descargar y usar herramientas predictivas.

Configurar la herramienta

  1. Seleccionar el campo de clave de la transacción: el campo seleccionado debe ser numérico y debe contener ID para las transacciones.

  2. Seleccionar el campo que contiene al identificador del elemento: el campo seleccionado debe contener nombres o identificadores de los elementos (para ser comparados).

  3. Medida de afinidad:

    • Distancia de coseno: medida de la distancia (es decir, disimilitud) entre dos elementos. El valor está entre 0 (más similar) y 1 (menos similar).

    • Similitud de coseno: una medida de similitud entre dos cadenas. El valor está entre 0 (menos similar) y 1 (más similar).

    • Coocurrencia: un recuento del número de transacciones en las que ambos elementos estaban presentes

  4. Cantidad de registros por fragmento de datos : Número máximo de registros a procesar simultáneamente.

https://en.wikipedia.org/wiki/Cosine_similarity