La herramienta Afinidad de MB toma datos de “transacciones” y construye una matriz en la que cada fila es una transacción y las columnas son el conjunto de “elementos” que podrían aparecer en la transacción. Si un elemento estaba presente en una transacción, tiene un valor de 1 en la matriz, y de 0 si no lo estaba. Posteriormente, la matriz se utiliza para construir una matriz de medidas de afinidad entre diferentes elementos con respecto a sus probabilidades de estar en la misma transacción. Como resultado, si hay 500 elementos, la matriz resultante tendrá 500 filas y columnas.
Esta herramienta se escala con la cantidad de registros de transacciones, pero está limitada en la cantidad de elementos únicos que puede manejar. En configuraciones comunes de computadoras portátiles y de escritorio, el límite probable es de 3000 a 5000 elementos únicos.
Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión en el portal Descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R. Consulta Descargar y usar herramientas predictivas.
Seleccionar el campo de clave de la transacción: el campo seleccionado debe ser numérico y debe contener ID para las transacciones.
Seleccionar el campo que contiene al identificador del elemento: el campo seleccionado debe contener nombres o identificadores de los elementos (para ser comparados).
Medida de afinidad:
Distancia de coseno: medida de la distancia (es decir, disimilitud) entre dos elementos. El valor está entre 0 (más similar) y 1 (menos similar).
Similitud de coseno: una medida de similitud entre dos cadenas. El valor está entre 0 (menos similar) y 1 (más similar).
Coocurrencia: un recuento del número de transacciones en las que ambos elementos estaban presentes
Cantidad de registros por fragmento de datos : Número máximo de registros a procesar simultáneamente.