La herramienta Reglas de MB toma los datos de las transacciones y, después de transformarlos, crea un conjunto de reglas de asociación utilizando el algoritmo Apriori o conjuntos de elementos frecuentes utilizando los algoritmos Apriori o Eclat. Se genera un informe resumido tanto de los datos de la transacción como de las reglas/conjuntos de elementos, junto con un objeto modelo que puede seguir investigándose en un proceso posterior.
Las reglas y los conjuntos de elementos difieren en que las reglas de asociación implican una relación causal específica entre los elementos de un grupo, mientras que los conjuntos de elementos consisten en grupos que frecuentemente ocurren conjuntamente en las transacciones. En el caso de las reglas de asociación, la presencia de algún subconjunto de elementos en una transacción (los elementos del lado izquierdo, o LHS) lleva a la inclusión de otros elementos en la transacción (los elementos del lado derecho, o RHS).
Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión en el portal Descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R. Consulta Descargar y usar herramientas predictivas.
Son posibles dos formatos diferentes de los datos de entrada. El primer formato consiste en registros que contienen un identificador de elemento único junto con un identificador para la transacción en la que el elemento estaba contenido (un conjunto de pares únicos de elemento-transacción). El segundo formato consiste en un solo registro por transacción que contiene una lista delimitada de elementos contenidos en la transacción.
Un elemento por registro con una clave de transacción: esta opción corresponde a los pares únicos de elemento-transacción. En esta opción, debes especificar dos campos en el flujo de datos utilizando las siguientes opciones:
Seleccionar el campo de clave de la transacción: el campo entero u orientado a cadenas que contiene el campo identificador de transacción.
Seleccionar el campo que contiene al identificador del elemento: el campo entero u orientado a cadenas que contiene los identificadores de elemento.
Una transacción por registro con todos los elementos en un solo campo (delimitado internamente): esta opción corresponde al formato en el que una transacción está contenida en un único registro. Para este formato, debes especificar dos campos en el flujo de datos utilizando las siguientes opciones:
Seleccionar el campo con los elementos de transacción delimitados: el campo orientado a cadenas que contiene las listas de elementos de transacción delimitados.
Proporcionar el carácter delimitador que se utilizará para separar elementos en una transacción: el carácter delimitador como una coma.
Se proporcionan los dos algoritmos más utilizados para encontrar reglas de asociación y conjuntos de elementos frecuentes: Apriori y Eclat.
El algoritmo Apriori emplea la búsqueda por niveles de tres tipos de conjuntos de elementos frecuentes (frecuentes, más frecuentes y frecuentes cerrados), reglas de asociación, o hyperedgesets de asociación.
El algoritmo Eclat utiliza operaciones de intersección simples para la agrupación en clústeres de clases de equivalencia junto con un recorrido de red de abajo hacia arriba para encontrar los tres tipos de conjuntos de elementos frecuentes. Además de seleccionar el método a utilizar, debes especificar qué buscar (por ejemplo, conjuntos de elementos, reglas o hyperedgesets). Las opciones son las siguientes…
Apriori: esta opción selecciona el algoritmo Apriori. Con este método, puedes encontrar conjuntos de elementos frecuentes, conjuntos de elementos más frecuentes, conjuntos de elementos frecuentes cerrados, reglas de asociación (el valor predeterminado) o hyperedgesets de asociación.
Eclat: esta opción selecciona el algoritmo Eclat para encontrar conjuntos de elementos. Especifica si se deben encontrar conjuntos de elementos frecuentes, conjuntos de elementos más frecuentes o conjuntos de elementos frecuentes cerrados.
Los parámetros de control influyen en la naturaleza de las reglas de asociación, los conjuntos de elementos frecuentes o los conjuntos de hyperedgesets de asociación que se extraen de los datos de la transacción. Estos parámetros son…
La cantidad mínima permisible de elementos en una regla o en un conjunto de elementos: este parámetro limita las reglas o conjuntos de elementos devueltos a contener al menos el número especificado de elementos. Por defecto, su valor se establece en 1 (también el valor mínimo), pero se puede establecer en un número más alto. Las opciones naturales para este parámetro son 1 o 2.
El nivel de soporte mínimo requerido para una regla o un conjunto de elementos: el soporte es la proporción de transacciones que contienen los elementos en el conjunto de elementos o regla de asociación. El valor predeterminado para este parámetro es 0,02, pero se puede establecer entre 0,002 y 1. En general, cuanto menor sea el valor de este parámetro, mayor será el número de reglas o conjuntos de elementos devueltos. En algunos casos, el número de reglas o conjuntos de elementos devueltos puede agotar la memoria del sistema disponible del usuario, por lo que no se debe usar un valor demasiado pequeño.
El nivel de confianza mínimo requerido para una regla o un conjunto de elementos (válido solo para Apriori): la confianza es la proporción de transacciones donde los elementos de RHS están en las transacciones que también contienen los elementos de LHS. En otras palabras, es una medida de la probabilidad de que los RHS estén en la transacción cuando los LHS también están en la transacción. Esta medida solo es aplicable en el caso del algoritmo Apriori. Al igual que con el parámetro de soporte, cuanto menor sea el valor de este parámetro, mayor será el número de reglas o conjuntos de elementos devueltos. En algunos casos, el número de reglas o conjuntos de elementos devueltos puede agotar la memoria del sistema disponible del usuario, por lo que no se debe usar un valor demasiado pequeño.