A ferramenta Regras de MB pega os dados de transação e, depois de transformá-los, cria um conjunto de regras de associação usando o algoritmo Apriori ou conjuntos de itens frequentes usando o algoritmo Apriori ou Eclat. Um relatório de resumo para os dados de transação e as regras/conjuntos de itens é gerado, junto com um objeto de modelo que pode ser investigado em mais detalhes em um processo posterior.
A diferença entre as regras e os conjuntos de itens é que as regras de associação indicam uma relação causal específica entre os itens de um grupo, e os conjuntos de itens consistem em grupos que frequentemente coexistem nas transações. No caso das regras de associação, a presença de um subconjunto de itens em uma transação (itens do lado esquerdo; em inglês, LHS, left-hand side) leva à inclusão de outros itens na transação (itens do lado direito; em inglês, RHS, right-hand side).
Essa ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no Portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Consulte Baixar e utilizar ferramentas preditivas.
São possíveis dois formatos diferentes dos dados de entrada. O primeiro formato consiste em registros que contêm um único identificador de item junto com um identificador para a transação em que o item estava contido (um conjunto de pares de item-transação exclusivos). O segundo formato consiste em um único registro por transação que contém uma lista delimitada de itens contidos na transação.
Um item por registro com uma chave identificadora de transação: essa opção corresponde aos pares de item-transação exclusivos. Nessa opção, você precisa especificar dois campos no fluxo de dados usando as opções:
Selecione o campo que contém as chaves de transação : o campo orientado por número inteiro ou cadeia de caracteres (string) que contém o campo do identificador da transação.
Selecione o campo que contém os identificadores dos itens: o campo orientado por número inteiro ou cadeias de caracteres (string) que contém os identificadores dos itens.
Uma transação por registro com todos os itens em um único campo (internamente delimitado ): essa opção corresponde ao formato em que uma transação está contida em um único registro. Para esse formato, você precisa especificar dois campos no fluxo de dados usando as opções:
Selecionar o campo com os itens de transação delimitados: o campo orientado por cadeia de caracteres (string) que contém as listas de itens de transação delimitados.
Fornecer o caractere delimitador usado para separar itens em uma transação: o caractere delimitador, como vírgula.
Os dois algoritmos mais usados para encontrar regras de associação e conjuntos de itens frequentes estão disponíveis: Apriori e Eclat.
O algoritmo Apriori aplica a pesquisa "level-wise" a três tipos de conjuntos de itens frequentes (frequentes, frequentes máximos e frequentes fechados), regras de associação ou conjuntos de hiperarestas de associação (hyperedgesets).
O algoritmo Eclat usa operações simples de interseção para clustering de classes de equivalência junto com a travessia de malha ascendente para encontrar os três tipos de conjuntos de itens frequentes. Você precisa selecionar o método e especificar o que é para encontrar (por exemplo, conjuntos de itens, regras ou conjuntos de hiperarestas). As opções são...
Apriori: essa opção seleciona o algoritmo Apriori. Com esse método, você pode encontrar conjuntos de itens frequentes, frequentes máximos e frequentes fechados, regras de associação (padrão) ou conjuntos de hiperarestas de associação.
Eclat: essa opção seleciona o algoritmo Eclat para encontrar conjuntos de itens. Especifique se deseja encontrar conjuntos de itens frequentes, frequentes máximos ou frequentes fechados.
Os parâmetros de controle influenciam a natureza das regras de associação, os conjuntos de itens frequentes ou os conjuntos de hiperarestas de associação que são extraídos dos dados de transação. Estes parâmetros são...
O número mínimo permitido de itens em uma regra ou em um conjunto de itens: esse parâmetro limita as regras ou os conjuntos de itens retornados para conter, no mínimo, o número especificado de itens. Por padrão, o valor está definido como 1 (que é também o valor mínimo), mas pode ser alterado para um número maior. As opções comuns para esse parâmetro são 1 ou 2.
O nível de suporte mínimo necessário para uma regra ou conjunto de itens: o suporte é a proporção de transações que contêm os itens no conjunto de itens ou na regra de associação. O valor padrão para esse parâmetro é 0.02, mas pode ser definido entre 0.002 e 1. Em geral, quanto menor o valor desse parâmetro, maior o número de regras ou conjuntos de itens retornados. Em alguns casos, o número de regras ou de conjuntos de itens retornados pode esgotar a memória disponível no sistema do usuário, portanto um valor muito pequeno não deve ser usado.
O nível de confiança mínimo necessário para uma regra ou para um conjunto de itens (válido apenas para Apriori): confiança é a proporção de transações em que os itens RHS estão nas mesmas transações que contêm os itens LHS. Em outras palavras, trata-se de uma medida da probabilidade de itens RHS estarem na transação quando itens LHS também estiverem. Essa medida é aplicável apenas no caso do algoritmo Apriori. Assim como no parâmetro de suporte, quanto menor o valor desse parâmetro, maior o número de regras ou de conjuntos de itens retornados. Em alguns casos, o número de regras ou de conjuntos de itens retornados pode esgotar a memória disponível no sistema do usuário, portanto um valor muito pequeno não deve ser usado.