Skip to main content

MB Rules Tool Ferramenta Regras de MB

A ferramenta Regras de MB pega os dados de transação e, depois de transformá-los, cria um conjunto de regras de associação usando o algoritmo Apriori ou conjuntos de itens frequentes usando o algoritmo Apriori ou Eclat. Um relatório de resumo para os dados de transação e as regras/conjuntos de itens é gerado, junto com um objeto de modelo que pode ser investigado em mais detalhes em um processo posterior.

A diferença entre as regras e os conjuntos de itens é que as regras de associação indicam uma relação causal específica entre os itens de um grupo, e os conjuntos de itens consistem em grupos que frequentemente coexistem nas transações. No caso das regras de associação, a presença de um subconjunto de itens em uma transação (itens do lado esquerdo; em inglês, LHS, left-hand side) leva à inclusão de outros itens na transação (itens do lado direito; em inglês, RHS, right-hand side).

Essa ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no Portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Consulte Baixar e utilizar ferramentas preditivas.

Configurar a ferramenta

Estrutura de dados de entrada

São possíveis dois formatos diferentes dos dados de entrada. O primeiro formato consiste em registros que contêm um único identificador de item junto com um identificador para a transação em que o item estava contido (um conjunto de pares de item-transação exclusivos). O segundo formato consiste em um único registro por transação que contém uma lista delimitada de itens contidos na transação.

  1. Um item por registro com uma chave identificadora de transação: essa opção corresponde aos pares de item-transação exclusivos. Nessa opção, você precisa especificar dois campos no fluxo de dados usando as opções:

    • Selecione o campo que contém as chaves de transação : o campo orientado por número inteiro ou cadeia de caracteres (string) que contém o campo do identificador da transação.

    • Selecione o campo que contém os identificadores dos itens: o campo orientado por número inteiro ou cadeias de caracteres (string) que contém os identificadores dos itens.

  2. Uma transação por registro com todos os itens em um único campo (internamente delimitado ): essa opção corresponde ao formato em que uma transação está contida em um único registro. Para esse formato, você precisa especificar dois campos no fluxo de dados usando as opções:

    • Selecionar o campo com os itens de transação delimitados: o campo orientado por cadeia de caracteres (string) que contém as listas de itens de transação delimitados.

    • Fornecer o caractere delimitador usado para separar itens em uma transação: o caractere delimitador, como vírgula.

Método para usar

Os dois algoritmos mais usados para encontrar regras de associação e conjuntos de itens frequentes estão disponíveis: Apriori e Eclat.

O algoritmo Apriori aplica a pesquisa "level-wise" a três tipos de conjuntos de itens frequentes (frequentes, frequentes máximos e frequentes fechados), regras de associação ou conjuntos de hiperarestas de associação (hyperedgesets).

O algoritmo Eclat usa operações simples de interseção para clustering de classes de equivalência junto com a travessia de malha ascendente para encontrar os três tipos de conjuntos de itens frequentes. Você precisa selecionar o método e especificar o que é para encontrar (por exemplo, conjuntos de itens, regras ou conjuntos de hiperarestas). As opções são...

  1. Apriori: essa opção seleciona o algoritmo Apriori. Com esse método, você pode encontrar conjuntos de itens frequentes, frequentes máximos e frequentes fechados, regras de associação (padrão) ou conjuntos de hiperarestas de associação.

  2. Eclat: essa opção seleciona o algoritmo Eclat para encontrar conjuntos de itens. Especifique se deseja encontrar conjuntos de itens frequentes, frequentes máximos ou frequentes fechados.

Parâmetros de controle

Os parâmetros de controle influenciam a natureza das regras de associação, os conjuntos de itens frequentes ou os conjuntos de hiperarestas de associação que são extraídos dos dados de transação. Estes parâmetros são...

  1. O número mínimo permitido de itens em uma regra ou em um conjunto de itens: esse parâmetro limita as regras ou os conjuntos de itens retornados para conter, no mínimo, o número especificado de itens. Por padrão, o valor está definido como 1 (que é também o valor mínimo), mas pode ser alterado para um número maior. As opções comuns para esse parâmetro são 1 ou 2.

  2. O nível de suporte mínimo necessário para uma regra ou conjunto de itens: o suporte é a proporção de transações que contêm os itens no conjunto de itens ou na regra de associação. O valor padrão para esse parâmetro é 0.02, mas pode ser definido entre 0.002 e 1. Em geral, quanto menor o valor desse parâmetro, maior o número de regras ou conjuntos de itens retornados. Em alguns casos, o número de regras ou de conjuntos de itens retornados pode esgotar a memória disponível no sistema do usuário, portanto um valor muito pequeno não deve ser usado.

  3. O nível de confiança mínimo necessário para uma regra ou para um conjunto de itens (válido apenas para Apriori): confiança é a proporção de transações em que os itens RHS estão nas mesmas transações que contêm os itens LHS. Em outras palavras, trata-se de uma medida da probabilidade de itens RHS estarem na transação quando itens LHS também estiverem. Essa medida é aplicável apenas no caso do algoritmo Apriori. Assim como no parâmetro de suporte, quanto menor o valor desse parâmetro, maior o número de regras ou de conjuntos de itens retornados. Em alguns casos, o número de regras ou de conjuntos de itens retornados pode esgotar a memória disponível no sistema do usuário, portanto um valor muito pequeno não deve ser usado.