Skip to main content

MB Rules Tool Strumento Regole MB

Lo Strumento Regole MB acquisisce i dati delle transazioni e, dopo aver trasformato i dati, crea un insieme di regole di associazione utilizzando l'algoritmo Apriori o un set di elementi frequenti utilizzando gli algoritmi Apriori o Eclat. È stato prodotto un report di sintesi dei dati di transazione e delle regole/set di elementi, insieme a un oggetto del modello che può essere ulteriormente analizzato in un processo a valle.

Le regole e i set di elementi differiscono in quanto le regole di associazione implicano una relazione causale specifica tra gli elementi di un gruppo, mentre i set di elementi consistono in gruppi che spesso co-occorrono nelle transazioni. Nel caso delle regole di associazione, la presenza di alcuni sottoinsiemi di elementi in un’operazione (gli elementi di sinistra, o LHS) porta all’inclusione di altri elementi nell’operazione (gli elementi di destra, o RHS).

Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Download e licenze Alteryx per installare R e i pacchetti utilizzati dallo strumento R. Consulta la sezione Download e utilizzo degli strumenti predittivi.

Configurazione dello strumento

Struttura dei dati di input

Sono possibili due formati diversi dei dati di input. Il primo formato consiste in record che contengono un singolo identificatore dell'elemento insieme a un identificatore della transazione in cui l'elemento era contenuto (una serie di coppie univoche elemento-transazione). Il secondo formato consiste in un singolo record per transazione che contiene un elenco delimitato di voci contenute nella transazione.

  1. Un elemento per record con una chiave di transazione: questa opzione corrisponde alle coppie uniche elemento-transazione. In questa opzione, è necessario specificare 2 campi nel flusso di dati utilizzando le opzioni:

    • Seleziona il campo chiave di transazione: il campo orientato ai numeri interi o alle stringhe che contiene il campo identificativo della transazione.

    • Seleziona il campo che contiene l'identificatore dell'elemento: il campo orientato ai numeri interi o alle stringhe che contiene l'identificatore elemento.

  2. Una transazione per record con tutti gli elementi in un unico campo (delimitato internamente): questa opzione corrisponde al formato in cui una transazione è contenuta in un singolo record. Per questo formato è necessario specificare 2 campi nel flusso di dati utilizzando le opzioni:

    • Seleziona il campo con gli elementi di transazione delimitati: il campo orientato alla stringa che contiene gli elenchi degli elementi di transazione delimitati.

    • Fornisci il carattere delimitatore utilizzato per separare gli elementi in una transazione: il carattere delimitatore come una virgola.

Metodo da usare

Sono forniti i 2 algoritmi più comunemente usati per trovare regole di associazione e set di elementi frequenti: Apriori ed Eclat.

L'algoritmo Apriori impiega una ricerca a livelli per 3 tipi di insiemi frequenti (frequenti, massimamente frequenti e frequenti chiusi), regole di associazione o hyperedgeset di associazione.

L'algoritmo Eclat utilizza semplici operazioni di intersezione per il raggruppamento delle classi di equivalenza e la traversata del reticolo dal basso verso l'alto per trovare i 3 tipi di set di elementi frequenti. Oltre a selezionare il metodo da utilizzare, è necessario specificare cosa trovare (ad esempio, set di elementi, regole o hyperedgeset). Le opzioni sono:

  1. Apriori: questa opzione seleziona l'algoritmo Apriori. Con questo metodo, è possibile trovare insiemi di elementi frequenti, insiemi di elementi massimamente frequenti, insiemi frequenti chiusi, regole di associazione (l'impostazione predefinita) o hyperedgeset di associazione.

  2. Eclat: questa opzione consente di selezionare l'algoritmo Eclat per trovare i set di elementi. Specifica se devono essere trovati set di elementi frequenti, set di elementi massimi frequenti o set di elementi frequenti chiusi.

Parametri di controllo

I parametri di controllo influenzano la natura delle regole di associazione, dei set di elementi frequenti o degli hyperedgeset di associazione che vengono estratti dai dati delle transazioni. Questi parametri sono…

  1. Il numero minimo consentito di elementi in una regola o in un set di elementi: questo parametro limita le regole o i set di elementi restituiti a contenere almeno il numero di elementi specificato. Per impostazione predefinita, il suo valore è impostato su 1 (anche il valore minimo) ma può essere impostato su un numero più alto. Le scelte naturali per questo parametro sono 1 o 2.

  2. Il livello minimo di supporto richiesto per una regola o un set di elementi: il supporto è la proporzione di transazioni che contengono gli elementi nel set di elementi o nella regola di associazione. Il valore predefinito per questo parametro è 0,02 ma può essere impostato tra 0,002 e 1. In generale, più basso è il valore di questo parametro, maggiore è il numero di regole o set di elementi restituiti. In alcuni casi, il numero di regole o set di elementi restituiti può esaurire la memoria di sistema disponibile dell'utente, quindi non deve essere utilizzato un valore troppo piccolo.

  3. Il livello minimo di confidenza richiesto per una regola o un set di elementi (valido solo per Apriori): la confidenza è la proporzione di transazioni in cui gli elementi RHS si trovano nelle transazioni che contengono anche gli elementi LHS. In altre parole, è una misura della probabilità che gli elementi RHS siano presenti nella transazione quando anche quelli LHS sono presenti nella transazione. Questa misura è applicabile solo nel caso dell'algoritmo Apriori. Come per il parametro Supporto, più basso è il valore di questo parametro, maggiore è il numero di regole o set di elementi restituiti. In alcuni casi, il numero di regole o set di elementi restituiti può esaurire la memoria di sistema disponibile dell'utente, quindi non deve essere utilizzato un valore troppo piccolo.