Lo Strumento Regole MB acquisisce i dati delle transazioni e, dopo aver trasformato i dati, crea un insieme di regole di associazione utilizzando l'algoritmo Apriori o un set di elementi frequenti utilizzando gli algoritmi Apriori o Eclat. È stato prodotto un report di sintesi dei dati di transazione e delle regole/set di elementi, insieme a un oggetto del modello che può essere ulteriormente analizzato in un processo a valle.
Le regole e i set di elementi differiscono in quanto le regole di associazione implicano una relazione causale specifica tra gli elementi di un gruppo, mentre i set di elementi consistono in gruppi che spesso co-occorrono nelle transazioni. Nel caso delle regole di associazione, la presenza di alcuni sottoinsiemi di elementi in un’operazione (gli elementi di sinistra, o LHS) porta all’inclusione di altri elementi nell’operazione (gli elementi di destra, o RHS).
Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Download e licenze Alteryx per installare R e i pacchetti utilizzati dallo strumento R. Consulta la sezione Download e utilizzo degli strumenti predittivi.
Sono possibili due formati diversi dei dati di input. Il primo formato consiste in record che contengono un singolo identificatore dell'elemento insieme a un identificatore della transazione in cui l'elemento era contenuto (una serie di coppie univoche elemento-transazione). Il secondo formato consiste in un singolo record per transazione che contiene un elenco delimitato di voci contenute nella transazione.
Un elemento per record con una chiave di transazione: questa opzione corrisponde alle coppie uniche elemento-transazione. In questa opzione, è necessario specificare 2 campi nel flusso di dati utilizzando le opzioni:
Seleziona il campo chiave di transazione: il campo orientato ai numeri interi o alle stringhe che contiene il campo identificativo della transazione.
Seleziona il campo che contiene l'identificatore dell'elemento: il campo orientato ai numeri interi o alle stringhe che contiene l'identificatore elemento.
Una transazione per record con tutti gli elementi in un unico campo (delimitato internamente): questa opzione corrisponde al formato in cui una transazione è contenuta in un singolo record. Per questo formato è necessario specificare 2 campi nel flusso di dati utilizzando le opzioni:
Seleziona il campo con gli elementi di transazione delimitati: il campo orientato alla stringa che contiene gli elenchi degli elementi di transazione delimitati.
Fornisci il carattere delimitatore utilizzato per separare gli elementi in una transazione: il carattere delimitatore come una virgola.
Sono forniti i 2 algoritmi più comunemente usati per trovare regole di associazione e set di elementi frequenti: Apriori ed Eclat.
L'algoritmo Apriori impiega una ricerca a livelli per 3 tipi di insiemi frequenti (frequenti, massimamente frequenti e frequenti chiusi), regole di associazione o hyperedgeset di associazione.
L'algoritmo Eclat utilizza semplici operazioni di intersezione per il raggruppamento delle classi di equivalenza e la traversata del reticolo dal basso verso l'alto per trovare i 3 tipi di set di elementi frequenti. Oltre a selezionare il metodo da utilizzare, è necessario specificare cosa trovare (ad esempio, set di elementi, regole o hyperedgeset). Le opzioni sono:
Apriori: questa opzione seleziona l'algoritmo Apriori. Con questo metodo, è possibile trovare insiemi di elementi frequenti, insiemi di elementi massimamente frequenti, insiemi frequenti chiusi, regole di associazione (l'impostazione predefinita) o hyperedgeset di associazione.
Eclat: questa opzione consente di selezionare l'algoritmo Eclat per trovare i set di elementi. Specifica se devono essere trovati set di elementi frequenti, set di elementi massimi frequenti o set di elementi frequenti chiusi.
I parametri di controllo influenzano la natura delle regole di associazione, dei set di elementi frequenti o degli hyperedgeset di associazione che vengono estratti dai dati delle transazioni. Questi parametri sono…
Il numero minimo consentito di elementi in una regola o in un set di elementi: questo parametro limita le regole o i set di elementi restituiti a contenere almeno il numero di elementi specificato. Per impostazione predefinita, il suo valore è impostato su 1 (anche il valore minimo) ma può essere impostato su un numero più alto. Le scelte naturali per questo parametro sono 1 o 2.
Il livello minimo di supporto richiesto per una regola o un set di elementi: il supporto è la proporzione di transazioni che contengono gli elementi nel set di elementi o nella regola di associazione. Il valore predefinito per questo parametro è 0,02 ma può essere impostato tra 0,002 e 1. In generale, più basso è il valore di questo parametro, maggiore è il numero di regole o set di elementi restituiti. In alcuni casi, il numero di regole o set di elementi restituiti può esaurire la memoria di sistema disponibile dell'utente, quindi non deve essere utilizzato un valore troppo piccolo.
Il livello minimo di confidenza richiesto per una regola o un set di elementi (valido solo per Apriori): la confidenza è la proporzione di transazioni in cui gli elementi RHS si trovano nelle transazioni che contengono anche gli elementi LHS. In altre parole, è una misura della probabilità che gli elementi RHS siano presenti nella transazione quando anche quelli LHS sono presenti nella transazione. Questa misura è applicabile solo nel caso dell'algoritmo Apriori. Come per il parametro Supporto, più basso è il valore di questo parametro, maggiore è il numero di regole o set di elementi restituiti. In alcuni casi, il numero di regole o set di elementi restituiti può esaurire la memoria di sistema disponibile dell'utente, quindi non deve essere utilizzato un valore troppo piccolo.