Skip to main content

MB Rules Tool Outil Règles du PM

L'outil Règles du PM utilise les données de transaction et, après transformation des données, crée un jeu de règles d'association, à l'aide de l'algorithme Apriori ou des jeux d'éléments fréquents, à l'aide de l'algorithme Apriori ou Eclat. Un récapitulatif des données de transaction et des règles/jeux d’éléments est généré, avec un objet modèle qui peut être examiné plus en profondeur dans un processus en aval.

Les règles et les jeux d’éléments diffèrent dans le sens où les règles d’association impliquent une relation causale spécifique entre les éléments d’un groupe, tandis que les jeux d’éléments sont constitués de groupes qui présentent fréquemment une co-occurrence dans des transactions. Dans le cas de règles d’association, la présence d’un sous-ensemble d’éléments dans une transaction (éléments côté gauche ou LHS) entraîne l’inclusion d’autres éléments dans la transaction (éléments côté droit ou RHS).

Cet outil utilise l'outil R. Accédez à Options > Télécharger les outils prédictifs et connectez-vous au portail de licences et de téléchargements Alteryx pour installer R et les packages utilisés par l'outil R. Consultez la page Télécharger et utiliser les outils Prédictif.

Configuration de l'outil

Structure d'entrée de données

Deux formats différents sont possibles pour l’entrée de données. Le premier format est constitué d’enregistrements qui contiennent un seul identifiant d’élément, ainsi qu’un identifiant de la transaction dans laquelle l’élément est contenu (jeu de paires élément-transaction uniques). Le deuxième format est constitué d’un seul enregistrement par transaction qui contient une liste délimitée d’éléments contenus dans la transaction.

  1. Un élément par enregistrement avec une clé de transaction : cette option correspond aux paires élément-transaction uniques. Vous devez définir 2 champs dans le flux de données à l'aide de ces options :

    • Sélectionner le champ de clé de transaction : champ orienté entier ou chaîne qui contient le champ d'identifiant de transaction.

    • Sélectionner le champ contenant l'identifiant d'élément : champ orienté entier ou chaîne qui contient les identifiants d'élément.

  2. Une transaction par enregistrement et tous les éléments dans un seul champ (délimité en interne) : cette option correspond au format où une transaction est contenue dans un seul enregistrement. Pour ce format, vous devez définir 2 champs dans le flux de données à l'aide de ces options :

    • Sélectionner le champ avec les éléments de transaction délimités : champ orienté chaîne qui contient les listes d'éléments de transaction délimités.

    • Indiquer le caractère servant à séparer les éléments dans une transaction : caractère délimiteur, par exemple une virgule.

Méthode à utiliser

Les 2 algorithmes les plus couramment utilisés pour rechercher des règles d'association et les jeux d'éléments fréquents sont fournis : Apriori et Eclat.

L'algorithme Apriori utilise une recherche de niveau pour 3 types de jeux d'éléments fréquents (fréquent, fréquent maximal et fréquent fermé), les règles d'association ou les jeux hyperedge d'association.

L'algorithme Eclat utilise des opérations d'intersection simples pour le clustering de classe d'équivalence et la traversée en treillis de bas en haut pour rechercher les 3 types de jeux d'éléments fréquents. Outre la sélection de la méthode à utiliser, vous devez indiquer les éléments à rechercher (par exemple, jeux d'éléments, règles ou jeux hyperedge). Les options sont les suivantes :

  1. Apriori : cette option sélectionne l'algorithme Apriori. Grâce à cette méthode, vous pouvez rechercher les jeux d'éléments fréquents, très fréquents et fréquents fermés, les règles d'association (par défaut) ou les jeux hyperedge d'association.

  2. Eclat : cette option sélectionne l'algorithme Eclat pour rechercher des jeux d'éléments. Vous indiquez les éléments à rechercher : jeux d'éléments fréquents, très fréquents ou fréquents fermés.

Paramètre de contrôle

Les paramètres de contrôle influencent la nature des règles d’association, des jeux d’éléments fréquents ou des jeux hyperedge d’association extraits des données de transaction. Les paramètres sont les suivants...

  1. Nombre minimum autorisé d'éléments dans une règle ou un jeu d'éléments : ce paramètre limite les règles ou jeux d'éléments renvoyés à contenir au moins le nombre spécifié d'éléments. La valeur par défaut est 1 (valeur minimale), mais vous pouvez définir une valeur supérieure. La valeur naturelle pour ce paramètre est 1 ou 2.

  2. Niveau de support minimum requis pour une règle ou un jeu d'éléments : le support est la proportion de transactions qui contiennent les éléments dans la règle de jeu d'éléments ou d'association. La valeur par défaut de ce paramètre est 0,02, mais elle peut être définie entre 0,002 et 1. En général, plus la valeur de ce paramètre est faible, plus le nombre de règles ou de jeux d’éléments renvoyés est important. Dans certains cas, le nombre de règles ou de jeux d'éléments renvoyés peut occuper toute la mémoire système disponible. Il est donc conseillé de ne pas utiliser une valeur trop faible.

  3. Niveau d'importance minimum d'une règle ou d'un jeu d'éléments à intégrer dans les diagrammes (valide uniquement pour Apriori) : la confiance est la proportion de transactions pour lesquelles les éléments RHS figurent dans les transactions qui contiennent également les éléments LHS. En d’autres termes, il s’agit d’une mesure de la probabilité que les éléments RHS seront dans la transaction lorsque les éléments LHS seront également dans la transaction. Cette mesure ne s’applique que dans le cas de l’algorithme Apriori. Tout comme pour le paramètre de support, plus la valeur de ce paramètre est faible, plus le nombre de règles ou de jeux d’éléments renvoyés est important. Dans certains cas, le nombre de règles ou de jeux d'éléments renvoyés peut occuper toute la mémoire système disponible. Il est donc conseillé de ne pas utiliser une valeur trop faible.