Modellazione assistita

Utilizza l'opzione Assistito per ottenere assistenza per la creazione di modelli di Machine Learning. Ti guida attraverso un processo passo dopo passo, che include la selezione di una destinazione e il metodo di Machine Learning, l'impostazione dei tipi di dati, la pulizia dei valori mancanti, la scelta delle funzionalità e la selezione dell'algoritmo migliore. Se non sei sicuro di quale algoritmo sia migliore, la Modellazione assistita ti consente di confrontare gli algoritmi nella classifica. Successivamente, è possibile aggiungere una pipeline al canvas di progettazione che contiene tutti gli strumenti di Modellazione assistita usati per eseguire il training del modello.

Importante

Per usare la modellazione assistita, è necessario utilizzare Strumento Dati di input per inserire i dati in Designer ed eseguire il collegamento allo strumento Modellazione assistita. Dopo aver selezionato Esegui , è possibile selezionare Avviare la modellazione assistita nella finestra di configurazione.

1. Selezione del target e del metodo di Machine Learning

Seleziona una destinazione e consenti alla modellazione assistita di selezionare il metodo di Machine Learning che desideri utilizzare per stimare la destinazione.

Nella sezione Target disponibili vengono elencati i nomi delle funzionalità nel set di dati. Seleziona la funzione che si desidera impostare come destinazione.
La modellazione assistita rileva automaticamente se la destinazione contiene dati categorici o numerici e seleziona il metodo di Machine Learning appropriato.
Seleziona Avanti per andare al Passaggio 2: selezione del livello di automazione .

Importante

La modellazione assistita assicura di aver scelto il target corretto prima di andare al passaggio successivo. Dopo di che, non è possibile modificare la destinazione senza riavviare l'intero processo. Seleziona Successivo se hai selezionato la destinazione corretta.

2. Selezione del livello di automazione

Seleziona se desideri che lo strumento costruisca la pipeline di Machine Learning o la modellazione assistita per l'utente attraverso il processo di procedura dettagliata.

Seleziona l'opzione di Procedura dettagliata o Automatico .
Seleziona Successivo .

Se si sceglie Procedura dettagliata , la modellazione assistita procede al passaggio 3: Impostazione dei tipi di dati .

Se scegli Automatico , la modellazione assistita illustra automaticamente i passaggi per creare la pipeline di Machine Learning: imposta i tipi di dati, pulisce i valori mancanti, seleziona le funzionalità e seleziona gli algoritmi. Quando lo strumento termina il processo, è possibile visualizzare l'output nella classifica.

3. Impostazione dei tipi di dati

Modellazione assistita imposta il tipo di dati per ogni funzionalità. Viene visualizzato un tipo di dati consigliato nella colonna Tipo di dati. L'opzione consigliata è etichettata (ad esempio, Numerico (scelta consigliata) ).

Seleziona una funzionalità per visualizzarne le informazioni nella sezione Dettagli colonna. In questo caso, è possibile visualizzare Probabilità del tipo di dati che indica la sicurezza di Assisted Modeling che una funzionalità sia un determinato tipo di dati. È inoltre possibile visualizzare un' anteprima , che contiene un esempio dei dati. Usa queste informazioni per assicurarti che i tipi di dati siano impostati correttamente.
Se una funzionalità è un tipo di dati errato, utilizzare l'elenco a discesa nella colonna Tipo di dati per selezionare il tipo di dati corretto.
Seleziona Avanti per andare al Passaggio 4: cancellazione dei valori mancanti .

Suggerimento

Se non sei sicuro del significato di un termine, controlla la sezione Glossario in Modellazione assistita. La sezione contiene informazioni utili su molti dei termini comuni utilizzati dai data scientist.

4. Cancellazione dei valori mancanti

La modellazione assistita pulisce i valori mancanti nei dati. Per ogni funzionalità che contiene valori mancanti, viene visualizzato un metodo consigliato per la pulizia dei valori mancanti nella colonna Metodo . L'opzione consigliata è etichettata (ad esempio, Sostituisci con mediana (scelta consigliata) ).

Seleziona una funzionalità per visualizzarne le informazioni nella sezione Dettagli colonna. Qui è possibile visualizzare il metodo di pulizia , che spiega come Modellazione assistita preleva il metodo per pulire i dati mancanti. È inoltre possibile visualizzare un' anteprima , che contiene un esempio dei dati. Usa queste informazioni per assicurarti di usare il metodo corretto per gestire i valori mancanti.
Se si desidera utilizzare un metodo di pulizia diverso, utilizzare l'elenco a discesa nella colonna Metodo per selezionare il metodo di pulizia corretto.
Seleziona Avanti per andare al Passaggio 5: selezione delle funzionalità .

5. Selezione delle funzionalità

La modellazione assistita consente di selezionare le funzionalità che generano il modello migliore. Per ogni funzionalità, valuta se si tratta di un buon predittore nella colonna Informazione sulla funzionalità

Seleziona una funzionalità per visualizzarne le informazioni nella sezione Dettagli colonna. Lì, puoi vedere Dettagli del predittore , che fornisce due misure che fornisce due misure delle prestazioni della funzione: Gini e GKT La modellazione assistita utilizza entrambe le misure per determinare se la funzionalità viene associata troppo o poco alla destinazione. È inoltre possibile visualizzare un' anteprima , che contiene un esempio dei dati. Usa queste informazioni per assicurarti che le funzionalità siano buone predittori.
Se non si desidera utilizzare una funzione, deselezionare la casella accanto al nome di tale funzione.
Seleziona Avanti per andare al Passaggio 6: selezione degli algoritmi .

6. Selezione degli algoritmi

La modellazione assistita offre una selezione di algoritmi tra cui scegliere. Si consiglia di usare algoritmi diversi a seconda del tipo di problema che si desidera risolvere. In questo passaggio si selezionano gli algoritmi da valutare nella classifica.

La scheda per ogni algoritmo visualizza i suoi pro e contro, una descrizione e alcuni casi d'uso. Usa queste informazioni per assicurarti di voler valutare l'algoritmo.
1. Per le variabili categoriche sono disponibili 4 algoritmi:
  1. Regressione logistica
  2. Albero decisionale
  3. Foresta casuale
  4. XGBoost
2. Per le variabili continue (numeriche) sono disponibili 3 algoritmi:
  1. Regressione lineare
  2. Albero decisionale
  3. Foresta casuale
Per valutare un algoritmo, seleziona la casella accanto al nome. Se non si desidera valutare un algoritmo, deselezionare la casella.
Seleziona Esegui gli algoritmi selezionati .

La classifica

La modellazione assistita genera la classifica, che è possibile utilizzare per confrontare le prestazioni degli algoritmi selezionati.

L'output nella classifica è diverso, a seconda del tipo di problema che si sta risolvendo, ma ecco le nozioni di base su come esplorare l'interfaccia utente:

Per visualizzare informazioni specifiche di un algoritmo, seleziona la relativa scheda nella sezione Classifica
Per visualizzare informazioni sul funzionamento di un algoritmo rispetto agli altri algoritmi, seleziona la scheda Confronto .
Per visualizzare informazioni sulle prestazioni individuali di un algoritmo, seleziona la scheda Panoramica .
Per visualizzare le funzionalità valutate di più da un algoritmo, seleziona la scheda Interpretazione
Per ricordare a se stessi le scelte effettuate durante il processo di modellazione assistita, seleziona la scheda Configurazione .
Per ricominciare da capo con la modellazione assistita ma mantenere le informazioni riportate nella classifica, seleziona Crea nuovo modello .
Per mostrare o nascondere la classifica, seleziona Nascondi classifica o Visualizza classifica .

Dopo aver determinato le prestazioni migliori degli algoritmi, è possibile selezionare quelle da aggiungere all'area di disegno di Designer come parte di una pipeline di Machine Learning che esegue il training del modello:

Seleziona la casella accanto al nome dell'algoritmo che desideri aggiungere all'area di disegno. Dovresti vedere un conteggio del numero di algoritmi che hai selezionato.
Seleziona Aggiungi modelli e prosegui al flusso di lavoro .

È possibile esportare un report contenente i risultati del modello.

Seleziona il menu con i 3 punti.
Dall'elenco a discesa, seleziona Esporta report HTML .
Seleziona la posizione in cui si desidera salvare il report utilizzando Esplora file.

Puoi esportare il codice per la pipeline di Machine Learning in Jupyter Notebook in uno strumento Python Tool.

Seleziona l'icona con i 3 punti.
Dall'elenco a discesa, seleziona Esporta modello in Python .
Quando si esce dalla finestra Modellazione assistita, nel flusso di lavoro viene visualizzato uno strumento Python. Contiene Jupyter Notebook annotato con tutto il codice per la pipeline di Machine Learning.