Skip to main content

Stepwise Tool Icon Strumento Graduale

Esempio di uno strumento

Lo strumento Graduale presenta l'opzione Esempio di uno strumento. Visita Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.

Lo strumento Graduale determina le migliori variabili predittive da includere in un modello, ricavandole da un set più grande di potenziali variabili predittive per i modelli di regressione lineari, logistici e altri modelli tradizionali.

Per implementare la regressione graduale, vengono utilizzati due approcci di base.

Il primo (conosciuto come selezione all'indietro) comporta l'utilizzo di un modello che include tutte le variabili che si ritiene possano influenzare la variabile target, per poi rimuovere in sequenza la variabile meno importante dal modello originale in base a una misura di bontà di adattamento che si adatta al numero di variabili incluse nel modello. Questo processo continua con la rimozione di altre variabili nei successivi passaggi all'indietro, fino a quando non ci sono ulteriori miglioramenti nella misura di adattamento rettificata.

Il secondo approccio di base (noto come selezione variabile in avanti) inizia con un modello che include solo una costante, per poi aggiungere a quel modello una variabile dal set di potenziali variabili, il che fornisce il massimo livello di miglioramento nella misura di adattamento rettificata. Questo processo viene ripetuto per aggiungere altre variabili da un set di passaggi all'indietro che terminano quando non vi sono ulteriori miglioramenti nella misura di adattamento rettificata. Nella base della selezione delle variabili all'indietro, una variabile che viene rimossa non viene mai più reinserita nei passaggi successivi, mentre nella selezione in avanti una variabile non viene mai rimossa nei passaggi successivi una volta aggiunta. È possibile utilizzare un approccio ibrido che inizia con un modello iniziale di grandi dimensioni ("massimale") e un primo passaggio all'indietro ma che poi, in ogni fase successiva, vedrà una valutazione sia dei movimenti in avanti che di quelli all'indietro.

Lo strumento di regressione graduale basato su Alteryx R utilizza sia una selezione di variabili all'indietro che una selezione mista di variabili all'indietro e in avanti. Per utilizzare lo strumento, devi prima creare un modello di regressione "massimale" che includa tutte le variabili importanti, quindi utilizzare lo strumento di regressione graduale per determinare quale di queste variabili deve essere rimossa in base a una misura di adattamento rettificata. L'utente ha a disposizione due diverse misure di adattamento rettificate, il criterio di informazione di Akaike (o AIC)** e il criterio di informazione Bayesiano (o BIC)***. Queste due misure sono simili, ma il BIC impone una penalità maggiore sul numero di variabili incluse nel modello, il che genera tipicamente un modello finale con meno variabili rispetto a quando si utilizza l'AIC.

Con questo strumento, quando i dati di input provengono da un flusso regolare di dati Alteryx, per la stima del modello viene utilizzata la funzione open source R. Se i dati di input provengono da uno strumento di output XDF o uno strumento di input XDF, per la stima del modello viene utilizzata la funzione Revo ScaleR. L'utilizzo della funzione basata su Revo ScaleR offre il vantaggio di analizzare set di dati molto più estesi (con memoria esaurita) con l'impossibilità di creare alcuni degli output di diagnostica del modello disponibili con le funzioni open source R.

Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Download e licenze di Alteryx per installare R e i pacchetti utilizzati dallo strumento R. Consulta la sezione Download e utilizzo degli strumenti predittivi.

Collegamento degli input

  • Il flusso di output dallo strumento Conteggio delle regressioni, Regressione lineare o Regressione logistica utilizzato per creare il modello "massimale". Il flusso può essere inserito in entrambi i lati dello strumento.

  • Lo stesso flusso di dati Alteryx o flusso di metadati XDF utilizzato per creare il modello "massimale". Il flusso può essere inserito in entrambi i lati dello strumento.

Configurazione dello strumento

Utilizza la scheda Configurazione per impostare i controlli per il modello graduale.

  • Il nome del nuovo modello: questo è il miglior modello trovato utilizzando la selezione della variabile graduale in base alla direzione di ricerca e ai criteri di selezione prescelti. I nomi dei modelli devono iniziare con una lettera e possono contenere lettere, numeri e i caratteri speciali punto (".") e trattino basso ("_"). Non sono consentiti altri caratteri speciali (come gli spazi) e lo strumento R fa distinzione tra maiuscole e minuscole.

  • Direzione di ricerca: specifica se la direzione di ricerca comporta passaggi in avanti e all'indietro (il metodo inizia con un passaggio all'indietro) o se sono utilizzati solo passaggi all'indietro.

  • Misura di adattamento rettificata: i criteri utilizzati per confrontare i diversi modelli e selezionare il modello migliore. Le scelte fornite sono il criterio di informazione di Akaike (AIC) o i criteri di informazione Bayesiani (BIC).

Utilizza la scheda Opzioni della grafica per impostare i controlli dell'output grafico.

  • Risoluzione grafico: selezionare la risoluzione del grafico in punti per pollice: 1x (96 dpi); 2x (192 dpi); o 3x (288 dpi).

    • La risoluzione inferiore crea un file più piccolo ed è ideale per la visualizzazione su un monitor.

    • Una risoluzione più alta crea un file più grande con una migliore qualità di stampa.

Visualizzazione dell'output

Connetti uno strumento Sfoglia a ogni ancoraggio di output per visualizzare i risultati.

  • Ancoraggio O: è costituito da una tabella del modello serializzato con il nome del modello e le dimensioni dell'oggetto.

  • Ancoraggio R: consiste nei frammenti di report generati dallo strumento Graduale, ossia riepilogo della statistica, Analisi della devianza di tipo II oppure i test ANOVA e i grafici diagnostici di base. La tabella Analisi della devianza di tipo II e i Grafici diagnostici di base non vengono generati quando l'input del modello proviene da uno strumento di output XDF o da uno di input XDF.

*https://en.wikipedia.org/wiki/Stepwise_regression **https://en.wikipedia.org/wiki/Akaike_information_criterion ***https://en.wikipedia.org/wiki/Bayesian_information_criterion