Esempio di uno strumento
Lo strumento Regressione gamma presenta l'opzione Esempio di uno strumento. Visita Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.
Lo strumento Regressione gamma correla una variabile di interesse Gamma distribuita, strettamente positiva (variabile target), a una o più variabili (variabili predittive) che si prevede abbiano un'influenza sulla variabile target.
In un certo numero di applicazioni, i valori della variabile target sono sempre strettamente positivi (ad esempio, non sono mai uguali a zero o negativi), ma tendono a raggrupparsi verso l'intervallo più basso dei valori osservati e in una piccola minoranza dei casi assumono valori alti. Le variabili target di questa natura rappresentano un processo di generazione dei dati che non è coerente con le ipotesi di normalità implicite nel modello tradizionale di regressione lineare. Tuttavia, i valori sono sempre positivi ma non sempre numeri interi, pertanto non seguono una distribuzione di Poisson o un processo binominale negativo basato sulla distribuzione. I valori rimangono coerenti con un processo basato su una distribuzione gamma e possono essere stimati utilizzando metodi simili alla regressione lineare, attraverso il quadro del modello lineare generalizzato.
Con questo strumento, se i dati di input provengono da un regolare flusso di dati Alteryx, viene utilizzata la funzione open source R glm per la stima del modello. Se l'input proviene da uno strumento Input XDF o da uno strumento Output XDF, per la stima del modello viene utilizzata la funzione Revo ScaleR rxGlm. L'utilizzo della funzione basata su Revo ScaleR offre il vantaggio di analizzare set di dati molto più estesi (con memoria esaurita), ma al costo di un ulteriore sovraccarico per creare un file XDF e con l'impossibilità di creare alcuni output di diagnostica del modello disponibili con la funzione open source R.
Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Download e licenze di Alteryx per installare R e i pacchetti utilizzati dallo strumento R. Consulta la sezione Download e utilizzo degli strumenti predittivi.
Un flusso di dati Alteryx o di metadati XDF che include un campo target di interesse insieme a uno o più campi predittivi.
Utilizza la scheda Configurazione per impostare i controlli della regressione gamma.
Nome modello: è necessario assegnare un nome a ogni modello per poterlo identificare in futuro. I nomi dei modelli devono iniziare con una lettera e possono contenere lettere, numeri e i caratteri speciali punto (".") e trattino basso ("_"). Non sono consentiti altri caratteri speciali e lo strumento R fa distinzione tra maiuscole e minuscole.
Seleziona la variabile target: seleziona il campo dal flusso di dati da stimare.
Seleziona le variabili predittive: scegli i campi dal flusso di dati che ritieni "essere la causa" delle variazioni nel valore della variabile target. Le colonne contenenti identificatori univoci, come le chiavi primarie surrogate e le chiavi primarie naturali, non devono essere utilizzate nelle analisi statistiche. Non hanno alcun valore predittivo e possono causare eccezioni di runtime.
Tipo di modello: una casella a discesa con le opzioni di log, inverso e identità. Questa opzione determina la funzione di collegamento da utilizzare con la famiglia gamma per stimare il modello lineare generalizzato.
Utilizzare i pesi di campionamento nella stima del modello? (opzionale)...: fai clic sulla casella di spunta, quindi seleziona un campo del peso dal flusso di dati per stimare un modello che utilizza il peso di campionamento.
Utilizza la scheda Opzioni della grafica per impostare i controlli dell'output grafico.
Risoluzione grafico: seleziona la risoluzione del grafico in punti per pollice: 1x (96 dpi); 2x (192 dpi) o 3x (288 dpi).
La risoluzione inferiore crea un file più piccolo ed è ideale per la visualizzazione su un monitor.
Una risoluzione più alta crea un file più grande con una migliore qualità di stampa.
Ancoraggio O: consiste in una tabella del modello serializzato con il nome del modello.
Ancoraggio R: consiste nei frammenti di report generati dallo strumento Regressione gamma, ossia riepilogo della statistica, Analisi della devianza di tipo II (ANOD) e i grafici diagnostici di base. La tabella Analisi della devianza di tipo II e i grafici diagnostici di base non vengono generati quando l'input del modello proviene da uno strumento di output XDF o da uno di input XDF.