Strumento Regressione gamma
Esempio di uno strumento
Conteggio delle regressioni presenta l'opzione Esempio di uno strumento. Visita Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.
Correla una variabile di interesse Gamma distribuita, strettamente positiva e(variabile target) a una o più variabili (variabili di predittore) che si prevede abbiano un'influenza sulla variabile target.
In a number of applications, the values of the target variable are always strictly positive (i.e., are never zero or negative), but tend to cluster toward the lower range of the observed values, but in a small minority of cases take on large values. Target variables of this nature represent a data generation process that is not consistent with the Normality assumptions underlying the traditional linear regression model. However, the values are always positive and will not always be integer numbers, so they do not follow a Poisson distribution or Negative Binomial distribution based process. They are consistent with a process based on a Gamma distribution and can be estimated using methods similar to linear regression, via the generalized linear model framework.
Con questo strumento, se i dati di input provengono da un regolare flusso di dati Alteryx, viene utilizzata la funzione open source R glm per la stima del modello. Se l'input proviene da uno strumento Input XDF o da uno strumento Output XDF, viene utilizzata la funzione Revo ScaleR rxGlm per la stima del modello. Il vantaggio di utilizzare la funzione basata su Revo ScaleR è che consente di analizzare set di dati molto più estesi (con memoria esaurita), ma al costo di un ulteriore sovraccarico per creare un file XDF e dell'impossibilità di creare alcuni output di diagnostica del modello disponibili con la funzione open source R. Inoltre, può generare soltanto un modello di regressione Poisson.
Questo strumento utilizza lo strumento R. Vai a OpzioniScarica strumenti predittivi e accedi al portale Download e licenze Alteryx per installare R e i pacchetti utilizzati dallo strumento R. Consulta la sezione Download e utilizzo degli strumenti predittivi.
Connessione di un input
Collega un flusso di dati Alteryx o un flusso di metadati XDF che includa un campo target di interesse insieme a uno o più possibili campi predittivi.
Configura lo strumento
Utilizza la scheda Configurazione per impostare i controlli per il grafico della serie temporale.
Nome modello: è necessario assegnare un nome a ogni modello per poterlo identificare in futuro. I nomi dei modelli devono iniziare con una lettera e possono contenere lettere, numeri e i caratteri speciali punto (".") e trattino basso ("_"). Non sono consentiti altri caratteri speciali e la R fa distinzione tra maiuscole e minuscole.
Seleziona la variabile target: seleziona il campo dal flusso di dati da stimare.
Seleziona le variabili predittive: scegli i campi dal flusso di dati che ritieni "essere la causa" delle variazioni nel valore della variabile target. Le colonne contenenti identificatori univoci, come le chiavi primarie surrogate e le chiavi primarie naturali, non devono essere utilizzate nelle analisi statistiche. Non hanno alcun valore predittivo e possono causare eccezioni di runtime.
Model type: A dropdown box with the options of log, inverse, and identity. This option determines the link function to be used with the Gamma family in estimating the generalized linear model.
Usa pesi di campionamento per la valutazione del modello: fai clic sulla casella di controllo, quindi seleziona un campo del peso dal flusso di dati per stimare un modello che utilizza il peso di campionamento.
Utilizza il pannello Opzioni grafiche per impostare i controlli per l'output grafico (facoltativo).
Risoluzione grafico: seleziona la risoluzione del grafico in punti per pollice: 1x (96 dpi); 2x (192 dpi) o 3x (288 dpi).
La risoluzione inferiore crea un file più piccolo ed è ideale per la visualizzazione su un monitor.
Una risoluzione più alta crea un file più grande con una migliore qualità di stampa.
Visualizzazione dell'output
Ancoraggio O: consiste in una tabella del modello serializzato con il nome del modello.
Ancoraggio R: consiste nei frammenti di report generati dallo strumento Conteggio delle regressioni, ossia riepilogo della statistica, Analisi della devianza di tipo II (ANOD) e Grafici diagnostici di base. La tabella Analisi della devianza di tipo II e i Grafici diagnostici di base non vengono generati quando l'input del modello proviene da uno strumento di output XDF o da uno di input XDF.