Herramienta Regresión gamma
Ejemplo de cada herramienta
La herramienta Conteo de regresiones tiene un ejemplo de uso. Visita Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.
Relaciona una variable estrictamente positiva con distribución Gamma de interés (variable de destino) a una o más variables (variables predictoras) que se espere tengan alguna influencia sobre la variable de destino.
In a number of applications, the values of the target variable are always strictly positive (i.e., are never zero or negative), but tend to cluster toward the lower range of the observed values, but in a small minority of cases take on large values. Target variables of this nature represent a data generation process that is not consistent with the Normality assumptions underlying the traditional linear regression model. However, the values are always positive and will not always be integer numbers, so they do not follow a Poisson distribution or Negative Binomial distribution based process. They are consistent with a process based on a Gamma distribution and can be estimated using methods similar to linear regression, via the generalized linear model framework.
Con esta herramienta, si los datos de entrada vienen de un flujo de datos de Alteryx normal, se utiliza la función glm de R de código abierto para la estimación del modelo. Si la entrada viene de una herramienta Entrada XDF o de una herramienta Salida XDF, se utiliza la función rxGlm de RevoScaleR para la estimación del modelo. La ventaja de utilizar la función basada en RevoScaleR es que permite analizar conjuntos de datos mucho más grandes (sin memoria), pero a costa de una sobrecarga adicional para crear un archivo XDF y la incapacidad de crear parte de la salida de diagnóstico del modelo que está disponible con las funciones de código abierto R, y solo puede producir un modelo de regresión de Poisson.
Esta herramienta utiliza la herramienta R. Dirígete a Opciones> Descargar herramientas predictivase inicia sesión en el portal de Descargas y licencias de Alteryxpara instalar R y los paquetes utilizados por la herramienta R. Visita Descargar y usar herramientas predictivas.
Conectar una entrada
Conecta un flujo de datos de Alteryx o un flujo de metadatos XDF que incluya un campo objetivo de interés junto con uno o más campos predictores posibles.
Configurar la herramienta
Utiliza la pestaña Configuración para establecer los controles para el gráfico de serie temporal.
Nombre del modelo: cada modelo debe tener un nombre para su posterior identificación. Los nombres del modelo deben comenzar con una letra y pueden contener letras, números y los caracteres especiales de punto (“.”) y guion bajo (“_”). No se permite el uso de otros caracteres especiales. Además, R distingue entre mayúsculas y minúsculas.
Selecciona la variable objetivo: selecciona el campo del flujo de datos que deseas predecir.
Selecciona los campos predictores: selecciona los campos del flujo de datos que crees que “causan” los cambios en el valor de la variable objetivo. Las columnas que contienen identificadores únicos, como claves primarias sustitutas y claves primarias naturales, no deben utilizarse en análisis estadísticos. No tienen ningún valor predictivo y pueden causar excepciones en tiempo de ejecución.
Model type: A dropdown box with the options of log, inverse, and identity. This option determines the link function to be used with the Gamma family in estimating the generalized linear model.
Utilizar ponderaciones de muestreo para la estimación del modelo: haz clic en la casilla y, luego, selecciona un campo de ponderación del flujo de datos para estimar un modelo que utilice ponderación de muestreo.
Utiliza la pestaña Opciones de gráficos para establecer los controles para la salida gráfica (opcional).
Resolución del gráfico: selecciona la resolución del gráfico en puntos por pulgada: 1x (96 ppp); 2x (192 ppp); o 3x (288 ppp).
La resolución más baja crea un archivo más pequeño y es mejor para ver en un monitor.
Una resolución más alta crea un archivo más grande con una mejor calidad para imprimir.
Ver la salida
Ancla O: consta de una tabla del modelo serializado con el nombre del modelo.
Ancla R: consta de los fragmentos de informes generados por la herramienta Conteo de regresiones: un resumen estadístico, un análisis de desviación de tipo II (ANOD) y gráficos de diagnóstico básicos. La tabla de análisis de desviación de tipo II y los gráficos de diagnóstico básicos no se producen cuando la entrada del modelo proviene de una herramienta Salida XDF o Entrada XDF.