Skip to main content

Distribution Analysis Tool Icon Herramienta Análisis de distribución

Ejemplo de cada herramienta

Análisis de distribución tiene un ejemplo de uso. Consulta Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.

Usar Análisis de distribución te permite adaptar al menos una distribución a los datos de entrada y compararla en función de distintas estadísticas de aptitud*. Puedes determinar qué distribución representa mejor los datos usando la importancia estadística (valor p) de los resultados de estas pruebas.

La herramienta Análisis de distribución te ayuda al intentar entender la naturaleza general de tus datos, así como también tomar decisiones acerca de cómo analizarlos. Por ejemplo, los datos que se ajustan a una distribución normal probablemente sean adecuados para una regresión lineal, mientras que los datos distribuidos Gamma pueden ser más adecuados para el análisis mediante la herramienta Regresión gamma.

Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión en el portal Descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R. Visita Descargar y usar herramientas predictivas.

Configurar la herramienta

Pestaña de configuración

Utiliza la pestaña Configuración para establecer los controles obligatorios del análisis de distribución.

  1. Seleccionar un campo para el análisis: selecciona un campo de los datos de entrada para el análisis.

  2. Seleccionar distribuciones para la comparación: selecciona una o más distribuciones para comparar. Las opciones de distribución son:

    • Normal: una distribución de probabilidad continua que ocurre comúnmente y que se utiliza a menudo tanto en las ciencias naturales como en las sociales para representar variables aleatorias de valor real (en otras palabras, variables aleatorias continuas que pueden tomar valores positivos y negativos).

    • Lognormal: distribución de probabilidad continua de una variable aleatoria cuyo logaritmo se distribuye normalmente. Esta distribución es adecuada para la descripción de fenómenos naturales como la tasa de crecimiento y la distribución de tamaño. Además, a menudo se utiliza para describir la distribución del ingreso en una población suficientemente grande.

    • Weibull: una distribución relativamente flexible que está estrechamente relacionada con la distribución exponencial. Se encuentra con frecuencia en datos que describen tasas de "falla" de algún tipo, por ejemplo, falla mecánica aleatoria, mortalidad, rotación, tasas de desgaste mecánico, etc.

    • Gamma: una distribución de probabilidad continua caracterizada por una concentración significativa de casos en valores inferiores no enteros y no negativos, al tiempo que permite la posibilidad razonable de valores mucho más altos. La distribución Gamma tiene una amplia gama de usos y se encuentra comúnmente en datos que describen cantidades agregadas (o promedio) por caso, por ejemplo, el tamaño promedio de una reclamación de seguro, medido por individuo.

Las distribuciones Lognormal, Weibull y Gamma solo funcionan para datos no negativos.

Las columnas que contienen identificadores únicos, como claves primarias sustitutas y claves primarias naturales, no deben utilizarse en análisis estadísticos. No tienen ningún valor predictivo y pueden causar excepciones en tiempo de ejecución.

Pestaña "Opciones de gráficos"

Utiliza la pestaña Opciones de gráficos para establecer los controles para la salida gráfica.

  • Tamaño del gráfico: selecciona pulgadas o centímetros para el tamaño del gráfico y establece los valores de Ancho y Alto.

  • Resolución del gráfico: selecciona la resolución del gráfico en puntos por pulgada: 1x (96 dpi), 2x (192 dpi) o 3x (288 dpi).

    • La resolución más baja crea un archivo más pequeño y es mejor para ver en un monitor.

    • Una resolución más alta crea un archivo más grande con una mejor calidad para imprimir.

Ver la salida

Un conjunto de fragmentos de informe que incluye un histograma, estadísticas de resumen básicas de los resultados de la prueba, estadísticas de aptitud, cuantiles de datos por distribución y los parámetros de distribución.

*D'Agostino, R., Stephens, M.A. (1986) Goodness of Fit Techniques.