Ejemplo de cada herramienta
Resumen de campos tiene un ejemplo de uso. Consulta Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.
Utiliza el Resumen de campos para analizar datos y crear un informe de resumen que contenga estadísticas descriptivas de los datos en las columnas seleccionadas. Utiliza la herramienta para conocer mejor los datos y recibir recomendaciones para gestionarlos.
Los datos numéricos, de cadena, espaciales y de fecha y hora son compatibles con esta herramienta. Se proporciona un conjunto único de estadísticas descriptivas para cada tipo de dato. Visita Tipos de datos para obtener más información sobre los tipos de datos.
Selecciona los campos para generar información de resumen: marca la casilla de verificación asociada a los campos (columnas) para los que deseas obtener información de resumen.
Crear una muestra de los datos de entrada: marca esta casilla de verificación para tomar una muestra aleatoria de registros. Esto puede reducir el tiempo de ejecución de tu flujo de trabajo si tienes un conjunto de datos grande. Cada vez que ejecutes tu flujo de trabajo, aparecerá una muestra de datos diferente. Tienes dos opciones de muestra:
N registros aleatorios: especifica el número de registros del que deseas tomar una muestra aleatoriamente.
N% de registros aleatorios: especifica el porcentaje de registros del que deseas tomar una muestra aleatoriamente.
La herramienta Resumen de campos tiene tres salidas:
Ancla O: un flujo de datos Alteryx con estadísticas descriptivas para las columnas seleccionadas junto con recomendaciones, en la columna Observaciones, para la gestión de datos.
Ancla R: un informe estático con un diagrama de dispersión y estadísticas descriptivas para las columnas seleccionadas junto con recomendaciones (ver Observaciones) para la gestión de datos en una columna. Para ver el informe, agrega una herramienta Examinar y conéctala a la salida R. Consulta herramienta Examinar.
Ancla I: un panel de control interactivo que consiste en paneles expandibles para cada columna. Para ver el informe, agrega una herramienta Examinar y conéctala a la salida I. Visita la herramienta Examinar para obtener más información. Cada panel tiene un histograma o gráfico de columna y estadísticas de resumen.
Pasa el cursor sobre un panel para mostrar íconos adicionales.
Selecciona el ícono de información para ver información adicional.
Selecciona el ícono expandir para abrir el informe en una vista detallada.
Pasa el cursor sobre una barra en el gráfico para mostrar los detalles.
Seleccionar variable para ver para centrarte en un conjunto de columnas más pequeñas.
Ordena los paneles alfabéticamente o por porcentaje de valores ausentes.
Las estadísticas descriptivas disponibles en el resultado dependen del tipo de datos en las columnas seleccionadas para el análisis. Los resultados se enumeran horizontalmente. Desplázate de izquierda a derecha para ver las estadísticas de cada tipo de dato.
Si una columna contiene datos numéricos, se proporcionan las siguientes estadísticas:
Min.: el valor mínimo en los datos.
Máx.: el valor máximo en los datos.
Mediana: el valor de la mediana en los datos.
Std. Dev.: el grado de dispersión de los valores de los datos.
Porcentaje que falta: el porcentaje de valores en los datos que son nulos.
Valores únicos: el número de valores únicos en los datos.
Media: la media de los datos.
Diseño: agrega una herramienta Examinar y conéctala a la salida R para ver las estadísticas en un formato visual. Consulta herramienta Examinar.
Observaciones: recomendaciones para la gestión de los datos, si dispones de ellos.
Si una columna contiene valores de cadena, se proporcionan las siguientes estadísticas:
Porcentaje que falta: el porcentaje de valores en los datos que son nulos.
Valores únicos: el número de valores únicos en los datos.
Valor más corto: el valor de cadena más corto (longitud) en los datos.
Valor más largo: el valor de cadena más largo (longitud) en los datos.
Recuento de valor mínimo: el número de valores que equivale al valor mínimo.
Recuento de valor máximo: el número de valores que equivale al valor máximo.
Observaciones: recomendaciones para la gestión de los datos, si dispones de ellos.
Si una columna contiene datos espaciales, se proporcionan estas estadísticas:
Porcentaje que falta: el porcentaje de valores en los datos que son nulos.
Tipo de objeto: el tipo de objeto espacial (por ejemplo, punto o polígono) en los datos.
Área media (millas cuadradas): el área media, en millas cuadradas, de los valores en los datos.
Longitud media (millas): la longitud media, en millas, de los valores en los datos.
Cantidad promedio de puntos: el número medio de valores en los datos que son puntos.
Observaciones: recomendaciones para la gestión de los datos, si dispones de ellos.
Si una columna contiene datos de fecha/hora, se proporcionan las siguientes estadísticas:
Porcentaje que falta: el porcentaje de valores en los datos que son nulos.
Valores únicos: el número de valores únicos en los datos.
Fecha más tardía: La fecha más tardía o futura en los datos.
Fecha más temprana: la fecha más temprana en los datos.
Intervalo: el intervalo de fechas (por ejemplo, mensual) en los datos.
Observaciones: recomendaciones para la gestión de los datos, si dispones de ellos.