Skip to main content

Basic Data Profile Tool Icon Herramienta Perfil básico de datos

Ejemplo de cada herramienta

Perfil básico de datos tiene un ejemplo de uso. Consulta Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.

Usa Perfil básico de datos para ver una descripción general, o perfil, de los datos y extrae la información para un mayor análisis. La herramienta Perfil básico de datos analiza datos y proporciona metadatos de cada columna (campo) de datos. Para ver una representación visual del perfil de datos, además de los metadatos, usa la herramienta Examinar.

Configurar la herramienta

Completa cualquiera de las opciones de configuración disponibles:

  • Límite para conteo exacto: se recomienda el límite predeterminado para el mejor rendimiento. Aumenta el límite para ver la información del perfil para obtener más datos. Introduce texto o utiliza los botones arriba/abajo para seleccionar el número máximo de valores únicos que deseas que Alteryx identifique en los datos.

  • Límite de tamaño para devolver todos los valores únicos (caracteres): se recomienda el límite predeterminado para el mejor rendimiento. Aumenta el límite para ver la información del perfil para obtener más datos. Introduce texto o utiliza los botones Arriba/Abajo para seleccionar el número máximo de caracteres que deseas que Alteryx compruebe en un valor para determinar si el valor es único.

  • Utilizar unidades métricas: selecciona para usar unidades métricas de medida. Esta opción solo corresponde a datos espaciales.

Ver la salida

Dependiendo del tipo de datos de la herramienta conectada, la información del perfil de datos en la ventana de resultados varía. Ve a Tipos de datos para obtener una lista de tipos de datos.

Los resultados se enumeran verticalmente. Desplaza para ver los metadatos de cada columna en los datos.

Datos de cadena

Si una columna contiene valores de cadena, se proporcionan los siguientes metadatos:

  • Nombre: nombre de la columna.

  • Tipo de datos: el tipo de datos de la columna seleccionada.

  • Tamaño: la cantidad de memoria reservada para cada registro de esta columna.

  • Origen: el origen de la columna. Este puede ser el nombre de la fuente de datos o la ruta a la ubicación donde se guardan los datos.

  • Descripción: la descripción de la columna, si está disponible. Si no hay ninguna descripción disponible, es [Null].

  • Aceptable: el número de valores en la columna sin problemas de calidad identificados, por ejemplo, espacios en blanco iniciales o finales.

  • Nulos: número de valores de la columna que son nulos, excluyendo los valores vacíos.

  • No nulos: número de entradas que no son nulos en la columna, incluidos los valores vacíos.

  • Espacios en blanco: el número de valores vacíos.

  • Valores con espacios en blanco al principio: número de valores de cadena con espacio en blanco antes del valor. Utiliza la herramienta Limpieza de datos o la función Trim de la herramienta Fórmula para resolver el problema. Consulta Herramienta Limpieza de datos y Herramienta Fórmula para obtener más información.

  • Valores con espacios en blanco al final: número de valores de cadena con espacios en blanco después del valor.

  • Valores con ambos espacios en blanco: número de valores de cadena con espacio en blanco antes y/o después del valor.

  • Longitud media: la longitud media de los valores en la columna.

  • Longitud más larga: número de caracteres en el valor más largo de la columna.

  • Valor más largo: el valor más largo de la columna.

  • Longitud más corta (no en blanco): número de caracteres en el valor más corto de la columna.

  • Valor más corto: el valor más corto de la columna.

  • Mínimo: la primera entrada de cadena de una columna ordenada alfabéticamente.

  • Máximo: la última entrada de cadena de una columna ordenada alfabéticamente.

  • Únicos: el número de valores únicos en el campo. Utiliza la herramienta Único para ver un conteo completo de entradas únicas y duplicadas. Consulta la Herramienta Único para obtener más información.

  • Valores únicos: todos los valores únicos de la columna.

Datos numéricos

Si la columna contiene valores numéricos, se proporcionan los siguientes metadatos:

  • Nombre: nombre de la columna.

  • Tipo de datos: el tipo de datos de la columna seleccionada.

  • Tamaño: la cantidad de memoria reservada para cada registro de esta columna.

  • Origen: el origen de la columna. Este puede ser el nombre de la fuente de datos o la ruta a la ubicación donde se guardan los datos.

  • Descripción: la descripción de la columna, si está disponible. Si no hay ninguna descripción disponible, es [Null].

  • Aceptable: el número de valores en la columna sin problemas de calidad identificados, por ejemplo, espacios en blanco iniciales o finales.

  • Nulos: número de valores de la columna que son nulos, excluyendo los valores vacíos.

  • No nulos: número de entradas que no son nulos en la columna, incluidos los valores vacíos.

  • Mínimo: el valor más pequeño de la columna.

  • Máximo: el valor más grande en la columna.

  • Promedio: valor medio de los valores de la columna.

  • Suma: La suma de valores en la columna.

  • Desviación estándar: la medida de la dispersión de los valores que se encuentran en el gráfico.

  • Varianza: la medida de hasta qué punto un conjunto de números aleatorios se dispersa de la media.

  • Únicos: el número de valores únicos en el campo. Utiliza la herramienta Único para ver un conteo completo de entradas únicas y duplicadas. Visita Herramienta Único para obtener más información.

  • Valores únicos: todos los valores únicos de la columna.

  • Percentil 25: el valor medio en la parte inferior o la primera mitad de los datos.

  • Percentil 50: el valor medio de los datos.

  • Percentil 75: el valor medio en la parte superior, o la segunda, la mitad de los datos.

  • Histograma: el recuento de valores en la columna que se agrupan en datos uniformemente agrupados. Cada grupo está indicado por un valor inicial y un recuento de valores en el grupo, separados por dos puntos. Un grupo contiene valores hasta, pero sin incluir, el valor inicial del siguiente grupo. 1:23, 2:15, 3:0 indica 3 grupos que comienzan en 1, 2 y 3. Cada grupo tiene 23, 15 y 0 ítems respectivamente.

  • Margen de error: el posible rango de valores por debajo y sobre el valor calculado.

Datos de fecha y hora

Si una columna contiene datos de fecha/hora, se proporcionan estos metadatos:

  • Nombre: nombre de la columna.

  • Tipo de datos: el tipo de datos de la columna seleccionada.

  • Tamaño: la cantidad de memoria reservada para cada registro de esta columna.

  • Origen: el origen de la columna. Este puede ser el nombre de la fuente de datos o la ruta a la ubicación donde se guardan los datos.

  • Descripción: la descripción de la columna, si está disponible. Si no hay ninguna descripción disponible, es [Null].

  • Aceptable: el número de valores en la columna sin problemas de calidad identificados, por ejemplo, espacios en blanco iniciales o finales.

  • Nulos: número de valores de la columna que son nulos, excluyendo los valores vacíos.

  • No nulos: número de entradas que no son nulos en la columna, incluidos los valores vacíos.

  • Histograma de fecha: (solo para datos de fecha) el recuento de valores en la columna que se agrupan en datos uniformemente. Cada grupo está indicado por un valor inicial y un recuento de valores en el grupo, separados por dos puntos. Un grupo contiene valores hasta, pero sin incluir, el valor inicial del siguiente grupo. 1:23, 2:15, 3:0 indica 3 grupos que comienzan en 1, 2 y 3. Cada grupo tiene 23, 15 y 0 ítems respectivamente.

  • Mínimo: el valor más pequeño de la columna.

  • Máximo: el valor más grande en la columna.

  • Únicos: el número de valores únicos en el campo. Utiliza la herramienta Único para ver un conteo completo de entradas únicas y duplicadas. Consulta la Herramienta Único para obtener más información.

  • Valores únicos: todos los valores únicos de la columna.

Datos de objeto espacial

Si una columna contiene objetos espaciales, se proporcionan estos metadatos:

  • Nombre: nombre de la columna.

  • Tipo de datos: el tipo de datos de la columna seleccionada.

  • Tamaño: la cantidad de memoria reservada para cada registro de esta columna.

  • Origen: el origen de la columna. Este puede ser el nombre de la fuente de datos o la ruta a la ubicación donde se guardan los datos.

  • Descripción: la descripción de la columna, si está disponible. Si no hay ninguna descripción disponible, es [Null].

  • Aceptable: el número de valores en la columna sin problemas de calidad identificados.

  • Nulos: número de valores de la columna que son nulos, excluyendo los valores vacíos.

  • No nulos: número de entradas que no son nulos en la columna, incluidos los valores vacíos.

  • Tamaño promedio (Bytes): el tamaño promedio en la memoria que ocupa este objeto.

  • Tamaño más grande (bytes): el tamaño en memoria del objeto más grande de la columna.

  • Conteo de puntos: el número de objetos espaciales en la columna que son puntos.

  • Conteo de líneas: el número de objetos espaciales en la columna que son líneas.

  • Conteo de polilíneas: el número de objetos espaciales en la columna que son polilíneas.

  • Conteo de rectángulos: el número de objetos espaciales en la columna que son rectángulos.

  • Conteo de polígonos: el número de objetos espaciales en la columna que son polígonos.

  • Conteo de multipuntos: el número de objetos espaciales en la columna que son multipuntos.

  • Cantidad promedio de partes: el número promedio de partes en los objetos espaciales dentro de la columna.

  • Máxima cantidad de partes: el mayor número de partes en los objetos espaciales dentro de la columna.

  • Cantidad promedio de puntos: el número promedio de puntos en los objetos espaciales dentro de la columna.

  • Máxima cantidad de puntos: el mayor número de puntos en los objetos espaciales dentro de la columna.

  • Longitud más larga: longitud más larga en los objetos espaciales dentro de la columna.

  • Área más grande: el área más grande en millas cuadradas o kilómetros cuadrados.