Skip to main content

Data Health Tool Icon Salud de datos

Utiliza la herramienta Salud de datos para verificar la salud de tus datos. Puedes utilizar la herramienta con las herramientas de ingeniería de características, como Generación de características y Tipos de características, para mejorar la salud de los datos. Para determinar el nivel de salud de los datos, la herramienta analiza los valores ausentes, los valores atípicos y la dispersión.

Se requiere Alteryx Intelligence Suite

Esta herramienta forma parte de Alteryx Intelligence Suite. Alteryx Intelligence Suite requiere una licencia independiente y un instalador de complemento para Designer. Después de instalar Alteryx Designer, instala Alteryx Intelligence Suite e inicia la prueba gratuita.

Componentes de la herramienta

La herramienta Salud de datos tiene cuatro anclas:

  1. Ancla de entrada: se conecta a los datos cuya salud quieres verificar.

  2. Ancla de salida S : el ancla de salida S transmite en sentido descendente las puntuaciones de salud de datos de cada columna.

  3. Ancla de salida R : el ancla de salida R transmite en sentido descendente un informe completo sobre la salud de datos. Puedes ver el informe con la herramienta Examinar.

  4. Ancla de salida O : el ancla de salida O transmite en sentido descendente los valores atípicos de los datos.

Configurar la herramienta

Para utilizar la herramienta Salud de datos, debes configurar opciones con respecto a qué escala se utilizará para realizar la puntuación de la salud de los datos y si se incluirán recomendaciones sobre cómo mejorar la salud en la salida.

Importante

Para utilizar esta herramienta, los datos deben tener al menos 30 filas.

1. Escala

De la lista desplegable, elige si quieres generar puntuaciones en una escala porcentual (0-100 %) o en una escala normalizada  (0-1). La herramienta genera la puntuación mediante la evaluación de valores ausentes, valores atípicos y dispersión.

2. Generar recomendaciones basadas en la puntuación

Marca la casilla si quieres que la herramienta recomiende cómo mejorar la salud de los datos según la puntuación que reciban. La recomendación aparece como una columna adicional en el conjunto de datos.