Salud de datos
Utiliza la herramienta Salud de datos para verificar la salud de tus datos. Puedes utilizar la herramienta con las herramientas de ingeniería de características, como Generación de características y Tipos de características, para mejorar la salud de los datos. Para determinar el nivel de salud de los datos, la herramienta analiza los valores ausentes, los valores atípicos y la dispersión.
Se requiere Alteryx Intelligence Suite
Esta herramienta forma parte de Alteryx Intelligence Suite. Alteryx Intelligence Suite requiere una licencia independiente y un instalador de complemento para Designer. Después de instalar Alteryx Designer, instala Alteryx Intelligence Suite e inicia la prueba gratuita.
Componentes de la herramienta
La herramienta Salud de datos tiene cuatro anclas:
Ancla de entrada: se conecta a los datos cuya salud quieres verificar.
Ancla de salida S : el ancla de salida S transmite en sentido descendente las puntuaciones de salud de datos de cada columna.
Ancla de salida R : el ancla de salida R transmite en sentido descendente un informe completo sobre la salud de datos. Puedes ver el informe con la herramienta Examinar.
Ancla de salida O : el ancla de salida O transmite en sentido descendente los valores atípicos de los datos.
Configurar la herramienta
Para utilizar la herramienta Salud de datos, debes configurar opciones con respecto a qué escala se utilizará para realizar la puntuación de la salud de los datos y si se incluirán recomendaciones sobre cómo mejorar la salud en la salida.
Importante
Para utilizar esta herramienta, los datos deben tener al menos 30 filas.
1. Escala
De la lista desplegable, elige si quieres generar puntuaciones en una escala porcentual (0-100 %) o en una escala normalizada (0-1). La herramienta genera la puntuación mediante la evaluación de valores ausentes, valores atípicos y dispersión.
2. Generar recomendaciones basadas en la puntuación
Marca la casilla si quieres que la herramienta recomiende cómo mejorar la salud de los datos según la puntuación que reciban. La recomendación aparece como una columna adicional en el conjunto de datos.