Ejemplo de cada herramienta
Diagrama de dispersión tiene un ejemplo de uso. Consulta Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.
Utiliza Diagrama de dispersión para generar diagramas de dispersión mejorados, con opciones para incluir diagramas de caja en los márgenes, una línea de regresión lineal, una curva suave a través de regresión no paramétrica, una dispersión condicional suavizada, una identificación de valores atípicos y una línea de regresión.
La curva suave puede ayudar a los usuarios a ver con mayor rapidez la naturaleza de la relación entre dos variables relativas a un diagrama de dispersión tradicional, particularmente en casos con muchas observaciones o un alto nivel de dispersión en los datos.
Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión en el portal Descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R. Visita Descargar y usar herramientas predictivas.
Utiliza la pestaña Configuración para establecer los controles obligatorios del diagrama de dispersión.
Campo X (horizontal): el campo (columna) que se utilizará en el eje horizontal del gráfico. La elección se limita a los campos numéricos.
Campo Y (vertical): el campo (columna) que se utilizará en el eje vertical del gráfico. Se puede utilizar un campo numérico o un campo categórico binario. Si se selecciona un campo categórico binario, se crea un nuevo campo (con el sufijo ".num" anexado al nombre del campo original) que tiene valores numéricos de cero o uno. Si se selecciona una variable categórica con más de dos valores, el nodo devuelve un error.
El campo Y es una variable categórica binaria: una casilla de verificación para indicar que el campo Y es una variable categórica binaria. Cuando está marcado, deberás indicar el valor de campo que corresponderá a un valor de uno (el "objetivo"), con las entradas del otro valor de campo tomando el valor cero.
Utiliza la pestaña Elementos del diagrama para configurar las reglas de trazado de datos.
Línea de mínimos cuadrados (regresión): muestra una línea de regresión lineal simple entre los campos X e Y. Incluido por defecto.
Suavizar línea: muestra una línea no lineal entre los campos X e Y que se crea utilizando un modelo loess (regresión local no paramétrica). Incluido por defecto.
Extensión para suavizar: un parámetro que controla el tamaño del área local utilizada para construir las estimaciones de loess. Cuanto menor sea el número, menor será el área utilizada.
Mostrar dispersión: dos curvas que muestran los resultados de los modelos loess tanto a los residuos positivos como negativos de la media cuadrática por canal de la línea loess original para mostrar la dispersión condicional y la asimetría en los errores. Incluido por defecto.
Diagramas de caja marginales: incluye diagramas de caja univariante de los campos X e Y a lo largo de cada acceso respectivo. Esto es útil para evaluar la distribución de valores de ambos campos, y se incluyen por defecto.
Fluctuación X: cuando se selecciona, se perturban los valores de X aleatoriamente en una cantidad pequeña. Esto es útil si un mayor número de registros en el campo X toma uno o un pequeño número de valores. Solo influye en los puntos de apariencia en los gráficos, no en las líneas de regresión y loess ajustadas.
Fluctuación Y: cuando se selecciona, se perturban los valores Y aleatoriamente en una pequeña cantidad. Esto es útil si un número mayor de registros en el campo Y toma uno o un número pequeño de valores. Solo influye en los puntos de apariencia en los gráficos, no en las líneas de regresión y loess ajustadas.
Eje Log X: si se selecciona, se aplica una transformación logarítmica natural a los valores X. Hacer esto, a menudo, es útil para explorar ciertos tipos de relaciones no lineales.
Eje Log Y: si se selecciona, se aplica una transformación logarítmica natural a los valores Y. Hacer esto, a menudo, es útil para explorar ciertos tipos de relaciones no lineales.
Gráfico por grupos: esta opción permite examinar el efecto de un campo categórico sobre la relación entre los campos X e Y, en el que cada valor del campo categórico da como resultado un grupo de valores X e Y. Los grupos se trazan con diferentes colores y caracteres de trazado. Si esta opción está seleccionada, deberás indicar el campo categórico que se utilizará en la creación de grupos, (opcionalmente) si desean que se tracen curvas de regresión y loess para cada grupo, y la ubicación de la leyenda que identifica los diferentes grupos.
Utiliza la pestaña Opciones de estilo para establecer los controles de gráficos, como etiquetas y escala.
Etiqueta del eje X (opcional): etiqueta opcional para el eje X (horizontal). De forma predeterminada, se utiliza el nombre del campo X.
Etiqueta del eje Y (opcional): etiqueta opcional para el eje Y (vertical). De forma predeterminada, se utiliza el nombre del campo Y.
Escala de tamaño de punto: controla el tamaño de los puntos dentro de la pantalla, con valores más grandes que dan como resultado un tamaño de punto más grande.
Escala de tamaño del texto de los ejes: controla el tamaño de los números y las marcas de verificación a lo largo de cada eje, con valores más grandes que dan como resultado un texto más grande.
Escala de tamaño del texto de las etiquetas de los ejes: controla el tamaño de la etiqueta de eje a lo largo de cada eje, con valores más grandes que dan como resultado un texto más grande.
Escala de tamaño del texto del título principal: controla el tamaño del texto del título principal, con valores más grandes que dan como resultado un texto más grande.
Utiliza la pestaña Opciones de gráficos para establecer los controles para la salida gráfica.
Tamaño del gráfico: selecciona pulgadas o centímetros y especifica el ancho y la altura para el tamaño del gráfico.
Resolución del gráfico: selecciona la resolución del gráfico en puntos por pulgada: 1x (96 ppp), 2x (192 ppp) o 3x (288 ppp).
La resolución más baja crea un archivo más pequeño y es mejor para ver en un monitor.
Una resolución más alta crea un archivo más grande con una mejor calidad para imprimir.
Tamaño de fuente base (puntos): selecciona el tamaño de la fuente del gráfico.
Produce un objeto de gráfico R de Alteryx que puede utilizarse para ayudar en la creación de informes personalizados.