Skip to main content

Introducción al procesamiento en base de datos

El procesamiento en base de datos permite la mezcla y el análisis de grandes conjuntos de datos sin mover los datos de una base de datos, lo que puede proporcionar mejoras significativas en el rendimiento comparado con los métodos de análisis tradicionales que requieren que los datos se muevan a un ambiente separado para el procesamiento.

Realizar análisis en la base de datos puede ahorrar tiempo de procesamiento. Utilizando Designer como interfaz, los flujos de trabajo en la base de datos se integran fácilmente con flujos de trabajo estándar para combinación y análisis de datos adicionales.

Limitaciones

Los objetos espaciales no se admiten actualmente en las herramientas En base de datos.

Si tienes el mismo flujo de trabajo abierto varias veces, cambia uno de ellos y, a continuación, ejecútalos todos, aunque es posible que notes un comportamiento inesperado. Cierra todas las versiones del mismo flujo de trabajo antes de cambiarlo.

Bases de datos admitidas

Soporte de controlador

  • El procesamiento en base de datos requiere Alteryx de 64 bits con controladores de base de datos de 64 bits.

  • Para ejecutar flujos de trabajo en Alteryx Server, el controlador ODBC se debe configurar como DSN del sistema. Para el procesamiento en base de datos, el tipo de conexión debe ser "Sistema" además de la conexión ODBC configurada como un DSN del sistema.

Ve a Fuentes de datos y formatos de archivo admitidos para obtener la lista completa de plataformas de datos compatibles con Alteryx.

Herramientas en la categoría En base de datos

Revisa las siguientes listas de herramientas En base de datos.

Boosted Model Tool Icon
Decision Tree Tool Icon
Forest Model Tool Icon
Linear Regression Tool Icon
Logistic Regression Icon
Score Tool

Cambiar versiones de herramientas

Cuando se coloca una herramienta predictiva con soporte en base de datos en el lienzo con otra herramienta de la categoría En base de datos, la herramienta predictiva cambia automáticamente a la versión En-BD. Para cambiar manualmente la versión de la herramienta…

  1. Haz clic con el botón derecho en la herramienta.

  2. Apunta a Elegir la versión de la herramienta .

  3. Selecciona una versión diferente de la herramienta.

Ve a Analítica predictiva para obtener más información sobre el soporte predictivo en base de datos.

Anclas y conexiones de herramientas en la categoría En base de datos

Dado que el procesamiento de flujo de trabajo en base de datos se produce dentro de la base de datos, las herramientas En base de datos no son compatibles con las herramientas Alteryx estándar. Varios indicadores visuales muestran compatibilidad de conexión.

Visualization of Standard tool connection.

Las herramientas estándar tienen un ancla de flecha verde para conectarse a otra herramienta. La conexión se muestra como una sola línea.

Visualization of In-Database tool connection.

Las herramientas En base de datos tienen un ancla de base de datos de azul cuadrado para conectarse a otra herramienta En base de datos. La conexión entre dos herramientas En base de datos se muestra como una línea doble. Debido a la naturaleza del procesamiento en base de datos, no se muestra el progreso de la conexión.

Para conectar herramientas estándar a herramientas de la categoría En base de datos, utiliza las herramientas Entrada dinámica En-BD, Salida dinámica En-BD, Entrada de flujo de datos o Salida de flujo de datos.

¿Cómo funciona el procesamiento En base de datos?

Los datos fluyen dentro y fuera de un flujo de trabajo en base de datos utilizando las herramientas Entrada de flujo de datos y Salida de flujo de datos , o conectándose directamente a una base de datos mediante la herramienta Conexión En-BD . Las herramientas Entrada de flujo de datos y Salida de flujo de datos tienen un ancla En-BD para conectarse a herramientas En-BD y un ancla de flujo de trabajo estándar para conectarse a herramientas de flujo de trabajo estándar.

Chart showing many different connections

¿Cómo funciona?

  1. Define la conexión a la base de datos con la herramienta Conexión En-BD o utiliza la herramienta Entrada de flujo de datos para transmitir datos de un flujo de trabajo estándar a una tabla temporal en la base de datos.

  2. Conecta otras herramientas En-BD al flujo de trabajo para procesar los datos.

  3. Utiliza la herramienta Escribir datos en-BD para crear o actualizar una tabla en la base de datos, o utiliza la herramienta Salida de flujo de datos para transmitir los resultados en base de datos a un flujo de trabajo a fin de realizar un procesamiento estándar.

  4. Ejecuta el flujo de trabajo para procesar los datos en la plataforma de datos. No se devuelve ningún resultado al Alteryx Engine hasta que se haya procesado el flujo de trabajo completo en la base de datos.

Beneficios de rendimiento En base de datos

El procesamiento del flujo de trabajo puede tardar más tiempo cuando una gran cantidad de datos se transmiten dentro y fuera de una base de datos. Puedes utilizar el procesamiento en base de datos para acelerar un flujo de trabajo.

Por ejemplo, en un flujo de trabajo estándar, una tabla grande de base de datos es ingresada a la memoria para unirse con una pequeña hoja de cálculo. La mayoría del tiempo de ejecución se gasta en ingresar los registros de la base de datos. En un flujo de trabajo En base de datos, la pequeña hoja de cálculo se transmite a la base de datos, reduciendo sustancialmente el tiempo de ejecución.

Preguntas frecuentes

Los privilegios de lectura son necesarios para acceder a la base de datos subyacente.

Los privilegios de escritura son necesarios para crear una tabla en la base de datos.

Las tablas temporales se eliminan al final de la ejecución. Si Alteryx se bloquea mientras se ejecuta la herramienta Entrada de flujo de datos, la próxima vez que se ejecute un flujo de trabajo en base de datos, todos los archivos temporales creados por Alteryx en la base de datos en los tres días anteriores se borran.

Para permitir la visibilidad de una tabla temporal entre sesiones, Alteryx debe crear una tabla permanente que eventualmente se elimina al final de un flujo de trabajo. Es necesario tener permisos de creación para transmitir datos desde una base de datos y escribir datos en una base de datos. La excepción es Microsoft SQL Server.

Las reglas subyacentes se mantienen durante el proceso de la misma manera que con las conexiones de base de datos vía las herramientas estándar Datos de entrada y Datos de salida. Si hay un tiempo de espera de la base de datos o si hay un límite a la cantidad de consultas por día que se puede ejecutar, afectará la conexión a la base de datos.

Una instrucción SELECT es activada por la herramienta Conexión En-BD y las consultas adicionales se crean mediante herramientas posteriores en el flujo de trabajo y anidadas dentro de la consulta. La adición de una de estas tres herramientas completa la consulta y la envía a la base de datos subyacente: Escribir datos En-BD, Salida de flujo de datos, Examinar En-BD.

Puedes introducir tu propia instrucción SQL en el cuadro de consulta de la herramienta Conexión En-BD, que también se incrusta dentro de la instrucción SELECT.

La consulta SQL para la base de datos subyacente se activa en tiempo de ejecución para cada herramienta Examinar En-BD, Salida de flujo de datos o Escribir datos En-BD.

La herramienta Examinar En-BD se puede configurar para almacenar los datos en caché como un archivo. yxdb cuando se ejecuta el flujo de trabajo.

Una vez que los datos se almacenan en caché, si el flujo de trabajo se vuelve a ejecutar y la conexión o consulta de la base de datos (incluso el número de registros que se van a examinar) no ha cambiado, la consulta no se volverá a ejecutar y los datos se sacarán de caché.

Un mensaje de salida indica si los datos se almacenaron en caché o no. Al hacer clic en el enlace, se abre el resultado de los datos como un archivo. .yxdb en una ventana separada.

El almacenamiento en caché en base de datos se utiliza en cualquier momento en que se vuelva a ejecutar un flujo de trabajo sin cambios en las herramientas anteriores en el flujo de trabajo. Al realizar un cambio en cualquier herramienta anterior en el flujo de trabajo, se activa una nueva consulta y se creará una nueva caché.

No, la opción "Examinar primeros [100] registros" sólo limita el número de registros mostrados en la herramienta Examinar En-BD. Otras herramientas del flujo de trabajo procesarán el número de registros que se pasan.

El campo tiene un tipo de dato CLOB/LOB y no funciona con la mayoría de los operadores de comparación en las herramientas Filtro o Fórmula. El error refleja que no se devuelven columnas, incluso cuando los datos coinciden con la comparación. Este es el comportamiento esperado con SQL y Oracle, ya que no admiten comparaciones con datos LOB