Skip to main content

Conexiones masivas de Teradata

La conexión de Teradata (carga masiva) se utiliza para leer y escribir grandes volúmenes de datos a alta velocidad en una tabla vacía de una base de datos de Teradata a través de la herramienta Datos de entrada y la herramienta Datos de salida . Además de estar vacía, la tabla objetivo no puede tener índices secundarios definidos. El usuario debe tener privilegios de SELECT e INSERT en la tabla objetivo, privilegios de SELECT e INSERT en las tablas de error y privilegios de DROP en la base de datos que contiene las tablas de error.

Las siguientes herramientas y utilidades de Teradata deben estar instaladas en el equipo (la última versión es 14.0, la versión recomendada de estas herramientas).

  • Bibliotecas ICU compartidas

  • Controlador ODBC para Teradata

  • Cliente GSS de Teradata

  • Base de transportador paralelo de Teradata

Para obtener más información sobre Teradata, consulta su sitio web en: www.teradata.com

Utiliza la herramienta Datos de salida para escribir en una conexión masiva de Teradata

  1. Fuente de datos de salida : Utiliza el menú desplegable para seleccionar Otras bases de datos > Carga masiva de Teradata .

  2. Nombre de la fuente de datos de Teradata : Utiliza la lista desplegable de las conexiones ODBC disponibles configuradas en el equipo.

  3. Nombre de usuario : Especifica la credencial de nombre de usuario para la conexión a Teradata

  4. Contraseña : Especifica la credencial de contraseña para la conexión a Teradata

  5. Configura las opciones de conexión:

    • Autenticación LDAP : Si el servidor de Teradata utiliza LDAP para la autenticación, debes seleccionar esta opción. También debes seleccionar LDAP como el mecanismo de autenticación de DSN en la configuración del controlador ODBC. (LDAP debe seleccionarse o anularse en ambas ubicaciones).

    • Habilitar cifrado de datos : Selecciona esta opción para cifrar los datos durante la transferencia. Debes habilitar por separado el cifrado de DSN dentro de las opciones del controlador ODBC (es decir, para crear y descartar tablas).

  6. Configura las opciones de la herramienta Datos de salida:

    1. Cantidad máxima de registros por archivo : Especifica el límite de registros que se escribirán. Deja el campo en blanco si no deseas establecer un límite.

    2. Formato de archivo : Formato de cargador masivo de Teradata.

    3. Contraseñas : Utiliza la lista desplegable para especificar cómo se visualiza la contraseña en la ventana Configuración. Las opciones incluyen:

      • Ocultar (predeterminado)

      • Cifrar para la máquina

      • Cifrar para el usuario

    4. Opciones de salida : Utiliza el menú desplegable para especificar cómo deben escribirse los datos en Teradata. Las opciones incluyen:

      • Crear tabla nueva : Escribe datos en una nueva tabla. No sobrescribe una tabla existente.

      • Sobrescribir tabla (descartar) : Borra completamente la tabla existente y crea una nueva.

      • Anexar (ignorar filas duplicadas) : Agrega datos a una tabla existente mientras ignora los registros duplicados.

      • Anexar (marcar filas duplicadas) : Las filas duplicadas van a TableName_e2

      • Eliminar y anexar : Elimina todos los registros originales de la tabla y, luego, anexa los datos a la tabla existente.

    5. Límite de errores : Esta configuración elimina la escritura de registros si la cantidad de errores excede este límite. Los registros ya escritos permanecen en la tabla.

    6. Nombre alternativo para tablas de registro y error : El cargador masivo de Teradata utiliza la API del transportador paralelo de Teradata para escribir los datos. La API crea automáticamente tres tablas. Estas tablas emplearán por defecto el Nombre de tabla si el número de caracteres en el nombre es menor que 27. Si el número de caracteres es mayor que 27, debes ingresar un nombre de tabla alternativo para estas tablas.

    7. Crear previamente instrucción SQL : Una instrucción SQL que se ejecutará a través de OleDb ANTES de crear la tabla de salida. Se requiere un conocimiento avanzado del lenguaje SQL.

    8. Crear posteriormente instrucción SQL : Una instrucción SQL que se ejecutará a través de OleDb DESPUÉS de crear la tabla de salida. Se requiere un conocimiento avanzado del lenguaje SQL.

    9. Estilo de nombre de la tabla/campo : Las opciones incluyen Entre comillas o Ninguno. La opción Entre comillas buscará el Identificador de comillas para el tipo de base de datos.

Las tablas creadas por el cargador masivo Teradata son “tablename_lg”, “tablename_e1” y “tablename_e2” (donde tablename es el nombre que ingresaste en 6 o 7). Si se producen errores durante la escritura de registros, estas tablas tendrán la información sobre dichas fallas. Alteryx elimina automáticamente estas tablas de trabajo, en Eliminar datos y anexar, y Sobrescribir tabla (descartar).

Utiliza la herramienta Datos de entrada para leer archivos a través de una conexión masiva de Teradata

  1. Fuente de datos de entrada : Utiliza el menú desplegable para seleccionar Otras bases de datos > Carga masiva de Teradata .

  2. Nombre de la fuente de Teradata : Utiliza la lista desplegable de las conexiones ODBC disponibles configuradas en el equipo.

  3. Nombre de usuario : Especifica la credencial de nombre de usuario para la conexión a Teradata

  4. Contraseña : Especifica la credencial de contraseña para la conexión a Teradata

  5. Configura las opciones de conexión:

    • Autenticación LDAP : Si el servidor de Teradata utiliza LDAP para la autenticación, debes seleccionar esta opción. También debes seleccionar LDAP como el mecanismo de autenticación de DSN en la configuración del controlador ODBC. (LDAP debe seleccionarse o anularse en ambas ubicaciones).

    • Habilitar cifrado de datos : Selecciona esta opción para cifrar los datos durante la transferencia. Debes habilitar por separado el cifrado de DSN dentro de las opciones del controlador ODBC (es decir, para crear y descartar tablas).

  6. Configura las opciones de la herramienta Datos de entrada:

    1. Límite de registros : Ingresa el número máximo de registros leídos de la fuente de datos de entrada. Esto puede ser útil para ensayos y ejecuciones de prueba. Deja el campo en blanco para leer todos los registros.

    2. Formato de archivo : Formato de cargador masivo de Teradata.

    3. Contraseñas : Utiliza la lista desplegable para especificar cómo se visualiza la contraseña en la ventana Configuración. Las opciones incluyen:

      • Ocultar (predeterminado)

      • Cifrar para la máquina

      • Cifrar para el usuario

    4. Tabla o consulta : Especifica el nombre de la tabla objetivo en la que se leerán los registros. Hacer clic

      para obtener una lista de tablas.

    5. Leer Unspooled : Configuración de Teradata que especifica si se colocan los datos en reserva (spooling) mientras se ejecuta el trabajo de exportación en curso.

    6. No mostrar % completo : Cuando se selecciona, Alteryx no intenta informar el estado de la lectura en el archivo, por lo que se acelera el tiempo de lectura.

    7. Crear previamente instrucción SQL : Una instrucción SQL que se ejecutará a través de OleDb ANTES de leer la tabla. Se requiere un conocimiento avanzado del lenguaje SQL.

    8. Crear posteriormente instrucción SQL : Una instrucción SQL que se ejecutará a través de OleDb DESPUÉS de leer la tabla. Se requiere un conocimiento avanzado del lenguaje SQL.

    9. Estilo de nombre de la tabla/campo : Las opciones incluyen Entre comillas o Ninguno. La opción Entre comillas buscará el Identificador de comillas para el tipo de base de datos.

No hay modo spooling

Especifica si se colocan los datos en reserva (spooling) mientras se ejecuta el trabajo de exportación en curso.

Valores válidos

  • “Spool” = usar spooling. Esta es la configuración predeterminada.

  • “NoSpool” = No usar spooling. Este valor es válido solo si el sistema de base de datos admite NoSpool. Si el sistema de base de datos no admite NoSpool, utiliza Spool.

  • “NoSpoolOnly” = No usa spooling en ningún caso. Si el sistema de base de datos no admite NoSpool, pone fin al trabajo con un error.

Opciones de spooling

El modo NoSpool exporta el contenido de una tabla lo más rápido posible sin leer la tabla en un archivo de reserva (spool) ni distribuir el archivo a todos los AMP antes de extraerlo.

  • (Por defecto) SPOOL de datos.

  • Utiliza el modo NOSPOOLONLY, pero devuelve un error si no se admite NOSPOOL.

  • Utiliza el modo NOSPOOL cuando es posible; de lo contrario, haz spooling de datos en la base de datos de Teradata.

Limitaciones y funcionalidad

  • El modo NOSPOOL se aplica solo a las instrucciones de SELECT simples. Las siguientes instrucciones no se admiten:

  • Acceso a tablas que no son de datos, como SELECT DATE o SELECT USER

  • El modificador USING; en su lugar, define parámetros de restricción mediante un comando IMPORT de FastExport junto con los comandos FIELD y FILLER.

  • Contiene una cláusula SORT (ORDER BY), HAVING o WITH

  • Uniones

  • Agregaciones (EXPLAIN muestra el paso de SUM)

  • Funciones de TABLE

  • Funciones analíticas ordenadas (OLAP)

  • Múltiples instrucciones SELECT o solicitudes de múltiples instrucciones

  • Instrucciones con cero o más de uno, paso de recuperación o muestreo

  • El modo NOSPOOL recupera datos de una sola tabla, pero la instrucción SELECT puede ser selectiva con respecto a las columnas que se exportan, y puede restringir el trabajo a un subconjunto de filas.

  • Se permiten expresiones/funciones escalares.

  • Se admiten las restricciones de eliminación de particiones y muestra.

  • El Recuento de actividad devuelto para un trabajo regular en reserva (spooled) indica el número de bloques afectados; sin embargo, para los trabajos que no están en reserva (non-spooled), el número de bloques se desconoce, por lo que el mensaje de respuesta contiene el Tipo de actividad (en lugar de Recuento de actividad) para indicar el proceso NOSPOOL.

Desventajas del modo NOSPOOL

  • Se mantienen bloqueos durante todo el proceso de exportación.

  • Los errores de conversión de datos detectados previamente durante la fase de spooling no se detectarán hasta que se lea el bloque, lo que podría ocurrir en cualquier momento durante la exportación.

  • El orden de las filas (debido a la ausencia de la cláusula ORDER BY) puede o no ser coherente entre ejecuciones; por lo tanto, el modo NOSPOOL no ofrece ninguna garantía de coherencia.

Consulta la información sobre el modo Spool/NoSpool, Guía de referencia de Teradata FastExport.