Skip to main content

Volúmenes de Databricks

Tipo de conexión

ODBC (64 bits)

Requisitos de configuración del controlador

El host debe ser un nombre de host del servidor de JDBC/ODBC del clúster de Databricks Unity Catalog.

Tipo de soporte

Escritura en base de datos

Se validó en

Clúster de Databricks y SQL Warehouse, controlador de Apache Spark con Simba 2.6.23.1039

Detalles del controlador

El procesamiento en base de datos requiere controladores de base de datos de 64 bits.

Herramientas de Alteryx utilizadas para establecer conexiones

Procesamiento de flujo de trabajo en base de datos

Herramienta Conexión En-BD

Blue icon with database being plugged in.

Herramienta Entrada de flujo de datos

Blue icon with a stream-like object flowing into a database.

Atención

  • Los volúmenes de Databricks solo se admiten usando DCM.

  • Los volúmenes de Databricks solo se admiten usando conexiones sin DSN.

  • Los volúmenes de Databricks solo se admiten para Unity Catalog.

  • La escritura en Databricks Unity Catalog solo es compatible con las herramientas En-BD.

  • Alteryx admite la fusión en base de datos para Databricks Unity Catalog. Visita Herramienta Escribir datos En-BD.

Configurar conexión en-BD

  1. Abre la ventana Administrar conexiones En-BD.

  2. Selecciona Databricks Unity Catalog en la lista desplegable Fuente de datos.

  3. Selecciona Nuevo para crear una nueva conexión.

  4. Ingresa un nombre de conexión.

  5. En la pestaña Leer, selecciona Configurar conexión para abrir el administrador de conexión de DCM de Databricks Unity Catalog. El Administrador de conexión de DCM está prefiltrado para mostrar solo las conexiones de ODBC de Apache Spark sin DSN con Simba Databricks Unity Catalog.

  6. Selecciona una conexión existente o selecciona +Nuevo para crear una conexión nueva. Ve a Databricks Unity Catalog para configurar una nueva conexión usando DCM.

  7. En la pestaña Escribir, selecciona Cargador masivo de volúmenes de Databricks UC (Avro) en el menú desplegable.

  8. Selecciona Configurar conexión para abrir el Administrador de conexión de DCM para la conexión de Databricks. El Administrador de conexión de DCM está prefiltrado para mostrar solo las conexiones ODBC de carga masiva de Apache Spark sin DSN con volúmenes de Databricks UC.

  9. Selecciona una conexión existente o selecciona +Nuevo para crear una conexión nueva. Consulta la información a continuación para configurar una conexión nueva usando DCM.

  10. Selecciona Aplicar y Aceptar para guardar la conexión y cerrar la ventana.

  11. Si accediste al Administrador de conexión En-BD desde la herramienta Conexión En-BD, se carga la ventana Elegir tabla o especificar consulta y se te permite seleccionar las tablas.

Configurar ODBC de carga masiva de Apache Spark sin DSN con volúmenes de Databricks UC en DCM

Esta conexión se utiliza para escribir datos de Databricks Unity Catalog con ensayos de volúmenes.

  1. Abre el Administrador de conexiones de datos y navega a ODBC de carga masiva de Apache Spark sin DSN con volúmenes de Databricks UC.

    - El DCM está prefiltrado desde una herramienta Entrada o el Administrador de conexión En-BD.

    - Desde el menú Archivo, ve a Archivo > Administrar conexiones > +Nuevo > Apache Spark > ODBC de carga masiva de Apache Spark sin DSN con volúmenes de Databricks UC.

  2. Ingresa un Nombre de la fuente de datos.

  3. Ingresa el nombre del host de Databricks Unity Catalog.

  4. El puerto está configurado en 443 de forma predeterminada. Cámbialo si es necesario.

  5. Ingresa la ruta http, es decir, la URL de recursos de cómputo de Databricks.

  6. Ingresa el catálogo. Esto establece el catálogo que se utiliza para escribir los datos y crear las tablas.

  7. Ingresa el esquema. Esto establece el esquema que se utiliza para escribir los datos y crear las tablas.

  8. Ingresa la ruta completa del volumen de Databricks en el formato /Volúmenes/<catálogo>/<esquema>/<volumen>/<ruta/a/carpeta>.

  9. Selecciona Guardar para guardar la Fuente de datos.

  10. Selecciona +Conectar credencial para agregar una credencial.

    1. Selecciona un Método de autenticación.

    2. Para usar un token de acceso personal, selecciona Nombre de usuario y contraseña como el método de autenticación y cambia el nombre de usuario a “token”.

    3. Para usar Azure AD, ve a Autenticación OAuth de Azure para Databricks.

    4. Selecciona una credencial existente o Crear nueva credencial para crear una credencial nueva e ingresa el token de acceso personal o la información de Azure AD.

  11. Selecciona Vincular para vincular la credencial a la fuente de datos.

  12. Selecciona Conectar.