Skip to main content

Formatos de archivo admitidos

Esta sección contiene información sobre los formatos de archivo y esquemas de compresión que son admitidos para la entrada y salida desde Alteryx Analytics Cloud (AAC).

Nota

Para trabajar con formatos que son propiedad de una aplicación de escritorio, como Microsoft Excel, no necesitas tener instalada la aplicación de soporte en tu escritorio.

Nombres de archivo

Nota

Durante la importación, AAC identifica los formatos de archivo en función de la extensión del nombre de archivo. Si no se proporciona ninguna extensión, AAC supone que el archivo enviado es un archivo de texto de algún tipo. Los formatos de archivo que no sean de texto, como Avro y Parquet, requieren extensiones de nombre de archivo.

Nota

Los nombres de archivo que incluyen caracteres especiales pueden causar problemas durante la importación o al publicarlos en un almacén de datos basado en archivos.

Límites de longitud de ruta del archivo

Límites máximos de caracteres para las rutas del archivo:

  • Rutas de archivo a fuentes para conjuntos de datos importados: 1024

    Sugerencia

    Este límite ( storagelocations ) se aplica tanto a los archivos como a las tablas.

  • Rutas de archivo de salida: 2048

    Sugerencia

    Este límite ( writesettings ) se aplica a los archivos almacenados en cualquier ubicación de almacenamiento basada en archivos.

Caracteres prohibidos en nombres de archivos de importación

La siguiente lista de caracteres presenta problemas en el área enumerada del producto. Si encuentras problemas, los siguientes listados pueden proporcionar alguna orientación sobre dónde ocurrió el problema.

Sugerencia

Debes evitar usar cualquiera de estos caracteres en los nombres de archivos de importación. Es posible que esta lista no esté completa para todos los entornos de ejecución disponibles.

  • General:

    "/"
  • Navegador Seb:

    "\"
  • Nombres de archivo de Excel:

    "#","{","}"
  • Entorno de ejecución basado en Spark:

    "{", "*", "\"

Formatos de archivo de entrada nativos

AAC puede leer e importar directamente estos formatos de archivo:

  • CSV

  • JSON

    Nota

    AAC puede leer archivos JSON de forma nativa, pero a menudo requiere trabajo adicional para estructurarse correctamente en formato tabular. Dependiendo de cómo se configure AAC (v1 o v2), los archivos JSON podrían requerir conversión antes de que estén disponibles para su uso en la aplicación.

    Nota

    AAC requiere que envíes archivos JSON con 1 objeto JSON válido por línea. Los objetos JSON mal formados de forma consistente u objetos que se superponen a los saltos de línea pueden provocar un error en la importación.

    • Límite recomendado de 1 GB en el tamaño de archivo fuente. Dado que la conversión ocurre dentro del nodo Trifacta, este límite puede variar dependiendo de la memoria del nodo Trifacta.

    • Cada registro JSON debe tener menos de 20 MB de tamaño.

    • Las extensiones de nombre de archivo deben ser .json o .JSON .

    • Para obtener los mejores resultados, debes poner entre comillas todas las claves y los valores, e importarlos como cadenas.

    • Puedes usar el carácter de barra invertida ( \ ) junto a los valores con comillas para tratarlos como literales en tus cadenas.

    • Al importar los valores a la página Transformador, AAC vuelve a inferir el tipo de dato para cada columna.

  • Texto sin formato

  • LOG

  • TSV

  • Parquet

    Nota

    Cuando se trabaja con conjuntos de datos procedentes de archivos Parquet, la información de linaje y la referencia $sourcerownumber no se admiten.

  • Avro

    Nota

    Cuando se trabaja con conjuntos de datos procedentes de archivos Avro, la información de linaje y la referencia $sourcerownumber no se admiten.

  • Google Sheets

    Nota

    Los usuarios individuales deben habilitar el acceso a su Google Drive. Ningún dato que no sea Hojas de cálculo de Google se lee de Google Drive.

Formatos de archivos convertidos

Los archivos del siguiente tipo no se leen en el producto en su formato nativo. En su lugar, estos tipos de archivos se convierten mediante el servicio de conversión en un formato de archivo compatible de forma nativa, almacenado en la capa de almacenamiento base y, a continuación, ingerido para su uso en el producto.

Nota

Los archivos comprimidos que requieren la conversión del formato de archivo subyacente no se admiten para su uso en el producto.

Formatos de archivos convertidos:

  • Excel (XLS/XLSX)

    Nota

    Otros formatos relacionados con Excel, como el formato XLSM, no son compatibles. Si tienes problemas, intenta Guardar como en XLS o XLSX desde la aplicación Microsoft Excel.

    Sugerencia

    Puedes importar varias hojas de cálculo de un solo libro a la vez.

  • Google Sheets

    Sugerencia

    Puedes importar varias hojas de una sola hoja de cálculo de Google a la vez.

  • PDF

  • JSON

Formatos de archivo de salida nativos

Designer Cloud puede escribir en estos formatos de archivo:

Nota

Algunos formatos de salida pueden necesitar ser habilitados por un administrador.

  • CSV

  • JSON

  • Hyper

    Nota

    La publicación de resultados en formato Hyper puede requerir una configuración adicional. Ver más abajo.

  • Avro

    Nota

    Los entornos de ejecución Trifacta Photon y Spark aplican la compresión Snappy a este formato.

  • Parquet

    Nota

    Los entornos de ejecución Trifacta Photon y Spark aplican la compresión Snappy a este formato.

Algoritmos de compresión

Cuando se importa un archivo, AAC intenta inferir el algoritmo de compresión en uso basado en la extensión del nombre de archivo. Por ejemplo, los archivos .gz se supone que se comprimen con GZIP.

Nota

No se admite la importación de un archivo comprimido cuyo formato subyacente requiera la conversión a través del servicio de conversión.

Leer formatos de archivo nativos

GZIP

BZIP

Snappy

Notas

CSV

Apoyado

Apoyado

Apoyado

JSON v2

No compatible

No compatible

No compatible

Un formato de archivos convertido. Ver más arriba.

JSON v1

Apoyado

Apoyado

Apoyado

No es un formato de archivo convertido. Ver más arriba.

Avro

Apoyado

Escribir formatos de archivo nativos

GZIP

BZIP

Snappy

CSV

Apoyado

Apoyado

Apoyado

JSON

Apoyado

Apoyado

Apoyado

Avro

Admitido; siempre encendido

Formatos de compresión Snappy

Designer Cloud admite las siguientes variantes del formato de compresión Snappy:

Extensión del archivo

Nombre del formato

Notas

.sz

Formato Framing2

Ver: https://github.com/google/snappy/blob/master/framing_format.txt

.snappy

Formato Hadoop-snappy

Ver: https://code.google.com/p/hadoop-snappy/

Nota

El formato snappy-java de Xerial, que también está escrito con una extensión de archivo .snappy por defecto, no es compatible.

Formatos de archivo admitidos por aplicación

Las aplicaciones individuales pueden admitir un subconjunto de los formatos de archivo y algoritmos de compresión enumerados en esta página.

Aplicación

Descripción

Designer Experience

Puedes importar una serie de formatos de archivo plano para su uso en Designer Experience. Ve a Opciones de formato de archivo de Designer Cloud .

Trifacta Classic

Todos los formatos de archivo de plataforma y algoritmos de compresión son compatibles.

Reporting

Reporting utiliza los datos de tus flujos de trabajo como entradas. Ve a Designer Experience.

Los informes se pueden exportar en formatos XLSX y PDF. Ve a Interfaz de usuario de Generación de informes .

Machine Learning

Los datos cargados para el entrenamiento del modelo o la predicción deben estar en un archivo CSV. Para obtener más información, consulta Configuración del problema y Exportar y predecir .