Skip to main content

Tabelle di codici

Una tabella codici (detta anche set di caratteri o codifica) è una tabella di valori in cui a ogni carattere è stata assegnata una rappresentazione numerica. Una tabella codici consente a un computer di identificare i caratteri e di visualizzare correttamente il testo.

Alteryx supporta molte tabelle codici che puoi selezionare quando inserisci e invii i dati tramite lo strumento Dati di input e lo strumento Dati di output o quando converti i tipi di dati con lo strumento Conversione Blob . Inoltre, le funzioni ConvertFromCodepage e ConvertToCodepage (disponibili negli strumenti che dispongono di un editor delle espressioni) possono utilizzare gli identificatori delle tabelle codici per convertire le stringhe tra tabelle codici e Unicode®, lo standard universale di codifica per tutti i caratteri scritti creati dal Consorzio Unicode .

Alteryx presuppone che una stringa wide sia una stringa Unicode® e che una stringa narrow sia una stringa Latin 1. Una stringa convertita in una tabella codici non verrà visualizzata correttamente. Pertanto, le tabelle codici devono essere utilizzate solo per ignorare i problemi di codifica del testo all'interno di un file. Le tabelle codici possono apparire diverse su computer differenti o possono essere modificate per un singolo computer, con conseguente danneggiamento dei dati. Per ottenere risultati più coerenti, invece di una tabella codici specifica, utilizza la codifica Unicode®, ad esempio UTF-8 o UTF-16, che consente di codificare lingue diverse nello stesso flusso di dati.

UTF-8 è il modo più portatile e compatto per memorizzare qualsiasi carattere ed è utilizzato più spesso. UTF-8 e UTF-16 sono codifiche a larghezza variabile, ma UTF-8 è compatibile con ASCII e i file tendono ad avere dimensioni inferiori rispetto a quelli con codifica UTF-16.

Per ulteriori informazioni sulle tabelle codici, consulta MSDN Library .

Per supportare la stessa funzionalità su Linux, Alteryx utilizza la libreria ICU. Utilizziamo gli stessi ID presenti su Windows, convertendoli in convertitori di stringa ICU. ICU non supporta l'intero elenco di codifiche Windows o possono esserci differenze durante la conversione dei dati da una tabella codici a un'altra.

Identificatori di tabelle codici

Questi identificatori di tabelle codici sono supportati con le funzioni ConvertFromCodepage e ConvertToCodepage . Per ulteriori informazioni, consulta la sezione Funzioni .

ID

Descrizione

Supporto

37

IBM EBCDIC - Stati Uniti/Canada

Engine originale e AMP.

500

IBM EBCDIC - Internazionale

Engine originale e AMP.

932

ANSI/OEM - Giapponese Shift-JIS

Engine originale e AMP.

949

ANSI/OEM - EUC-KR coreano

Engine originale e AMP. Non supportato per Download e Conversione Blob.

1250

ANSI - Europa centrale

Engine originale e AMP.

1251

ANSI - Cirillico

Engine originale e AMP.

1252

ANSI - Latino I

Engine originale e AMP.

1253

ANSI - Greco

Engine originale e AMP.

1254

ANSI - Turco

Engine originale e AMP.

1255

ANSI - Ebraico

Engine originale e AMP.

1256

ANSI - Arabo

Engine originale e AMP.

1257

ANSI - Baltico

Engine originale e AMP.

1258

ANSI/OEM - Vietnamita

Engine originale e AMP.

10000

MAC - Romano

Engine originale e AMP.

28591

ISO 8859-1 Latino I

Engine originale e AMP.

28592

ISO 8859-2 Europa centrale

Engine originale e AMP.

28593

ISO 8859-3 Latino 3

Engine originale e AMP.

28594

ISO 8859-4 Baltico

Engine originale e AMP.

28595

ISO 8859-5 Cirillico

Engine originale e AMP.

28596

ISO 8859-6 Arabo

Engine originale e AMP.

28597

ISO 8859-7 Greco

Engine originale e AMP.

28598

ISO 8859-8 Ebraico: ordinamento visivo

Engine originale.

28599

ISO 8859-9 Latino 5

Engine originale e AMP.

28605

ISO 8859-15 Latino 9

Engine originale e AMP.

54936

Cinese semplificato GB18030

Engine originale e AMP. Non supportato per gli strumenti Download e Conversione Blob.

65001

Unicode UTF-8

Engine originale e AMP.

1200

Unicode UTF-16

Engine originale e AMP.