Skip to main content

Pages de code

Une page de code (également appelée « jeu de caractères » ou « encodage ») est une table de valeurs dans laquelle chaque caractère se voit attribuer un numéro. La page de code permet à l’ordinateur d’identifier les caractères et d’afficher le texte correctement.

Alteryx prend en charge de nombreuses pages de code sélectionnables pour les fichiers de données en entrée et en sortie à l'aide de l' outil Entrée de données et de l' outil Sortie de données ou lors de la conversion de types de données à l'aide de l' outil Conversion de Blob . En outre, les fonctions ConvertFromCodepage et ConvertToCodepage , disponibles dans les outils incluant un éditeur d'expressions, peuvent utiliser des identifiants de page de code pour convertir des chaînes entre les différentes pages de code et le format Unicode®, la norme universelle d'encodage de tous les caractères écrits créée par le Consortium Unicode .

Alteryx suppose qu'une chaîne large est une chaîne au format Unicode® et qu'une chaîne étroite est une chaîne au format Latin 1. Si vous convertissez une chaîne en page de codes, elle ne s'affiche pas correctement. Vous devez donc utiliser les pages de code uniquement pour corriger les problèmes d’encodage de texte dans un fichier. Les pages de code peuvent se présenter différemment selon l'ordinateur. Elles peuvent aussi être modifiées pour un seul ordinateur, ce qui entraîne une corruption des données. Pour obtenir les résultats les plus cohérents, utilisez le format Unicode®, comme le codage UTF-8 ou UTF-16, au lieu d'une page de code spécifique, ce qui vous permettra de coder différentes langues dans le même flux de données.

UTF-8 est le moyen le plus portable et compact de stocker tout caractère et est le codage plus fréquemment utilisé. UTF-8 et UTF-16 sont des encodages à largeur variable, mais UTF-8 est compatible avec ASCII et les fichiers ont tendance à être plus petits qu’avec UTF-16.

Pour plus d'informations sur les pages de code, consultez la  bibliothèque MSDN .

Pour prendre en charge la même fonctionnalité sous Linux, Alteryx utilise la bibliothèque ICU. Nous utilisons les mêmes ID que Windows, en les transformant en convertisseurs ICU de chaîne. ICU ne prend pas en charge toute la liste de codages Windows. Il peut aussi y avoir des différences lors de la conversion des données d'une page de codes à une autre.

Identifiants de la page de code

Les identifiants de page de code suivants peuvent être utilisés avec les fonctions ConvertFromCodepage et ConvertToCodepage . Accédez à la page Fonctions  pour plus d'informations.

ID

Description

Support

37

IBM EBCDIC - États-Unis/Canada

Moteur d'origine et AMP.

500

IBM EBCDIC - International

Moteur d'origine et AMP.

932

ANSI/OEM - Japonais Shift-JIS

Moteur d'origine et AMP.

949

ANSI/OEM - Coréen EUC-KR

Moteur d'origine et AMP. Non pris en charge pour les outils Télécharger et Conversion de Blob.

1250

ANSI - Europe centrale

Moteur d'origine et AMP.

1251

ANSI - Cyrillique

Moteur d'origine et AMP.

1252

ANSI - Latin I

Moteur d'origine et AMP.

1253

ANSI - Grec

Moteur d'origine et AMP.

1254

ANSI - Turc

Moteur d'origine et AMP.

1255

ANSI - Hébreu

Moteur d'origine et AMP.

1256

ANSI - Arabe

Moteur d'origine et AMP.

1257

ANSI - Balte

Moteur d'origine et AMP.

1258

ANSI/OEM - Vietnamien

Moteur d'origine et AMP.

10000

MAC - Romain

Moteur d'origine et AMP.

28591

ISO 8859-1 Latin I

Moteur d'origine et AMP.

28592

ISO 8859-2 Europe centrale

Moteur d'origine et AMP.

28593

ISO 8859-3 Latin 3

Moteur d'origine et AMP.

28594

ISO 8859-4 Balte

Moteur d'origine et AMP.

28595

ISO 8859-5 Cyrillique

Moteur d'origine et AMP.

28596

ISO 8859-6 Arabe

Moteur d'origine et AMP.

28597

ISO 8859-7 Grec

Moteur d'origine et AMP.

28598

ISO 8859-8 Hébreu : ordre visuel

Moteur d'origine.

28599

ISO 8859-9 Latin 5

Moteur d'origine et AMP.

28605

ISO 8859-15 Latin 9

Moteur d'origine et AMP.

54936

Chinois simplifié GB18030

Moteur d'origine et AMP. Non pris en charge pour les outils Télécharger et Conversion de Blob.

65001

Unicode UTF-8

Moteur d'origine et AMP.

1200

Unicode UTF-16

Moteur d'origine et AMP.