utf8

Afficher les obsolètes

*Ce contenu est traduit en utilisant l'IA (Beta) et peut contenir des erreurs. Pour consulter cette page en anglais, clique ici.

Cette bibliothèque fournit un support de base pour l'encodage UTF-8. Cette bibliothèque ne fournit aucun support pour l'Unicode autre que le traitement de l'encodage. Toute opération qui nécessite la signification d'un caractère, telle que la classeification des caractères, est hors de son champ d'application.

À moins qu'indiqué autrement, toutes les fonctions qui attendent une position de octet en tant que paramètre supposent que la position donnée est soit le début d'une séquence d'octets ou un plus la longueur de la chaîne de sujet. Comme dans la bibliothèque de chaînes, les index négatifs comptent à partir de la fin de la chaîne.

Vous pouvez trouver un grand catalogue de UTF-8 personnages ici .

Résumé

Propriétés

  • Le motif "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*", qui correspond exactement à zéro ou plus de séquences de octets UTF-8, en supposant que le sujet est une chaîne UTF-8 valide.

Fonctions

char

Paramètres

codepoints: Tuple<number>

Retours

Paramètres

str: string

codepoint

Paramètres

str: string
Valeur par défaut : 1
Valeur par défaut : i

Retours

Paramètres

Valeur par défaut : 1
Valeur par défaut : -1

Retours

offset

Paramètres

Valeur par défaut : 1

Retours

graphemes

Paramètres

Retours

nfcnormalize

Paramètres

str: string

Retours

nfdnormalize

Paramètres

str: string

Retours

Propriétés

charpattern

Le motif "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*", qui correspond exactement à la séquence de octets UTF-8, en supposant que le sujet est une chaîne UTF-8 valide.