utf8
*Questo contenuto è tradotto usando AI (Beta) e potrebbe contenere errori. Per visualizzare questa pagina in inglese, clicca qui.
Questa libreria fornisce supporto di base per l'encodifica di UTF-8 . Questa libreria non fornisce alcun supporto per l'Unicode a parte la gestione dell'encodifica. Qualsiasi operazione che abbia il significato di un personaggio, come la classificazione dei personaggi, è al di fuori del suo raggio.
A meno che non sia stato dichiarato diversamente, tutte le funzioni che aspettano una posizione di bytes come parametro suppongono che la posizione fornita sia l'inizio di una sequenza di bytes o più la lunghezza della Stringadi soggetto. Come nella libreria di stringhe, gli indici negativi contano dalla fine della Stringa.
Puoi trovare un grande catalogo di caratteri UTF-8 utilizzabili qui .
Sommario
Funzioni
Converte zero o più punti del codice in sequenze UTF-8.
Restituisce una funzione innovatore che itera su tutti i punti di codice in una certa Stringa.
Restituisce i punti di codice (come interi) da tutti i punti di codice in una certa Stringa.
Restituisce il numero di punti UTF-8 in una certa Stringa.
Restituisce la posizione (in bytes) in cui l'encodifica del codice n - punto di interruzione di s (conteggio dalla posizione di bytes i ) inizia.
Restituisce una funzione innovatore che itera sui cluster diapositiva di una certa Stringa.
Converte la stringa di input in C形a normale.
Converte la stringa di input in Forma Normale D.
Proprietà
Il pattern >[%z\x01:%x7F\x84\x8F:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84
Funzioni
codes
Restituisce una funzione innovatore in modo che la costruzione:
for position, codepoint in utf8.codes(str) do-- corpoend
itererà su tutti i punti di codice in stringa str . Raise un errore se si verifica qualsiasi sequenza di bit non valida.
Parametri
La stringa da cui si ripetere.
Restituisce i codepoints (come interi) da tutti i codepoints nella stringa fornita (str) che inizia tra posizioni di bytes i e j (entrambi inclusi). Il valore predefinito per i è 1> 11> e per 4> j4> è 7> i
Parametri
len
Restituisce il numero di punti di codice UTF-8 nella stringa str che inizia tra le posizioni i e j (entrambe incluse). Il valore predefinito per 1> i1> è 4> 14> e per 7>
Parametri
Restituzioni
Proprietà
charpattern
Il pattern >[%z\x01:%x7F\x84\x8F:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84