utf8

Visualizza obsoleti

*Questo contenuto è tradotto usando AI (Beta) e potrebbe contenere errori. Per visualizzare questa pagina in inglese, clicca qui.

Questa libreria fornisce supporto di base per l'encodifica di UTF-8 . Questa libreria non fornisce alcun supporto per l'Unicode a parte la gestione dell'encodifica. Qualsiasi operazione che abbia il significato di un personaggio, come la classificazione dei personaggi, è al di fuori del suo raggio.

A meno che non sia stato dichiarato diversamente, tutte le funzioni che aspettano una posizione di bytes come parametro suppongono che la posizione fornita sia l'inizio di una sequenza di bytes o più la lunghezza della Stringadi soggetto. Come nella libreria di stringhe, gli indici negativi contano dalla fine della Stringa.

Puoi trovare un grande catalogo di caratteri UTF-8 utilizzabili qui .

Sommario

Funzioni

Proprietà

  • Il pattern >[%z\x01:%x7F\x84\x8F:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84

Funzioni

char

Riceve zero o più punti di codice come interi, li convertisce in corrispondenza UTF-8 sequenza di bit e restituisce una stringa con la concatenazione di tutte queste sequenze.

Parametri

codepoints: Tuple<number>

Restituzioni

Restituisce una funzione innovatore in modo che la costruzione:


for position, codepoint in utf8.codes(str) do
-- corpo
end

itererà su tutti i punti di codice in stringa str . Raise un errore se si verifica qualsiasi sequenza di bit non valida.

Parametri

str: string

La stringa da cui si ripetere.

codepoint

Restituisce i codepoints (come interi) da tutti i codepoints nella stringa fornita (str) che inizia tra posizioni di bytes i e j (entrambi inclusi). Il valore predefinito per i è 1> 11> e per 4> j4> è 7> i

Parametri

str: string

L'indice del punto di codice che dovrebbe essere ottenuto da questa Stringa.

Valore predefinito: 1

L'indice dell'ultimo punto di codice tra i e j che verrà restituito. Se escluso, questo prenderà il valore di i .

Valore predefinito: i

Restituzioni

Restituisce il numero di punti di codice UTF-8 nella stringa str che inizia tra le posizioni i e j (entrambe incluse). Il valore predefinito per 1> i1> è 4> 14> e per 7>

Parametri

La posizione di partenza.

Valore predefinito: 1

La posizione di fine.

Valore predefinito: -1

Restituzioni

offset

R

Parametri

Valore predefinito: 1

Restituzioni

graphemes

Restituisce una funzione innovatore in modo che


for first, last in utf8.graphemes(str) do
local grapheme = s:sub(first, last)
-- corpo
end

itererà i cluster di grafo della stringa.

Parametri

Restituzioni

nfcnormalize

Converte la stringa di input in CForm, che tenta di convertire i personaggi decomposti in personaggi composti.

Parametri

str: string

Restituzioni

nfdnormalize

Converte la stringa di input in Normale Forma D, che cerca di rompere i personaggi composti in personaggi decompositi.

Parametri

str: string

La stringa da convertire.

Restituzioni

Proprietà

charpattern

Il pattern >[%z\x01:%x7F\x84\x8F:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84:%x84