utf8

Artık kullanılmayanları göster

*Bu içerik, yapay zekâ (beta) kullanılarak çevrildi ve hatalar içerebilir. Sayfayı İngilizce görüntülemek için buraya tıkla.

Bu kütüphane UTF-8 kodlanması için temel desteği sağlar. Bu kütüphane, kodlanmanın işlenmesi dışında herhangi bir desteği sağmaz. Bir karakterin anlamını gerektiren herhangi bir işleme, karakter klasifikasyonu gibi, kütüphane dışındadır.

Aksi belirtilmediğinde, bir başlangıç ​​birimi olarak bir bayt pozisyonu bekleyen tüm işlevler, verilen pozisyonun başlangıcını veya başlangıç ​​birimi uzunluğunu aşan bir başlangıç diziolacağını varsayar. Bir sütun kütüphanesinde, negatif indeksler sütunun sonundan başlar.

Bizim kullanılabilir karakterlerin büyük bir kataloğunu UTF-8 burada bulabilirsiniz.

Özet

İşlevler

Özellikler

  • Dizinizin tam olarak sıfır veya daha fazla UTF-8 başlığı olan varsayımına dayanarak "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" şeklindeki pat턴 eşleştirilir.

İşlevler

char

Herhangi bir kod noktasının bütünlüğünü olarak sıfır veya daha fazla kod puanı alır ve tüm bu puanların birleşikliğini içeren bir dizci döndürür ve tüm bu dizilerin birleşikliğini içeren bir dizi döndürür.

Parametreler

codepoints: Tuple<number>

Dönüşler

Yapımı oluşturmak için bir itici işlevi döndürür:


for position, codepoint in utf8.codes(str) do
-- vücut
end

string str içindeki tüm kod noktaları üzerinde iterecek. bir yanlış byte dizisiyle karşılaşırsanız bir hata oluşur.

Parametreler

str: string

Geçersizleştirilecek senaryo.

codepoint

Sunulan yazılımda sağlanan tüm kod noktalarını (sayı olarak) tüm kod noktalarında işaret eder (işaret etmeyi destekler). Standart olarak i ve j (her ikisi de dahil) için değerlidir. i

Parametreler

str: string

Bu dizialınacak kod noktasının indeksi.

Varsayılan değer: 1

Döndürülecek son kod noktaları arasındaki son indeks. i ile j arasındaki eksen hariç olacak. Bu, varsayılan olarak i değerine dönecektir.

Varsayılan değer: i

Dönüşler

UTF-8 kod noktalarının yanı sıra str ile başlayan i ve j (her ikisi de dahil) arasındaki pozisyonlar için değer döndürür. 1> i1> için

Parametreler

Başlangıç pozisyonu.

Varsayılan değer: 1

Son konum.

Varsayılan değer: -1

Dönüşler

offset

Kodun n -kodlanmış noktasının başlangıcındaki konumunu (byte olarak) iade eder. s -kodlanmış noktasının başlang

Parametreler

Varsayılan değer: 1

Dönüşler

graphemes

Bir itici işlevi iade eder, böylece


for first, last in utf8.graphemes(str) do
local grapheme = s:sub(first, last)
-- vücut
end

dizi'in grafeme klüplerini iterecek.

Parametreler

Dönüşler

nfcnormalize

Yazın içindeki bozulmuş karakterleri birleşik karakterler haline getiren Normal Form C'ye dönüştürür.

Parametreler

str: string

Dönüşler

nfdnormalize

Kompozit karakterleri dekompozit karakterlere ayırma denemesi için Normal Form D'e dönüştürür.

Parametreler

str: string

Dönüştürülecek yazı.

Dönüşler

Özellikler

charpattern

Dizinizin tam olarak sıfır veya daha fazla UTF-8 başlığına sahip olduğunuzu varsayarak Pattern >[%z\x01-\x7F\xC2#xF4], UTF-8 başlığının sıfır veya daha fazla olduğunu varsayarak Dizinizin tam olarak sıfır veya daha fazla UTF-8 başlığına sahip olduğunuzu varsayarak Pattern 2>>[