utf8
*Bu içerik, yapay zekâ (beta) kullanılarak çevrildi ve hatalar içerebilir. Sayfayı İngilizce görüntülemek için buraya tıkla.
Bu kütüphane UTF-8 kodlama için temel destek sağlar.Bu kütüphane, kodlamanın ele alınması dışında Unicode'a herhangi bir destek sağlamaz.Karakterin anlamına ihtiyaç duyan herhangi bir operasyon, karakter sınıflandırması gibi, kapsamının dışındadır.
Aksi belirtilmediği sürece, bir byte pozisyonu parametre olarak bekleyen tüm işlevler, verilen pozisyonun bir byte dize başlangıcı veya konu dize uzunluğunun bir artı olduğunu varsayar.Dize kütüphanesinde olduğu gibi, negatif indeksler dizisonundan sayılır.
Kullanılabilir UTF-8 karakterlerin geniş bir kataloğunu burada bulabilirsiniz burada .
Özet
İşlevler
Sıfır veya daha fazla kod noktasını UTF-8 bayt sıralarına dönüştürür.
Verilen dizitüm kod noktaları üzerinde dönen bir döngü işlevi döndürür.
Verilen metindeki tüm kod noktalarının (tamsayı olarak) kod noktalarını döndürür.
Verilen diziUTF-8 kod noktaları sayısını döndürür.
Kod noktası n ‑in kodlanmasının başladığı pozisyonu (byte pozisyonundan sayılarak) döndürür (s noktasından sayılan) i (byte pozisyonundan sayılan).
Verilen bir dizeyi grafem kümeleri üzerinde dönen bir döngü işlevi döndürür.
Giriş dizesini Normal Form C'ye dönüştürür.
Giriş dizesini Normal Form D'ye dönüştürür.
Özellikler
Konunun geçerli bir UTF-8 dize olduğunu varsayarak, "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" modeli kesinlikle sıfır veya daha fazla UTF-8 bayt dizisiyle eşleşir.
İşlevler
codes
İnşaatı gerçekleştirmek için bir döngü işlevi döndürür, böylece:
for position, codepoint in utf8.codes(str) do-- vücutend
string'teki tüm kod noktaları üzerinde dönecektir str. Herhangi bir geçersiz bayt sırasıyla karşılaşırsa bir hata oluşturur.
Parametreler
Tekrar edilecek dize.
Verilen metindeki tüm kod noktalarını (tamsayı olarak) byte konumları arasında başlayan i ve j (her ikisi de dahil) kod noktalarından döndürür.Varsayılan i için vardır 1 ve j için vardır i .Herhangi bir geçersiz bayt sırasıyla karşılaşırsa bir hata oluşturur.
Parametreler
len
UTF-8 kod noktalarının sayısını dize str arasında başlayan pozisyonlar i ve j (her ikisi de dahil) arasında başlayan dizeye geri döndürür.Varsayılan i için değer 1 ve j için değer -1.Herhangi bir geçersiz bayt sırası bulursa, bir nil değeri plus ilk geçersiz baytın konumu döndürür.
Parametreler
Dönüşler
offset
Kod noktası n ‑in kodlanmasının başladığı pozisyonu (byte pozisyonundan sayılarak) döndürür (s noktasından sayılan) i (byte pozisyonundan sayılan).Negatif bir n karakterleri pozisyon i öncesinde alır.Varsayılan için değeri , negatif olmadığında ve aksi takdirde, böylece ‑ün karakterinin dize sonundaki ofsetini alır.Belirtilen karakter ne konuya ne de bitirhemen sonra değilse, işlev nil döndürür.
Dönüşler
Özellikler
charpattern
Konunun geçerli bir UTF-8 diziolduğunu varsayarak, "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" modeli kesinlikle sıfır veya daha fazla UTF-8 bayt sıra eşleşir.