utf8
*Bu içerik, yapay zekâ (beta) kullanılarak çevrildi ve hatalar içerebilir. Sayfayı İngilizce görüntülemek için buraya tıkla.
Bu kütüphane UTF-8 kodlanması için temel desteği sağlar. Bu kütüphane, kodlanmanın işlenmesi dışında herhangi bir desteği sağmaz. Bir karakterin anlamını gerektiren herhangi bir işleme, karakter klasifikasyonu gibi, kütüphane dışındadır.
Aksi belirtilmediğinde, bir başlangıç birimi olarak bir bayt pozisyonu bekleyen tüm işlevler, verilen pozisyonun başlangıcını veya başlangıç birimi uzunluğunu aşan bir başlangıç diziolacağını varsayar. Bir sütun kütüphanesinde, negatif indeksler sütunun sonundan başlar.
Bizim kullanılabilir karakterlerin büyük bir kataloğunu UTF-8 burada bulabilirsiniz.
Özet
İşlevler
Zero veya daha fazla kod puanını UTF-8 byonuşumunu yapar.
Verilen diziboyunca tüm kod noktalarını iterecek bir itici işlevi döndürür.
Verilen diziüzerindeki tüm kod noktalarını (sayı olarak) iade eder.
Belirli bir diziUTF-8 kod puanlarının sayısını iade eder.
n kod noktasının kodlanmasının başladığı pozisyonu (byte pozisyonu ile sayılır s olarak) geri döndürür.
Verilen bir diziaracının üzerindeki grafem gruplarını iterecek bir itici işlevi döndürür.
Giriş dizesini Normal Form C'ye dönüştürür.
Giriş dizesini Normal Form D'ye dönüştürür.
Özellikler
Dizinizin tam olarak sıfır veya daha fazla UTF-8 başlığı olan varsayımına dayanarak "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" şeklindeki pat턴 eşleştirilir.
İşlevler
codes
Yapımı oluşturmak için bir itici işlevi döndürür:
for position, codepoint in utf8.codes(str) do-- vücutend
string str içindeki tüm kod noktaları üzerinde iterecek. bir yanlış byte dizisiyle karşılaşırsanız bir hata oluşur.
Parametreler
Geçersizleştirilecek senaryo.
Sunulan yazılımda sağlanan tüm kod noktalarını (sayı olarak) tüm kod noktalarında işaret eder (işaret etmeyi destekler). Standart olarak i ve j (her ikisi de dahil) için değerlidir. i
Parametreler
Özellikler
charpattern
Dizinizin tam olarak sıfır veya daha fazla UTF-8 başlığına sahip olduğunuzu varsayarak Pattern >[%z\x01-\x7F\xC2#xF4], UTF-8 başlığının sıfır veya daha fazla olduğunu varsayarak Dizinizin tam olarak sıfır veya daha fazla UTF-8 başlığına sahip olduğunuzu varsayarak Pattern 2>>[