此圖書館提供基本支援 UTF-8 編碼。此圖書館不提供任何對於 Unicode 的任何支援,除了處理編碼之外。任何需要字符意義的操作,例如角色類別,都在範圍外。
除非另有說明,否則所有預期一個字節位置作為參數的函數都會假設參數指定的位置是字串的開始或是一個字符串的長度加上。 作為字符串資料庫的數值庫,負數索引會從字串的結束開始。
你可以在這裡找到一個大型目錄使用可能的 UTF-8 角色 這裡。
概要
函式
將零個或以上的代碼點轉換為 UTF-8 位元列。
返回一個遍過指定字串中所有代碼點的迭代器函數。
將所有代碼點 (作為整數) 從指定的字串中返回。
返回指定字串中的 UTF-8 代碼點數。
返回位置 (以位元計) n -th 代碼點的 s (由位元位置 i 開始) 的位置。
返回一個會在指定字串的 граฟェ素群上重複的迭代器函數。
將輸入字串轉換為 C 形式。
將輸入字串轉換為 Normal Form D。
屬性
以下是使用 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" 的樣式,這些樣式與零或更多的 UTF-8 字符串相匹配,假設對象是一個有效的 UTF-8 字符字串。
函式
屬性
charpattern
以下是使用 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" 的完整範例: 這是使用 #[%z\x01:%z\x7F:%z\x80:%z\xBF:%z\x4] 的完整範例: