utf8

顯示已棄用項目

*此內容是使用 AI(Beta 測試版)翻譯,可能含有錯誤。若要以英文檢視此頁面,請按一下這裡

這個庫提供基本支持 UTF-8 編碼。這個庫不提供與編碼處理以外的任何Unicode支持。任何需要字元意義的操作,例如字元分類,都超出其範圍。

除非另有說明外,所有預期骨牌位置作為參數的功能都假設指定位置是骨牌順序的開始或一加主題字串的長度。正如在字串庫中,負指數從字串末端開始計數。

您可以在此 UTF-8 找到大量可用的 字符目錄。

概要

函式

屬性

  • 模式 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" , 匹配零或更多的 UTF-8 位元順序, 假設主題是一個有效的 UTF-8 字串。

函式

char

接收零或更多的代碼點作為整數,將每個轉換為對應的 UTF-8 位元順序,並返回包含所有這些順序的字串。

參數

codepoints: Tuple<number>

返回

返回一個迭代器函數,以便建造:


for position, codepoint in utf8.codes(str) do
-- 身體
end

會在字串 str 中循環所有代碼點。如果遇到任何無效的字元順序,就會發出錯誤。

參數

str: string

要循環的字串。

codepoint

返回所有代碼點 (作為整數) 從提供的字串 (str) 中的所有代碼點,開始於 byte 位置 ij (兩者都包括) 之間。對於 i 的預設值是 1 ,對於 j 的預設值是 i 。如果它遇到任何無效的字元順序,就會發出錯誤。

參數

str: string

應從此字串中擷取的代碼點的指數。

預設值:1

ij 之間的最後一個代碼點的索引,將被返回。如果被排除,這將默認為 i 的值。

預設值:i

返回

返回字串 str 中的UTF-8代碼點數的數量,該數量開始於位置 ij (兩者包括)。對於 i 的預設值是 1 ,對於 j 的預設值是 -1 。如果發現任何無效的字元順序,將返回零值加上第一個無效字元的位置。

參數

起始位置。

預設值:1

結束位置。

預設值:-1

返回

offset

返回位置 (以字元位置計算),在那裡 -第 行代碼點的編碼開始。負的 n 獲得位置前的字符 i .預設值 是 當 不是負值,且 否則,以便 從字串末端獲得第 》字元的偏移。如果指定的字符不在主題中或結束後,函數返回 nil

參數

預設值:1

返回

graphemes

返回一個迭代器函數,以便


for first, last in utf8.graphemes(str) do
local grapheme = s:sub(first, last)
-- 身體
end

將會循環字串的 grapheme 集群。

參數

返回

nfcnormalize

將輸入字串轉換為普通形式 C,嘗試將分解的字符轉換為組合的字符。

參數

str: string

返回

nfdnormalize

將輸入字串轉換為普通形式 D,該形式試圖將組合字元分解為分離字元。

參數

str: string

要轉換的字串。

返回

屬性

charpattern

模式 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" , 匹配零或更多的 UTF-8 位元順序, 假設主題是一個有效的 UTF-8 字串。