utf8

顯示已棄用項目

*此內容是使用 AI(Beta 測試版)翻譯,可能含有錯誤。若要以英文檢視此頁面,請按一下這裡

此圖書館提供基本支援 UTF-8 編碼。此圖書館不提供任何對於 Unicode 的任何支援,除了處理編碼之外。任何需要字符意義的操作,例如角色類別,都在範圍外。

除非另有說明,否則所有預期一個字節位置作為參數的函數都會假設參數指定的位置是字串的開始或是一個字符串的長度加上。 作為字符串資料庫的數值庫,負數索引會從字串的結束開始。

你可以在這裡找到一個大型目錄使用可能的 UTF-8 角色 這裡

概要

函式

屬性

  • 以下是使用 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" 的樣式,這些樣式與零或更多的 UTF-8 字符串相匹配,假設對象是一個有效的 UTF-8 字符字串。

函式

char

以零或更多的代碼點作為整數,將每個都轉換成對應的 UTF-8 位元列,並且以串作為所有這些順序的結合。

參數

codepoints: Tuple<number>

返回

返回一個遍徑函數,以便建造:


for position, codepoint in utf8.codes(str) do
-- 身體
end

會在 string str 中反覆掃描所有代碼點。如果它遇到任何不正確的字符串順序,就會發生錯誤。

參數

str: string

可以迭代的字串。

codepoint

將所有代碼點 (作為整數) 從提供的串(str)中返回,其中開始於位元位置 ij (含) 的預設值為 i 和 1> j1> (含) 。 發生錯誤如果它與任何無效的字串位置相

參數

str: string

這個字串的代碼點索引。

預設值:1

ij 之間的最後一個代碼點的索引,將會返回。如果被排除,這將以 i 的值預設。

預設值:i

返回

返回 str str 中的 UTF-8 代碼點數,開始在位置 ij 之間 (含在 both 1> i1> 和 4> j4> 之間)。默認值為 7>

參數

開始位置。

預設值:1

結束位置。

預設值:-1

返回

offset

返回位置 (以字節為單位) 代表 n -th 代碼點的位置開始。當 s (從字串結束開始)的位置為正確時,默認為

參數

預設值:1

返回

graphemes

返回一個遍徑器函數,以便


for first, last in utf8.graphemes(str) do
local grapheme = s:sub(first, last)
-- 身體
end

會以字串的圖形集群作為輸入。

參數

返回

nfcnormalize

將輸入字串轉換為 C,這嘗試將解體的角色轉換為組合角色。

參數

str: string

返回

nfdnormalize

將輸入字串轉換為普通形式 D,嘗試將組合字符分解成個別字符。

參數

str: string

要轉換的字串。

返回

屬性

charpattern

以下是使用 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" 的完整範例: 這是使用 #[%z\x01:%z\x7F:%z\x80:%z\xBF:%z\x4] 的完整範例: