utf8

사용되지 않는 항목 표시

*이 콘텐츠는 AI(베타)를 사용해 번역되었으며, 오류가 있을 수 있습니다. 이 페이지를 영어로 보려면 여기를 클릭하세요.

이 라이브러리는 UTF-8 인코딩에 대한 기본 지원을 제공합니다.이 라이브러리는 인코딩 처리 이외에 유니코드에 대한 지원을 제공하지 않습니다.문자 분류와 같이 의미가 필요한 모든 작업은 범위 밖에 있습니다.

명시되지 않은 경우, 매개 변수로 바이트 위치를 기대하는 모든 함수는 지정된 위치가 바이트 시퀀스의 시작이거나 주제 문자열의 길이를 더한 것이라고 가정합니다.문자열 라이브러리와 마찬가지로 부정 인덱스는 문자열의 끝부터 계산됩니다.

여기에서 UTF-8 사용 가능한 큰 카탈로그의 문자 를 찾을 수 있습니다..

요약

함수

속성

  • 주제가 유효한 UTF-8 문자열인 경우 정확히 0개 이상의 UTF-8 바이트 시퀀스와 일치하는 패턴 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" , 대상이 유효한 UTF-8 문자열인 경우.

함수

char

정수로 0개 이상의 코드 포인트를 받아 각각을 해당하는 UTF-8 바이트 시퀀스로 변환하고 모든 시퀀스의 연결로 문자열을 반환합니다.

매개 변수

codepoints: Tuple<number>

반환

건설을 수행하기 위해 반복기 함수를 반환합니다.


for position, codepoint in utf8.codes(str) do
-- 신체
end

문자열의 모든 코드포인트를 반복합니다 str. 유효하지 않은 바이트 시퀀스를 만나면 오류가 발생합니다.

매개 변수

str: string

반복할 문자열.

codepoint

제공된 문자열(str)에서 바이트 위치 i 와 바이트 위치 j 사이에서 시작하는 모든 코드포인트(정수로)를 반환합니다(둘 다 포함).기본값은 i 이고, 기본값은 1 이고, 기본값은 j 이고, 기본값은 i 입니다.유효하지 않은 바이트 시퀀스를 만나면 오류가 발생합니다.

매개 변수

str: string

이 문자열에서 가져올 코드포인트의 인덱스.

기본값: 1

반환될 마지막 코드포인트 인덱스는 ij 사이의 값입니다. 제외되면 기본값은 i 이 됩니다.

기본값: i

반환

UTF-8 코드 포인트 수를 문자열 str에서 위치 ij 사이에서 시작하는 문자열로 반환합니다(둘 다 포함).기본값은 이고, 의 기본값은 입니다.유효하지 않은 바이트 시퀀스를 찾으면 닐 값과 첫 번째 유효하지 않은 바이트의 위치를 반환합니다.

매개 변수

시작 위치.

기본값: 1

종료 위치.

기본값: -1

반환

offset

의 코드포인트 인코딩이 시작되는 위치(바이트 단위)를 반환합니다(바이트 위치에서 계산).음의 n 는 위치 i 전에 문자를 가져옵니다.기본값은 에서 이며, 가 음의 값이 아니고 그렇지 않으면, 그래서 문자의 오프셋이 문자열의 끝에서 얻습니다.지정된 문자가 주제에 없거나 종료바로 뒤에 없으면 함수는 nil를 반환합니다.

매개 변수

기본값: 1

반환

graphemes

반복기 함수를 반환하여


for first, last in utf8.graphemes(str) do
local grapheme = s:sub(first, last)
-- 신체
end

문자열의 그래펴 클러스터를 반복합니다.

매개 변수

반환

nfcnormalize

입력 문자열을 분해된 문자를 구성된 문자로 변환하려는 일반 형식 C로 변환합니다.

매개 변수

str: string

반환

nfdnormalize

입력 문자열을 분해된 문자로 분리하려는 일반 형식 D로 변환합니다.Converts the input string to Normal Form D, which tries to break up composed characters into decomposed characters.

매개 변수

str: string

변환할 문자열.

반환

속성

charpattern

주제가 유효한 UTF-8 문자열인 경우 정확히 0개 이상의 UTF-8 바이트 시퀀스와 일치하는 패턴 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" , 대상이 유효한 UTF-8 문자열인 경우.