이 라이브러리는 UTF-8 인코딩에 대한 기본 지원을 제공합니다. 이 라이브러리는 인코딩 처리 외에는 유니코드에 대한 지원을 제공하지 않습니다. 캐릭터 클래식화와 같은 의미의 개체에 대한 작업은 이 라이브러리의 범위 밖입니다.
다른 경우를 제외하고는 바이트 위치를 매개 변수로 기대하는 모든 함수는 주소 순서의 시작이거나 주소 문자열의 길이와 관련된 하나 이상의 기능을 기대합니다. 즉, 문자열 라이브러리에서 부정 인덱스는 문자열의 끝에서 카운트됩니다.
여기에서 사용 가능한 UTF-8 문자 카탈로그를 대량으로 찾을 수 있습니다.
요약
함수
0개 이상의 코드포인트를 UTF-8 바이트 시퀀스로 변환합니다.
지정된 문자열의 모든 코드포인트를 반복하는 반복기 함수를 반환합니다.Returns an iterator function that iterates over all codepoints in a given string.
지정된 문자열의 모든 코드포인트(정수)를 반환합니다.
지정된 문자열에 있는 UTF-8 코드포인트 수를 반환합니다.
n 코드포인트의 암호화 코드 위치(바이트 기준)를 반환합니다(쿼트 기준).s (카운트 기준)에서 시작합니다.
지정된 문자열의 그래프 클러스터를 반복하는 반복기 함수를 반환합니다.Returns an iterator function that iterates over the grapheme clusters of a given string.
입력 문자열을 일반 형식 C로 변환합니다.
입력 문자열을 일반 형식 D로 변환합니다.
속성
패턴 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*", 주제가 UTF-8 문자열인 경우 정확히 0바이트 순서를 일치하는 UTF-8 바이트 시퀀스를 찾습니다. 여기에서 주제는 유효한 UTF-8 문자열입니다.
함수
속성
charpattern
패턴 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*", 주제가 UTF-8 문자열인 경우 정확히 0바이트 순서를 일치하는 UTF-8 바이트 시퀀스를 나타냅니다. 순서가 UTF-8 문자열이 아닌 경우 순서가 더 낮은 바이트 순서를 나타냅니다. 순서가 더 낮은 바이트 순서이면 순서가 더