이 라이브러리는 UTF-8 인코딩에 대한 기본 지원을 제공합니다. 이 라이브러리는 인코딩 처리 외에는 유니코드에 대한 지원을 제공하지 않습니다. 캐릭터 클래식화와 같은 의미의 개체에 대한 작업은 이 라이브러리의 범위 밖입니다.
다른 경우를 제외하고는 바이트 위치를 매개 변수로 기대하는 모든 함수는 주소 순서의 시작이거나 주소 문자열의 길이와 관련된 하나 이상의 기능을 기대합니다. 즉, 문자열 라이브러리에서 부정 인덱스는 문자열의 끝에서 카운트됩니다.
여기에서 사용 가능한 UTF-8 문자 카탈로그를 대량으로 찾을 수 있습니다.
요약
함수
속성
패턴 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*", 주제가 UTF-8 문자열인 경우 정확히 0바이트 순서를 일치하는 UTF-8 바이트 시퀀스를 찾습니다. 여기에서 주제는 유효한 UTF-8 문자열입니다.
함수
속성
charpattern
패턴 "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*", 주제가 UTF-8 문자열인 경우 정확히 0바이트 순서를 일치하는 UTF-8 바이트 시퀀스를 나타냅니다. 순서가 UTF-8 문자열이 아닌 경우 순서가 더 낮은 바이트 순서를 나타냅니다. 순서가 더 낮은 바이트 순서이면 순서가 더