utf8

Hiển Thị Bản Đã Lỗi Thời

*Nội dung này được dịch bằng AI (Beta) và có thể có lỗi. Để xem trang này bằng tiếng Anh, hãy nhấp vào đây.

Thư viện này cung cấp hỗ trợ cơ bản cho UTF-8 mã hóa. Thư viện này không cung cấp bất kỳ hỗ trợ cho Unicode ngoài việc xử lý của mã hóa. Bất kỳ hoạt động cần ý nghĩa của một nhân vật, chẳng hạn như xếp hạng nhân vật, đều nằm ngoài phạm vi của nó.

Ngoại trừ được tuyên bố ngược lại, tất cả các chức năng kỳ vọng một vị trí bảy dòng như một tham chiếu đoán rằng vị trí đó là khởi đầu của một chuỗi bảy dòng hoặc một lần thêm chiều dài của chuỗi. Như trong thư viện chuỗi, các chỉ số âm dương đếm từ cuối của chuỗi.

Bạn có thể tìm thấy một cái gậy lớn của các nhân vật UTF-8 đang dùng ở đây .

Tóm Tắt

Chức Năng

Thuộc Tính

  • Mẫu "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*", which matches exactly zero or more UTF-8 bytes,假 sử dụng chủ đề là một chuỗi UTF-8 hợp lệ.

Chức Năng

char

Nhận zero hoặc nhiều codepoints như là số, chuyển mỗi số thành UTF-8 tương ứng và trả lại một chuỗi với sự kết hợp của tất cả các chuỗi này.

Tham Số

codepoints: Tuple<number>

Lợi Nhuận

Trả lại một hàm it器 để xây dựng:


for position, codepoint in utf8.codes(str) do
-- thân hình
end

sẽ lặp lại tất cả các điểm mã trong dòng str . Nó được gọi là một lỗi nếu nó đáp ứng bất kỳ chuỗi octet không hợp lệ nào.

Tham Số

str: string

Chuỗi để lặp lại.

codepoint

Làm tròn lại các điểm mã (như số) từ tất cả các điểm mã trong chuỗi chuỗi (str) mà bắt đầu giữa các vị trí bản chữ ij (cả hai đều

Tham Số

str: string

Mục lục của codepoint mà nên lấy từ chuỗi này.

Giá Trị Mặc Định: 1

Mục lục của các điểm mã cuối cùng giữa ij mà sẽ được trả lại. Nếu bị loại bỏ, điều này sẽ mặc định giá trị của i .

Giá Trị Mặc Định: i

Lợi Nhuận

Lại số lượng UTF-8 codepoints trong chuỗi str mà bắt đầu giữa các vị trí ij (cả hai bao gồm). Mặc định cho 1> i

Tham Số

Vị trí xuất phát.

Giá Trị Mặc Định: 1

Vị trí kết thúc.

Giá Trị Mặc Định: -1

Lợi Nhuận

offset

Tham Số

Giá Trị Mặc Định: 1

Lợi Nhuận

graphemes

Trả lại một hàm itterator để


for first, last in utf8.graphemes(str) do
local grapheme = s:sub(first, last)
-- thân hình
end

sẽ lặp lại các kết cấu dữ liệu của chuỗi.

Tham Số

Lợi Nhuận

nfcnormalize

Chuyển đổi dữ liệu nhập thành Cấu hình thường, nơi nó thử nghiệm các nhân vật bị phân hủy thành các nhân vật hợp nhất.

Tham Số

str: string

Lợi Nhuận

nfdnormalize

Chuyển đổi chuỗi nhập thành Normal Form D, which tries to break up composed characters into decorate characters.

Tham Số

str: string

Chuỗi để chuyển đổi.

Lợi Nhuận

Thuộc Tính

charpattern

Mẫu "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" , which matches exactly zero or more UTF-8 sequence,假 sử dụng chuỗi UTF-8 đầy đủ.