utf8

แสดงที่เลิกใช้งานแล้ว

*เนื้อหานี้แปลโดยใช้ AI (เวอร์ชัน Beta) และอาจมีข้อผิดพลาด หากต้องการดูหน้านี้เป็นภาษาอังกฤษ ให้คลิกที่นี่

ไลบรารีนี้ให้การสนับสนุนพื้นฐานสำหรับการเข้ารหัส UTF-8ไลบรารีนี้ไม่ให้การสนับสนุน Unicode อื่นจากการจัดการการเข้ารหัสการดำเนินการใดๆ ที่ต้องการความหมายของตัวละคร เช่น การจัดประเภทตัวละคร อยู่นอกขอบเขต

เว้นแต่ระบุเป็นอย่างอื่น, ฟังก์ชันทั้งหมดที่คาดว่าตำแหน่งไบต์เป็นพารามิเตอร์จะคิดว่าตำแหน่งที่กำหนดเป็นจุดเริ่มต้นของลำดับไบต์หรือหนึ่งบวกความยาวของสตริงหัวข้อเช่นเดียวกับในห้องสมุดสตริง ดัชนีลบนับจากจุดสิ้นสุดของสตริง

คุณสามารถค้นหาคลังข้อมูลขนาดใหญ่ของตัวอักษรที่ใช้ได้ UTF-8 จำนวนมาก ที่นี่

สรุป

ฟังก์ชัน

  • char(codepoints : Tuple<number>):string

    แปลงจุดโค้ดเป็นศูนย์หรือมากกว่าเป็นลำดับไบต์ UTF-8

  • คืนฟังก์ชัน iterator ที่จะเลื่อนผ่านจุดโค้ดทั้งหมดในสตริงที่กำหนดไว้

  • คืนจุดรหัส (เป็นตัวเลข) จากจุดรหัสทั้งหมดในสตริงที่กำหนดไว้

  • คืนจำนวนจุดรหัส UTF-8 ในสตริงที่กำหนด

  • ส่งคืนตำแหน่ง (ในไบต์) ที่การเข้ารหัสของจุดตัวเลข (นับจากตำแหน่งไบต์ ) เริ่มต้น

  • คืนฟังก์ชัน iterator ที่จะเดินทางผ่านกลุ่มของ grapheme ของสตริงที่กำหนดไว้

  • แปลงสตริงอินพุตเป็นรูปแบบปกติ C

  • แปลงสตริงอินพุตเป็นรูปแบบปกติ D

คุณสมบัติ

  • รูปแบบ "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" ซึ่งตรงกับไบต์ข้อมูล UTF-8 ที่เป็นศูนย์หรือมากกว่านั้นโดยสมบูรณ์โดยสมมติว่าหัวข้อเป็นข้อความ UTF-8 ที่ถูกต้อง

ฟังก์ชัน

char

พารามิเตอร์

codepoints: Tuple<number>

ส่งค่ากลับ

พารามิเตอร์

str: string

ส่งค่ากลับ

codepoint

พารามิเตอร์

str: string
ค่าเริ่มต้น: 1
ค่าเริ่มต้น: i

ส่งค่ากลับ

พารามิเตอร์

ค่าเริ่มต้น: 1
ค่าเริ่มต้น: -1

ส่งค่ากลับ

offset

พารามิเตอร์

ค่าเริ่มต้น: 1

ส่งค่ากลับ

graphemes

พารามิเตอร์

ส่งค่ากลับ

nfcnormalize

พารามิเตอร์

str: string

ส่งค่ากลับ

nfdnormalize

พารามิเตอร์

str: string

ส่งค่ากลับ

คุณสมบัติ

charpattern