utf8
*เนื้อหานี้แปลโดยใช้ AI (เวอร์ชัน Beta) และอาจมีข้อผิดพลาด หากต้องการดูหน้านี้เป็นภาษาอังกฤษ ให้คลิกที่นี่
ห้องสมุดนี้ให้การสนับสนุนพื้นฐานสำหรับการเข้ารหัส UTF-8 นี้ ห้องสมุดนี้ไม่ให้การสนับสนุนสำหรับ Unicode นอกเหนือจากการจัดการการเข้ารหัส การดำเนินการใด ๆ ที่ต้องการความหมายขอ
ยกเว้นอย่างอื่น ฟังก์ชันทั้งหมดที่คาดหวังตำแหน่งบาทเป็นตัวแปรต้องการตำแหน่งที่เป็นจุดเริ่มต้นของตรรกะบาทหรือหนึ่งบวกความยาวของสตริง ในห้องสตริง ตัวอ้างลบจะนับจากจุดสิ้นสุดของสตริ
คุณสามารถค้นหาคุณสมบัติขนาดใหญ่ของตัวอักษร UTF-8 ที่ใช้ได้ ที่นี่
สรุป
ฟังก์ชัน
แปลงรหัส 0 หรือมากกว่าเป็น UTF-8 สตริงบาท
กลับรุ่นตัวผงัดที่ผงัดผ่านทุกค่ายืนในสตริงที่กำหนด
กลับค่าจุดโค้ด (เป็นตัวเลข) จากค่าจุดโค้ดทั้งหมดในสตริงที่กำหนด
กลับจำนวนของ UTF-8 โค้ดพอยต์ในสตริงที่กำหนด
กลับตำแหน่ง (ในบาท) ที่การเข้ารหัสของ n -th คอยล์พอร์ทของ s (นับจากตำแหน่งบาท i) เริ่มต้น
สตริง
แปลงตัวอักษรของข้อมูลเป็น C รูปแบบปกติ
แปลงตัวอักษรของข้อมูลเข้าสู่รูปแบบ D ปกติ
คุณสมบัติ
รูปแบบ "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" ซึ่งตรงกับตัวอักษร UTF-8 ตัวอักษรเดียวหรือมากขึ้น สตริงUTF-8 ที่ถูกต้อง
ฟังก์ชัน
กลับรหัสจุด (เป็นตัวเลข) จากค่าย่อในสตริงที่เริ่มต้นระหว่างตำแหน่งบาทสอง (i และ j) ทั้งสองรวมถึง
พารามิเตอร์
คุณสมบัติ
charpattern
รูปแบบ "[%z\x01-\x7F\xC2-\xF4][\x80-\xBF]*" ซึ่งตรงกับเวลาเป็น UTF-8 หรือมากกว่านั้นตามที่เราตั้งไว้ หากผู้ถูกสมัครเป็น UTF-8 สตริง โดยมีข้อกำหนดว่าเป็นต้น UTF-8 ที่ถูกต้อง