PaddleOCR มุ่งหวังที่จะสร้างไลบรารีเครื่องมือ OCR ที่สมบูรณ์ เป็นผู้นำ และใช้งานได้จริง เพื่อช่วยให้ผู้ใช้ฝึกฝนโมเดลที่ดีขึ้นและปรับใช้แอปพลิเคชันต่างๆ
PP-OCR เป็นระบบ OCR ที่มีน้ำหนักเบาเป็นพิเศษและใช้งานได้จริง ส่วนใหญ่ประกอบด้วยสามส่วน: การตรวจจับข้อความ DB, การแก้ไขเฟรมการตรวจจับ และการจดจำข้อความ CRNN ระบบใช้กลยุทธ์ที่มีประสิทธิภาพ 19 ประการจาก 8 ด้าน ได้แก่ การเลือกและการปรับเครือข่ายแกนหลัก การออกแบบส่วนหัวการทำนาย การปรับปรุงข้อมูล กลยุทธ์การเปลี่ยนแปลงอัตราการเรียนรู้ การเลือกพารามิเตอร์การทำให้เป็นมาตรฐาน การใช้แบบจำลองก่อนการฝึกอบรม และการครอบตัดและการหาปริมาณแบบจำลองอัตโนมัติ เพรียวบางลง และในที่สุดก็ได้รับ OCR ภาษาจีนและอังกฤษที่มีน้ำหนักเบาเป็นพิเศษ โดยมีขนาดโดยรวม 3.5M และ OCR ดิจิทัลภาษาอังกฤษเป็น 2.8M
1. โมเดลการฝึกอบรมล่วงหน้าคุณภาพสูง PPOCR ซีรีส์เอฟเฟกต์การจดจำที่แม่นยำ
ซีรีย์มือถือ ppocr_mobile ที่เบาเป็นพิเศษ: การตรวจจับ (2.6M) + ตัวแยกประเภททิศทาง (0.9M) + การจดจำ (4.6M) = 8.1M
ซีรีส์ ppocr_server ทั่วไป: การตรวจจับ (47.2M) + ตัวแยกประเภททิศทาง (0.9M) + การจดจำ (107M) = 155.1M
ซีรี่ส์ ppocr_mobile_slim การบีบอัดน้ำหนักเบาพิเศษ: การตรวจจับ (1.4M) + ตัวแยกประเภททิศทาง (0.5M) + การจดจำ (1.6M) = 3.5M
2. รองรับการจดจำตัวเลขภาษาจีนและภาษาอังกฤษ การจดจำข้อความแนวตั้ง และการจดจำข้อความขนาดยาว
3. รองรับการจดจำหลายภาษา: เกาหลี ญี่ปุ่น เยอรมัน ฝรั่งเศส
4. สนับสนุนการฝึกอบรมที่ผู้ใช้กำหนดและมอบโซลูชันการปรับใช้การอนุมานเชิงคาดการณ์ที่หลากหลาย
5. รองรับการติดตั้งและใช้งาน PIP อย่างรวดเร็ว
6. สามารถทำงานบน Linux, Windows, MacOS และระบบอื่นๆ