อังกฤษ |. จีนตัวย่อ
PaddleOCR มุ่งหวังที่จะสร้างไลบรารีเครื่องมือ OCR ชั้นนำและใช้งานได้จริงเพื่อช่วยให้นักพัฒนาฝึกฝนโมเดลที่ดีขึ้นและนำไปปฏิบัติ
PaddleOCR ได้รับการดูแลโดย PMC ปัญหาและการประชาสัมพันธ์จะได้รับการตรวจสอบบนพื้นฐานที่ดีที่สุด สำหรับภาพรวมที่สมบูรณ์ของชุมชน PaddlePaddle โปรดไปที่ชุมชน
??"PaddleOCR 2.9 เปิดตัว เครื่องมือวิเคราะห์รูปภาพข้อความโอเพ่นซอร์สอย่างเป็นทางการอย่างชาญฉลาด" การวิเคราะห์เค้าโครงรูปภาพข้อความเพื่อให้บรรลุการคาดการณ์แบบเรียลไทม์ที่มีความแม่นยำสูง การพัฒนากระบวนการแบบเต็มโค้ดต่ำเพื่อเร่งการใช้งานทางอุตสาหกรรม การแก้ไขรูปภาพข้อความแบบรวม การตรวจจับพื้นที่เค้าโครง การตรวจจับข้อความปกติ การตรวจจับข้อความซีล การจดจำข้อความ การจดจำแบบฟอร์ม และฟังก์ชันอื่นๆ สามารถเรียกสายการผลิตแบบจำลองทั้ง 6 สายการผลิตได้ในคลิกเดียว ซึ่งช่วยลดต้นทุนการพัฒนาได้อย่างมาก รองรับวิธีการปรับใช้หลายวิธี เช่น การอนุมานประสิทธิภาพสูง การปรับใช้ตามบริการ และการปรับใช้ฝั่งไคลเอ็นต์ การถ่ายทอดสด เวลา 19:00 น. ของวันที่ 24 ตุลาคม (วันพฤหัสบดี) จะให้การวิเคราะห์เชิงลึกเกี่ยวกับไฮไลท์ของการอัปเกรดล่าสุด ลิงค์ลงทะเบียน
?2024.10.1 เพิ่มความสามารถในการพัฒนากระบวนการแบบเต็มโค้ดต่ำในฟิลด์ OCR :
การเพิ่มคุณค่าโมเดลด้วยการโทรเพียงคลิกเดียว : รวม 17 โมเดล ที่เกี่ยวข้องกับการวิเคราะห์รูปภาพข้อความอัจฉริยะ, OCR ทั่วไป, การวิเคราะห์เลย์เอาต์ทั่วไป, การจดจำตารางทั่วไป, การจดจำสูตร และการจดจำข้อความที่ปิดผนึกไว้ในสายการผลิต 6 โมเดล ผ่าน การเรียกคีย์ Python API แบบเรียบง่ายไปที่ สัมผัสกับเอฟเฟกต์โมเดลอย่างรวดเร็ว นอกจากนี้ ชุด API เดียวกันยังรองรับ โมเดลมากกว่า 200 โมเดล เช่น การจำแนกรูปภาพ การตรวจจับเป้าหมาย การแบ่งส่วนรูปภาพ และการทำนายอนุกรมเวลา โดยสร้างโมดูลฟังก์ชันเดี่ยวมากกว่า 20 โมดูลเพื่ออำนวยความสะดวกให้นักพัฒนาใช้ การผสมผสานโมเดล
การปรับปรุงประสิทธิภาพและลดเกณฑ์ : ให้สองวิธีตาม คำสั่งแบบรวม และ อินเทอร์เฟซแบบกราฟิก เพื่อให้เกิดการใช้งานที่ง่ายและมีประสิทธิภาพ การผสมผสานและการปรับแต่งโมเดล รองรับวิธีการปรับใช้หลายวิธี เช่น การอนุมานประสิทธิภาพสูง การปรับใช้ตามบริการ และการปรับใช้ฝั่งไคลเอ็นต์ นอกจากนี้ คุณยังสามารถ สลับระหว่างฮาร์ดแวร์กระแสหลักต่างๆ ได้อย่างราบรื่น เช่น NVIDIA GPU, Kunlun Core, Ascend, Cambrian และ Haiguang เมื่อพัฒนาโมเดล
PaddleX ซึ่งเป็นเครื่องมือพัฒนาแบบ low code ใช้เทคโนโลยีขั้นสูงของ PaddleOCR เพื่อรองรับความสามารถในการพัฒนาแบบ low-code แบบเต็มกระบวนการในสาขา OCR:
รองรับการแยกข้อมูลฉากเอกสาร v3PP-ChatOCRv3-doc แบบจำลองการตรวจจับพื้นที่เค้าโครงที่มีความแม่นยำสูงโดยยึดตาม RT-DETR และแบบจำลองการตรวจจับพื้นที่เค้าโครงที่มีประสิทธิภาพสูงของ PicoDet แบบจำลองการจดจำโครงสร้างตารางที่มีความแม่นยำสูง SLANet_Plus แบบจำลองการแก้ไขภาพข้อความ UVDoc และสูตร โมเดลการจดจำ LatexOCR, โมเดลการจำแนกการวางแนวรูปภาพเอกสารตาม PP-LCNet
?2024.7 เพิ่มโซลูชันแชมป์เปี้ยน PaddleOCR Algorithm Model Challenge :
คำถามการแข่งขันที่ 1: โซลูชันแชมป์เปี้ยนงานการรับรู้ OCR แบบ end-to-end - อัลกอริธึมการรู้จำข้อความในฉาก-SVTRv2;
คำถามการแข่งขัน 2: โซลูชันระดับแชมป์สำหรับงานการจดจำตารางทั่วไป - อัลกอริธึมการรู้จำตาราง-SLANet-LCNetV2
รองรับอัลกอริธึมล้ำสมัยที่เกี่ยวข้องกับ OCR ที่หลากหลาย และบนพื้นฐานนี้จึงสร้างโมเดลลักษณะเฉพาะระดับอุตสาหกรรม PP-OCR, PP-Structure และ PP-ChatOCR และเชื่อมต่อกระบวนการทั้งหมดของการผลิตข้อมูล การฝึกโมเดล การบีบอัด และ การปรับใช้การคาดการณ์
หากต้องการเอกสารฉบับสมบูรณ์ โปรดไปที่: docs
e-book "การเรียนรู้ OCR แบบลงมือปฏิบัติ"
โครงการนี้เผยแพร่ภายใต้ Apache License เวอร์ชัน 2.0