Unduh PaddleOCR - Unduh kode sumber PaddleOCR

PaddleOCR

Kode sumber lainnya

2.9.1

Unduh

Bahasa Inggris |. Cina Sederhana

Perkenalan

PaddleOCR bertujuan untuk menciptakan perpustakaan alat OCR yang kaya, terkemuka dan praktis untuk membantu pengembang melatih model yang lebih baik dan mengimplementasikannya.

Masyarakat

PaddleOCR diawasi oleh PMC. Permasalahan dan PR akan ditinjau berdasarkan upaya terbaik. Untuk gambaran lengkap komunitas PaddlePaddle, silakan kunjungi komunitas.

⚠️ Catatan: Modul Masalah hanya digunakan untuk melaporkan bug program. Untuk pertanyaan lainnya, silakan buka modul Diskusi untuk mengajukan pertanyaan. Jika permasalahan yang disebutkan bukan merupakan bug, maka akan dipindahkan ke modul Diskusi.

Pembaruan terkini (lebih lanjut)

??"PaddleOCR 2.9 dirilis, alat analisis cerdas gambar teks sumber terbuka resmi", analisis tata letak gambar teks untuk mencapai prediksi waktu nyata presisi tinggi, pengembangan proses penuh kode rendah untuk mempercepat aplikasi industri. Koreksi gambar teks terintegrasi, deteksi area tata letak, deteksi teks biasa, deteksi teks segel, pengenalan teks, pengenalan formulir, dan fungsi lainnya. Enam jalur produksi model dapat dipanggil dengan satu klik, sehingga mengurangi biaya pengembangan secara signifikan. Mendukung berbagai metode penerapan seperti inferensi berkinerja tinggi, penerapan berbasis layanan, dan penerapan di sisi perangkat. Siaran langsung pada pukul 19:00 tanggal 24 Oktober (Kamis) akan memberi Anda analisis mendalam tentang hal-hal penting dari peningkatan terbaru. Tautan pendaftaran
?2024.10.1 Tambahkan kemampuan pengembangan proses penuh kode rendah di bidang OCR :

? Pengayaan model dengan panggilan satu klik : Integrasikan 17 model yang terkait dengan analisis cerdas gambar teks, OCR umum, analisis tata letak umum, pengenalan tabel umum, pengenalan formula, dan pengenalan teks segel ke dalam 6 jalur produksi model, melalui panggilan Kunci API Python minimalis ke dengan cepat merasakan efek model. Selain itu, kumpulan API yang sama juga mendukung total 200+ model seperti klasifikasi gambar, deteksi target, segmentasi gambar, dan prediksi deret waktu, membentuk 20+ modul fungsi tunggal untuk memfasilitasi pengembang dalam menggunakan kombinasi model .
? Meningkatkan efisiensi dan menurunkan ambang batas : Menyediakan dua metode berdasarkan perintah terpadu dan antarmuka grafis untuk mewujudkan penggunaan, kombinasi, dan penyesuaian model yang sederhana dan efisien. Mendukung beberapa metode penerapan seperti inferensi kinerja tinggi, penerapan berbasis layanan, dan penerapan sisi perangkat . Selain itu, Anda dapat dengan mudah beralih di antara berbagai perangkat keras mainstream seperti GPU NVIDIA, Kunlun Core, Ascend, Cambrian, dan Haiguang saat mengembangkan model.
PaddleX, alat pengembangan kode rendah, mengandalkan teknologi canggih PaddleOCR untuk mendukung kemampuan pengembangan proses penuh kode rendah di bidang OCR:
Mendukung ekstraksi informasi adegan dokumen v3PP-ChatOCRv3-doc, model deteksi area tata letak presisi tinggi berdasarkan RT-DETR dan model deteksi area tata letak efisiensi tinggi PicoDet, model pengenalan struktur tabel presisi tinggi SLANet_Plus, model koreksi gambar teks UVDoc, dan rumus model pengenalan LatexOCR, Model klasifikasi orientasi gambar dokumen berdasarkan PP-LCNet

?2024.7 Tambahkan solusi juara Tantangan Model Algoritma PaddleOCR :

Pertanyaan kompetisi 1: Solusi juara tugas pengenalan ujung ke ujung OCR - algoritma pengenalan teks adegan-SVTRv2;
Pertanyaan kompetisi 2: Solusi terbaik untuk tugas pengenalan tabel umum - algoritma pengenalan tabel-SLANet-LCNetV2.

? Fitur

Ini mendukung berbagai algoritma mutakhir terkait OCR, dan atas dasar ini menciptakan model karakteristik kelas industri PP-OCR, PP-Structure dan PP-ChatOCR, dan menghubungkan seluruh proses produksi data, pelatihan model, kompresi, dan penyebaran prediksi.