PaddleOCR bertujuan untuk menciptakan perpustakaan alat OCR yang kaya, terkemuka dan praktis untuk membantu pengguna melatih model yang lebih baik dan mengimplementasikannya.
PP-OCR adalah sistem OCR ultra-ringan yang praktis. Ini terutama terdiri dari tiga bagian: deteksi teks DB, koreksi bingkai deteksi, dan pengenalan teks CRNN. Sistem ini mengadopsi 19 strategi efektif dari delapan aspek: pemilihan dan penyesuaian jaringan tulang punggung, desain kepala prediksi, peningkatan data, strategi transformasi kecepatan pembelajaran, pemilihan parameter regularisasi, penggunaan model pra-pelatihan, serta pemotongan dan kuantifikasi model otomatis dan diperkecil, dan akhirnya diperoleh OCR Cina dan Inggris ultra-ringan dengan ukuran keseluruhan 3,5M dan OCR digital Inggris 2,8M.
1. Model pra-pelatihan berkualitas tinggi seri PPOCR, efek pengenalan akurat
Seri seluler ppocr_mobile ultra-ringan: deteksi (2,6 juta) + pengklasifikasi arah (0,9 juta) + pengenalan (4,6 juta) = 8,1 juta
Seri ppocr_server umum: deteksi (47,2 juta) + pengklasifikasi arah (0,9 juta) + pengenalan (107 juta) = 155,1 juta
Seri ppocr_mobile_slim kompresi ultra-ringan: deteksi (1,4M) + pengklasifikasi arah (0,5M) + pengenalan (1,6M) = 3,5M
2. Mendukung pengenalan kombinasi nomor Cina dan Inggris, pengenalan teks vertikal, dan pengenalan teks panjang
3. Mendukung pengenalan multi-bahasa: Korea, Jepang, Jerman, Perancis
4. Mendukung pelatihan yang ditentukan pengguna dan memberikan solusi penerapan penalaran prediktif yang kaya
5. Mendukung instalasi dan penggunaan cepat PIP
6. Dapat berjalan di Linux, Windows, MacOS dan sistem lainnya