PaddleOCR bertujuan untuk menciptakan pustaka alat OCR yang kaya, terdepan, dan praktis untuk membantu pengguna melatih model dan mengimplementasikan aplikasi dengan lebih baik.
PP-OCR adalah sistem OCR ultra-ringan yang praktis. Ini terutama terdiri dari tiga bagian: deteksi teks DB, koreksi bingkai deteksi, dan pengenalan teks CRNN. Sistem ini mengadopsi 19 strategi efektif dari 8 aspek: pemilihan dan penyesuaian jaringan tulang punggung, desain kepala prediksi, peningkatan data, strategi transformasi kecepatan pembelajaran, pemilihan parameter regularisasi, penggunaan model pra-pelatihan, serta pemotongan dan kuantifikasi model otomatis diperkecil, dan akhirnya diperoleh OCR Cina dan Inggris ultra-ringan dengan ukuran keseluruhan 3,5M dan OCR digital Inggris 2,8M.
1. Model pra-pelatihan berkualitas tinggi seri PPOCR, efek pengenalan akurat
Seri seluler ppocr_mobile ultra-ringan: deteksi (2,6 juta) + pengklasifikasi arah (0,9 juta) + pengenalan (4,6 juta) = 8,1 juta
Seri ppocr_server umum: deteksi (47,2 juta) + pengklasifikasi arah (0,9 juta) + pengenalan (107 juta) = 155,1 juta
Seri ppocr_mobile_slim kompresi ultra-ringan: deteksi (1,4M) + pengklasifikasi arah (0,5M) + pengenalan (1,6M) = 3,5M
2. Mendukung pengenalan kombinasi nomor Cina dan Inggris, pengenalan teks vertikal, dan pengenalan teks panjang
3. Mendukung pengenalan multi-bahasa: Korea, Jepang, Jerman, Perancis
4. Mendukung pelatihan yang ditentukan pengguna dan menyediakan solusi penerapan inferensi prediktif yang kaya
5. Mendukung instalasi dan penggunaan cepat PIP
6. Dapat berjalan di Linux, Windows, MacOS dan sistem lainnya