Cina • Inggris • Jepang
Perangkat lunak OCR offline gratis, sumber terbuka, dan berkemampuan batch
Berlaku untuk Windows7 x64, Linux x64
Gratis : Semua kode dalam proyek ini adalah open source dan sepenuhnya gratis.
Nyaman : Buka zip dan gunakan, jalankan offline, tidak memerlukan jaringan.
Efisien : Dilengkapi dengan mesin OCR offline yang sangat efisien dan perpustakaan pengenalan beberapa bahasa bawaan.
Fleksibel : Mendukung metode panggilan eksternal seperti baris perintah dan antarmuka HTTP.
Fungsi : Tangkapan Layar OCR / Batch OCR / Pengenalan PDF / Pengenalan kode QR / pengenalan rumus
Pengenalan tangkapan layar
Analisis penyusunan huruf - mengidentifikasi berbagai jenis tipe dan menampilkan teks dalam urutan yang benar
Identifikasi kumpulan
Abaikan area - kecualikan teks pada tanda air tangkapan layar
Kode QR mendukung pemindaian atau pembuatan gambar kode QR
Pengenalan dokumen mengekstrak teks dari pindaian PDF atau mengubahnya menjadi PDF dua lapis yang dapat dicari
Pengaturan global
Panggilan baris perintah
antarmuka HTTP
Bangun proyek (Windows, Linux)
Pengembang harap pastikan untuk membaca Proyek Bangunan.
Tautan rilis berikut dipertahankan untuk waktu yang lama dan menyediakan unduhan versi stabil.
Lanzoul Cloud https://hiroi-sora.lanzoul.com/s/umi-ocr (rekomendasi domestik, tanpa registrasi/kecepatan tidak terbatas)
GitHub https://github.com/hiroi-sora/Umi-OCR/releases/latest
Sumber Forge https://sourceforge.net/projects/umi-ocr
Scoop adalah program instalasi baris perintah di Windows yang dapat dengan mudah mengelola banyak aplikasi. Anda dapat menginstal Scoop terlebih dahulu, lalu gunakan petunjuk berikut untuk menginstal Umi-OCR
:
Tambahkan ember extras
:
scoop bucket add extras
(Opsional 1) Instal Umi-OCR (dilengkapi dengan mesin Rapid-OCR
, kompatibilitas baik):
scoop install extras/umi-ocr
(Opsional 2) Instal Umi-OCR (dilengkapi dengan mesin Paddle-OCR
, sedikit lebih cepat):
scoop install extras/umi-ocr-paddle
Jangan menginstal keduanya secara bersamaan, pintasannya mungkin tertimpa. Namun Anda dapat mengimpor plug-in tambahan dan beralih ke mesin OCR yang berbeda kapan saja.
Paket rilis perangkat lunak diunduh sebagai paket terkompresi .7z
atau paket self-extracting .7z.exe
. Paket self-extracting dapat mendekompresi file pada komputer yang tidak menginstal perangkat lunak kompresi.
Perangkat lunak ini tidak memerlukan instalasi. Setelah membuka ritsleting, klik Umi-OCR.exe
untuk memulai program.
Jika Anda mengalami masalah, silakan kirimkan Masalah dan saya akan mencoba yang terbaik untuk membantu Anda.
Antarmuka yang didukung oleh Umi-OCR tersedia dalam berbagai bahasa. Saat Anda membuka perangkat lunak untuk pertama kali, bahasa akan secara otomatis diubah sesuai dengan pengaturan sistem komputer Anda.
Jika Anda perlu mengganti bahasa secara manual, lihat gambar di bawah,全局设置
→语言/Language
.
Umi-OCR v2 terdiri dari serangkaian tab yang fleksibel dan mudah digunakan. Anda dapat membuka tab yang diperlukan sesuai preferensi Anda.
Anda dapat mengalihkan jendela ke atas di sudut kiri atas bilah tab. Tab dapat dikunci di pojok kanan atas untuk mencegah tab tertutup secara tidak sengaja selama penggunaan sehari-hari.
Tangkapan Layar OCR : Setelah membuka halaman ini, Anda dapat menggunakan tombol pintasan untuk menampilkan tangkapan layar dan mengenali teks dalam gambar.
Di bilah pratinjau gambar di sebelah kiri, Anda dapat langsung memilih dan menyalin dengan mouse.
Di kolom rekaman identifikasi di sebelah kanan, teks dapat diedit dan beberapa rekaman dapat dipilih dan disalin.
Ini juga mendukung penyalinan gambar di tempat lain dan menempelkannya ke Umi-OCR untuk pengenalan.
Tentang fungsi pengenalan rumus
Tentang pasca-pemrosesan teks OCR - solusi analisis penyusunan huruf : Pengaturan huruf dan urutan hasil OCR dapat diatur agar teks lebih sesuai untuk dibaca dan digunakan. Paket bawaan:
多栏-按自然段换行
: cocok untuk sebagian besar skenario, secara otomatis mengenali tata letak multi-kolom dan membungkus baris menurut aturan paragraf alami.
多栏-总是换行
: Setiap pernyataan dibungkus.
多栏-无换行
: Memaksa semua pernyataan digabungkan ke dalam baris yang sama.
单栏-按自然段换行
/总是换行
/无换行
: mirip dengan di atas, tetapi tidak membedakan antara tata letak multi-kolom.
单栏-保留缩进
: cocok untuk mengurai kode tangkapan layar, mempertahankan lekukan di awal baris dan spasi di baris.
不做处理
: Output asli dari mesin OCR, dengan jeda baris untuk setiap pernyataan secara default.
Solusi di atas dapat secara otomatis menangani penyusunan huruf horizontal dan vertikal (kanan ke kiri). (Teks vertikal juga memerlukan dukungan mesin OCR itu sendiri)
Batch OCR : Halaman ini digunakan untuk mengimpor gambar lokal secara batch untuk pengenalan.
Format yang didukung: jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff
.
Format yang didukung untuk menyimpan hasil pengenalan: txt, jsonl, md, csv(Excel)
.
Seperti tangkapan layar OCR, ini mendukung fungsi文本后处理
untuk mengatur tata letak dan urutan teks OCR.
Tidak ada batasan atas jumlahnya, dan ratusan gambar dapat diimpor sekaligus untuk tugas.
Mendukung shutdown/siaga otomatis setelah tugas selesai.
Jika Anda ingin mengenali gambar yang panjang atau besar dengan piksel yang terlalu besar, silakan sesuaikan: pengaturan halaman → pengenalan teks → batasi panjang sisi gambar → [Tingkatkan nilai] .
Memiliki fungsi khusus忽略区域
.
Tentang pasca-pemrosesan teks OCR - Abaikan area : Fungsi khusus dalam OCR batch, cocok untuk mengecualikan teks yang tidak diinginkan dalam gambar.
Editor area abaikan dapat dimasukkan di pengaturan kolom kanan halaman identifikasi batch.
Seperti contoh di atas, terdapat beberapa watermark/LOGO di pojok kanan atas dan bawah gambar. Jika gambar tersebut dikenali secara berkelompok, tanda air akan mengganggu hasil pengenalan.
Tahan tombol kanan dan gambar beberapa kotak persegi panjang. Teks dalam area ini akan diabaikan dalam misi.
Silakan coba membuat bingkai persegi panjang sebesar mungkin untuk menutupi seluruh kemungkinan lokasi tanda air.
Perhatikan bahwa hanya seluruh blok teks dalam kotak wilayah abaikan (bukan karakter individual) yang akan diabaikan. Seperti yang ditunjukkan pada gambar di bawah, persegi panjang gelap dengan batas kuning adalah area yang diabaikan. Maka hanya key_mouse
yang akan diabaikan. Dua blok teks pubsub_connector.py
dan pubsub_service.py
dipertahankan.
Identifikasi dokumen :
Format yang didukung: pdf, xps, epub, mobi, fb2, cbz
.
Lakukan OCR pada dokumen yang dipindai atau ekstrak teks asli. Dapat diekspor sebagai PDF dua lapis yang dapat dicari .
Mendukung pengaturan area abaikan , yang dapat digunakan untuk mengecualikan teks header dan footer.
Dapat diatur untuk mati/hibernasi secara otomatis setelah tugas selesai.
Pindai kode :
Ambil tangkapan layar/tempel/seret ke gambar lokal dan baca kode QR dan kode batang di dalamnya.
Mendukung banyak kode untuk satu gambar.
Mendukung 19 protokol, sebagai berikut:
Aztec
, Codabar
, Code128
, Code39
, Code93
, DataBar
, DataBarExpanded
, DataMatrix
, EAN13
, EAN8
, ITF
, LinearCodes
, MatrixCodes
, MaxiCode
, MicroQRCode
, PDF417
, QRCode
, UPCA
, UPCE
Hasilkan kode :
Masukkan teks dan buat gambar kode QR.
Mendukung 19 protokol dan tingkat koreksi kesalahan dan parameter lainnya.
Pengaturan global : Di sini Anda dapat menyesuaikan parameter global perangkat lunak. Fungsi yang umum digunakan adalah sebagai berikut:
Tambahkan pintasan atau atur mulai otomatis saat boot dengan satu klik.
Ubah bahasa antarmuka. Umi mendukung bahasa tradisional Cina, Inggris, Jepang, dan lainnya.
Ganti tema antarmuka. Umi memiliki beberapa tema terang/gelap.
Sesuaikan ukuran dan font teks antarmuka .
Ganti plugin OCR.
Renderer : Antarmuka perangkat lunak mendukung rendering yang dipercepat kartu grafis secara default. Jika tangkapan layar berkedip dan UI tidak selaras di mesin Anda, harap sesuaikan界面和外观
→渲染器
, coba beralih ke skema rendering lain, atau matikan akselerasi perangkat keras.
Panduan baris perintah
Panduan antarmuka HTTP
Terima kasih kepada penerjemah berikut yang menyumbangkan pekerjaan terjemahan pelokalan ke Umi-OCR: (dicantumkan tanpa urutan tertentu)
penterjemah | Bahasa kontribusi |
---|---|
Bob | Inggris, Cina Tradisional, Jepang |
Qingzheng Gao | Inggris, Cina Tradisional |
Weng, Chia-Ling | Inggris, Cina Tradisional |
linzow | Inggris, Cina Tradisional |
Eric Guo | Bahasa inggris |
steven0081 | Bahasa inggris |
Marcos i | Bahasa inggris |
prem7x | Cina Tradisional |
Hugoalh | Cina Tradisional |
ドコモ光 | Jepang |
Yang Peng | Portugis |
Jika ada informasi yang salah atau personel yang hilang, harap dibalas dalam diskusi ini.
Proyek ini menggunakan platform online Weblate: Umi-OCR untuk kolaborasi terjemahan lokalisasi. Kami menyambut setiap pengguna untuk berpartisipasi dalam pekerjaan penerjemahan, Anda dapat mengoreksi, melengkapi bahasa yang ada, atau menambahkan bahasa baru.
Gudang utama?
Perpustakaan plugin
Waktu proses Windows
Waktu proses Linux
Akhiran **
menunjukkan konten yang terdapat di gudang ini (主仓库
).
Umi-OCR ├─ Umi-OCR.exe ├─ umi-ocr.sh └─ UmiOCR-data ├─ main.py ** ├─ version.py ** ├─ qt_res ** │ └─ 项目qt资源,包括图标和qml源码 ├─ py_src ** │ └─ 项目python源码 ├─ plugins │ └─ 插件 └─ i18n ** └─ 翻译文件
Mesin OCR offline yang didukung:
PaddleOCR-json
RapidOCR-json
Kerangka kerja lingkungan yang berjalan:
Versi khusus PyStand
Silakan merujuk ke instruksi di awal changelog.
Silakan lompat ke gudang berikut untuk menyelesaikan penerapan lingkungan pengembangan/operasi dari platform yang sesuai.
jendela
Linux
Proyek Umi-OCR terutama dikembangkan dan dikelola oleh penulis hiroi-sora di waktu luangnya. Jika Anda menyukai perangkat lunak ini, silakan sponsori.
Pengguna domestik dapat mensponsori penulis melalui iPower.
bingkai tab.
Pengontrol API OCR.
Pengontrol tugas OCR.
Manajer tema mendukung peralihan tema terang/gelap.
Menerapkan OCR batch .
Terapkan tangkapan layar OCR .
Mekanisme tombol pintas.
Menu baki sistem.
Pasca-pemrosesan blok teks (optimasi penyusunan huruf).
Pembersihan memori mesin.
Antarmuka perangkat lunak tersedia dalam berbagai bahasa.
Mode baris perintah.
Kompatibel dengan Win7.
Format keluaran Excel (csv).
Esc
mengganggu operasi tangkapan layar
File tema eksternal
Peralihan font
memuat animasi
Abaikan area tersebut.
Pengenalan kode QR.
Jendela pratinjau gambar dari halaman pengenalan batch.
Pengenalan PDF.
Panggil browser gambar lokal untuk membuka gambar. #335
Ulangi tangkapan layar terakhir. #357
Perbaikan bug: masalah kompatibilitas pengenalan dokumen di sistem Windows 7.
Antarmuka HTTP/baris perintah menambahkan fungsi pengenalan/pembuatan kode QR. (#423)
Dokumentasi antarmuka kode QR.
Pemindahan platform Linux.
Antarmuka pengenalan dokumen HTTP.
Ini adalah fungsi-fungsi yang diharapkan. Antarmuka telah dicadangkan pada tahap awal pengembangan dan akan diimplementasikan secara perlahan dalam jangka panjang.
Namun, karena kondisi aktual selama pengembangan, desain fungsional dapat diubah, dan fungsi dapat ditambah atau dibatalkan.
Perbaiki mekanisme plug-in yang mendasarinya.
Pengaya OCR API daring.
Plug-in pengenalan rumus matematika independen.
Tab "Rumus Matematika" menyediakan pengenalan rumus matematika independen/render Lateks.
Periksa mekanisme pembaruan.
Modul pasca-pemrosesan teks selain analisis penyusunan huruf (seperti mempertahankan angka, konversi karakter setengah lebar, koreksi kesalahan teks).
Fungsi antarmuka utama menambahkan metode pemicu peristiwa.
OCR offline berbasis GPU.
Terjemahan gambar
Terjemahan luring.
Pengenalan area tetap.
Kenali gambar tabel dan keluarkan ke Excel.
Sistem pencatatan sejarah.
Kompatibel dengan MacOS / Ubuntu dan platform lainnya.