タンシキニルプロジェクト
デジタル画像処理プロジェクト
1. 機能一覧
- OCRはIDカードの画像からテキスト情報を抽出します
- スタイル移行:キャンディー、星空、ピカソ、ミューズ、モザイク、神奈川沖浪裏、ダダアテンション、スクリーム、フェザー
- 基本機能:全39機能。 ソルト&ペッパー ノイズ、平均スムージング、メディアン スムージング、ガウス スムージング、画像の鮮明化 - ラプラシアン オペレーター、画像の鮮明化 - ソーベル オペレーターの水平方向、画像の鮮明化 - ソーベル オペレーターの垂直方向、バイリニアの使用 補間方法を拡張し、画像を 30 ピクセル移動します。左、50 ピクセル下、45 度回転、スケーリング係数は 1、グレースケールに変換、グレースケールに変換してから 2 値化 - グローバルしきい値法、ヒストグラムイコライゼーション、グレースケールヒストグラム、アフィン変換、透視変換、画像反転、RGBからHSVへ、HSVはHを取得、HSVはSを取得、HSVはVを取得、RGBはBを取得、RGBはGを取得、RGBはRを取得、水平反転、垂直反転、斜めミラーリング、画像オープニング操作、画像クローズ操作、エロージョン、エクスパンション、トップハット操作、ボトムハット操作、HoughLinesPによりライン検出、キャニーエッジ検出、画像強調、 Roberts オペレーターは画像エッジを抽出し、Prewitt オペレーターは画像エッジを抽出し、Laplacian オペレーターは画像エッジを抽出し、LoG エッジを抽出します。
2. 技術スタック
2.1 フロントエンド開発
- 主な開発言語:HTML、CSS、JavaScript
- フロントエンドフレームワーク: Vue.js
- スキャフォールディング: Vue-CLI
- UI: 要素UI
- コードエディタ: IntelliJ IDEA
- データ交換:axios
- フロントエンドパッケージマネージャー: npm
- フロントエンドビルドツール: Webpack
2.2 バックエンド開発
- 主な開発言語:Python
- バックエンドフレームワーク: Flask
- コードエディタ: IntelliJ IDEA
- バージョン管理システム:Git
- クロスドメイン ツール: flask-cors
3. プロジェクトの運営
3.1 依存関係のインストール
- まず、tesseract をローカルにインストールする必要があります。プロジェクトでは tesseractV4.0 バージョンを使用し、
tesseract-ocr-setup-4.00.00dev.exe
インストール パッケージを使用してローカルにインストールします。 PS D:xxx> tesseract -v
tesseract 4.00.00alpha
...
- tesseract 言語パックのダウンロード.
- chi_sim.traineddata をダウンロードします。
chi_sim.traineddata
ファイルを/安装路径/Tesseract-OCR/tessdata
パスに保存します。
3.2 構成の変更
config.py
ファイル内の構成情報を変更します。
3.3 フロントエンドの操作
まず、ターミナルでfirstendフォルダに入り、以下のコマンドを入力して起動します。
# install dependency
npm install
# develop
npm run dev
起動に失敗した場合は、 node_modules
フォルダーとpackage-lock.json
ファイルを削除して、上記の手順を再度実行してみてください。 それでも失敗する場合は、ローカルの node.js バージョンを下げてみてください。私はv12.17.0
を使用しています。
3.4 バックエンドの操作
Pycharm またはその他のアイデアでapp.py
実行します。
4. 機能表示
もう少し基本的な機能があり、プロジェクト ドキュメントの図で示されています。
4.1 OCRはIDカード画像からテキスト情報を抽出します
スタイル転送:
あめ
星空
ピカソ
ミューズ
モザイク
神奈川沖浪裏
ダダイズム
叫ぶ
フェザー