英語 | 簡体字中国語
PaddleOCR は、開発者がより優れたモデルをトレーニングして実装できるように、豊富で優れた実用的な OCR ツール ライブラリを作成することを目的としています。
PaddleOCR は PMC によって監督されています。問題と PR はベストエフォートベースで検討されます。 PaddlePaddle コミュニティの完全な概要については、コミュニティにアクセスしてください。
??「PaddleOCR 2.9リリース、正式にオープンソースのテキスト画像インテリジェント分析ツール」、テキスト画像レイアウト分析により高精度のリアルタイム予測を実現、ローコードのフルプロセス開発により産業アプリケーションを加速します。文字画像補正、レイアウト領域検出、定型文字検出、印鑑文字検出、文字認識、フォーム認識などの機能を統合。 6 つのモデルの生産ラインをワンクリックで呼び出すことができ、開発コストを大幅に削減します。高パフォーマンスの推論、サービスベースの展開、クライアント側の展開など、複数の展開方法をサポートします。 10月24日(木)19:00からの生放送では、最新アップグレードの見どころを徹底分析します。 登録リンク
?2024.10.1 OCR 分野にローコードのフルプロセス開発機能を追加します。
ワンクリック呼び出しによるモデル強化: テキスト画像インテリジェント分析、一般的な OCR、一般的なレイアウト分析、一般的な表認識、数式認識、およびシール テキスト認識に関連する17 個のモデルを、最小限の Python API キー呼び出しを通じて 6 つのモデル生産ラインに統合します。モデル効果をすぐに体験してください。さらに、同じ API セットは、画像分類、ターゲット検出、画像セグメンテーション、時系列予測など、合計200 以上のモデルもサポートしており、開発者がモデルの組み合わせを使用しやすいように 20 以上の単機能モジュールを形成しています。
?効率の向上としきい値の低下:統一されたコマンドとグラフィカル インターフェイスに基づく 2 つの方法を提供し、モデルのシンプルかつ効率的な使用、組み合わせ、カスタマイズを実現します。高パフォーマンスの推論、サービスベースの展開、クライアント側の展開など、複数の展開方法をサポートします。さらに、モデル開発時に、 NVIDIA GPU、Kunlun Core、Ascend、Cambrian、Haiguangなどのさまざまなメインストリーム ハードウェアをシームレスに切り替えることができます。
ローコード開発ツールである PaddleX は、PaddleOCR の高度なテクノロジーを利用して、OCR 分野でのローコードのフルプロセス開発機能をサポートします。
ドキュメントシーン情報抽出v3PP-ChatOCRv3-doc、RT-DETRとPicoDetの高効率レイアウト領域検出モデルに基づく高精度レイアウト領域検出モデル、高精度表構造認識モデルSLANet_Plus、文字画像補正モデルUVDoc、数式をサポート認識モデル LatexOCR 、PP-LCNet に基づく文書画像方向分類モデル
?2024.7 PaddleOCR アルゴリズム モデル チャレンジのチャンピオン ソリューションを追加します。
コンテストの質問 1: OCR エンドツーエンド認識タスクのチャンピオン ソリューション - シーン テキスト認識アルゴリズム - SVTRv2。
コンテストの質問 2: 一般的なテーブル認識タスクのチャンピオン ソリューション - テーブル認識アルゴリズム - SLANet-LCNetV2。
さまざまな OCR 関連の最先端のアルゴリズムをサポートし、これに基づいて産業グレードの特性モデル PP-OCR、PP-Structure、PP-ChatOCR を作成し、データ生成、モデルのトレーニング、圧縮、分析の全プロセスを接続します。予測展開。
完全なドキュメントについては、docs にアクセスしてください。
電子書籍「OCRを学ぶハンズオン」
このプロジェクトは、Apache ライセンス バージョン 2.0 に基づいてリリースされています。