Inglês | Chinês Simplificado
PaddleOCR visa criar uma biblioteca de ferramentas de OCR rica, líder e prática para ajudar os desenvolvedores a treinar melhores modelos e implementá-los.
PaddleOCR é supervisionado pelo PMC. Problemas e PRs serão revisados com base no melhor esforço. Para uma visão geral completa da comunidade PaddlePaddle, visite comunidade.
??"PaddleOCR 2.9 lançado, ferramenta de análise inteligente de imagem de texto de código aberto oficialmente", análise de layout de imagem de texto para obter previsão de alta precisão em tempo real, desenvolvimento de processo completo de baixo código para acelerar aplicações industriais. Correção integrada de imagem de texto, detecção de área de layout, detecção de texto regular, detecção de texto selado, reconhecimento de texto, reconhecimento de formulário e outras funções. Seis linhas de produção de modelos podem ser acessadas com um clique, reduzindo significativamente os custos de desenvolvimento. Oferece suporte a vários métodos de implantação, como inferência de alto desempenho, implantação baseada em serviço e implantação no lado do cliente. A transmissão ao vivo às 19h do dia 24 de outubro (quinta-feira) fornecerá uma análise aprofundada dos destaques da última atualização. Link de inscrição
?2024.10.1 Adicionar recursos de desenvolvimento de processo completo de baixo código no campo OCR :
? Enriquecimento de modelo com chamada de um clique : Integre 17 modelos relacionados à análise inteligente de imagem de texto, OCR geral, análise geral de layout, reconhecimento geral de tabela, reconhecimento de fórmula e reconhecimento de texto de selo em 6 linhas de produção de modelo, por meio de uma chamada de chave de API Python minimalista para experimente rapidamente o efeito do modelo. Além disso, o mesmo conjunto de APIs também suporta um total de mais de 200 modelos , como classificação de imagens, detecção de alvos, segmentação de imagens e previsão de série temporal, formando mais de 20 módulos de função única para facilitar o uso de combinações de modelos pelos desenvolvedores.
? Melhorar a eficiência e reduzir o limite : Fornece dois métodos baseados em comandos unificados e interface gráfica para realizar uso, combinação e personalização simples e eficiente de modelos. Oferece suporte a vários métodos de implantação, como inferência de alto desempenho, implantação baseada em serviço e implantação no lado do cliente . Além disso, você pode alternar perfeitamente entre vários hardwares convencionais, como GPU NVIDIA, Kunlun Core, Ascend, Cambrian e Haiguang ao desenvolver modelos.
PaddleX, uma ferramenta de desenvolvimento de baixo código, conta com a tecnologia avançada do PaddleOCR para oferecer suporte a recursos de desenvolvimento de processo completo de baixo código na área de OCR:
Suporta extração de informações de cena de documento v3PP-ChatOCRv3-doc, modelo de detecção de área de layout de alta precisão baseado em RT-DETR e modelo de detecção de área de layout de alta eficiência do PicoDet, modelo de reconhecimento de estrutura de tabela de alta precisão SLANet_Plus, modelo de correção de imagem de texto UVDoc e fórmula modelo de reconhecimento LatexOCR, modelo de classificação de orientação de imagem de documento baseado em PP-LCNet
?2024.7 Adicionar a solução campeã do PaddleOCR Algorithm Model Challenge :
Questão de competição 1: Solução campeã de tarefa de reconhecimento ponta a ponta de OCR - algoritmo de reconhecimento de texto de cena-SVTRv2;
Questão de competição 2: A solução campeã para a tarefa geral de reconhecimento de tabela - algoritmo de reconhecimento de tabela-SLANet-LCNetV2.
Ele suporta uma variedade de algoritmos de ponta relacionados ao OCR e, com base nisso, cria modelos característicos de nível industrial PP-OCR, PP-Structure e PP-ChatOCR e conecta todo o processo de produção de dados, treinamento de modelo, compactação e implantação de previsão.
Para documentação completa, acesse: docs
E-book "Aprendendo OCR na prática"
Este projeto foi lançado sob a licença Apache versão 2.0.