OpenContracts presenta un poderoso sistema de tuberías modular para procesar documentos. La arquitectura admite la creación e integración fácil de analizadores personalizados, integradores y generadores de miniatura:
Cada componente de tubería hereda de una clase base que define una interfaz clara:
Obtenga más información sobre:
El diseño modular facilita agregar procesadores personalizados, solo heredar de la clase base apropiada e implementar los métodos requeridos. Consulte nuestra documentación de tuberías para obtener detalles sobre la creación de sus propios componentes.
Por el momento, solo admitemos PDF y formatos basados en texto (como TextExt y MD). Con nuestra nueva tubería de análisis, podemos admitir fácilmente otros formatos de oficina OOXML como DOCX y XLSX, sin embargo, los espectadores y editores de código abierto son una rareza. Una ruta posible es aprovechar las muchas herramientas OOXML -> MD que ahora existen. Esta será una solución razonablemente buena para la mayoría de los documentos una vez que agregemos un visor y un anotador de Markdown (ver nuestra hoja de ruta).
Un agradecimiento especial al Proyecto Pawls de Allenai y NLMatics NLM-inestor. Han sido pioneros en una serie de características y flujos, y estamos utilizando su código en algunas partes de la aplicación.
Nlmatics también fue el creador e inspiración para nuestra cuadrícula de extracto de datos y la tubería de análisis UI/UX:
La compañía se adelantó a su tiempo y, aunque el producto ya no está disponible, OpenContracts tiene como objetivo tomar algunas de sus mejores y más innovadoras características y hacerlas de código abierto y disponibles para las masas.