OpenContracts
v3.0.0
OpenContracts具有用於處理文檔的功能強大的模塊化管道系統。該體系結構支持自定義解析器,嵌入式和縮略圖生成器的簡單創建和集成:
每個管道組件都從定義清晰接口的基類繼承:
了解更多有關:
模塊化設計使添加自定義處理器變得容易 - 只需從適當的基類繼承並實現所需的方法即可。有關創建自己的組件的詳細信息,請參見我們的管道文檔。
目前,我們僅支持PDF和基於文本的格式(例如Plaintext和MD)。借助我們的新解析管道,我們可以輕鬆地支持其他OOXML辦公室格式,例如DOCX和XLSX,但是,開源查看器和編輯器很少見。一種可能的途徑是利用現在存在的許多OOXML-> MD工具。一旦我們添加了Markdown查看器和註釋器,這將是大多數文檔的合理解決方案(請參閱我們的路線圖)。
特別感謝Allenai的Pawls Project和NLMAtics NLM-Intestor。他們開創了許多功能和流動,我們在應用程序的某些部分中使用了它們的代碼。
NLMatics也是我們數據提取網格和解析管道UI/UX的創建者和靈感的創造者:
該公司領先於時代,儘管該產品不再可用,但OpenContracts旨在採用一些最佳,最具創新性的功能,並使其成為開源的,並為大眾提供!