Rhubarb는 다중 모드 LLM(대형 언어 모델) 및 임베딩 모델을 사용하여 문서 이해 애플리케이션을 쉽게 구축할 수 있게 해주는 경량 Python 프레임워크입니다. Rhubarb는 Amazon Bedrock 및 Anthropic Claude V3 다중 모드 언어 모델, Amazon Titan 다중 모드 임베딩 모델과 함께 작동하도록 처음부터 만들어졌습니다.
대황 문서를 방문하세요.
Rhubarb는 다음과 같은 여러 문서 처리 작업을 수행할 수 있습니다.
✅ 문서 Q&A
✅ 문서로 스트리밍 채팅(Q&A)
✅ 문서 요약
페이지 수준 요약
전체 요약
특정 페이지 요약
스트리밍 요약
✅ 구조화된 데이터 추출
✅ 명명된 엔터티 인식(NER)
50개의 내장된 공통 엔터티 포함
✅ 내장된 엔터티를 통한 PII 인식
✅ 문서의 그림 및 이미지 이해
차트, 그래프, 그림을 설명하세요.
테이블 추론 수행(그림으로)
✅ 다중 모드 임베딩 모델을 사용한 벡터 샘플링을 통한 문서 분류
✅ 비용을 추적하는 데 도움이 되는 토큰 사용량을 기록합니다.
Rhubarb에는 다양한 문서 이해 사용 사례에 쉽게 사용할 수 있는 시스템 프롬프트가 내장되어 있습니다. 자신만의 시스템 프롬프트를 전달하여 Rhubarb를 사용자 정의할 수 있습니다. 정확한 JSON 스키마 기반 출력 생성을 지원하므로 다운스트림 애플리케이션에 쉽게 통합할 수 있습니다.
PDF, TIFF, PNG, JPG 파일 지원(Word, Excel, PowerPoint, CSV, Webp, eml 파일 지원 예정)
다중 모드 모델과 작업하기 위해 내부적으로 문서를 이미지로 변환합니다.
로컬 파일 또는 S3에 저장된 파일에서 작동
여러 페이지로 구성된 문서의 페이지 번호 지정 지원
문서에 대한 채팅 기록 기반 채팅 지원
스트리밍 및 비스트리밍 모드 지원
pip
사용하여 Rhubarb를 설치하는 것부터 시작하세요.
pip install pyrhubarb
boto3
세션을 만듭니다.
import boto3session = boto3.Session()
로컬 파일
대황에서 가져오기 DocAnalyticda = DocAnalytic(file_path="./path/to/doc/doc.pdf", boto3_session=session)resp = da.run(message="직원 이름이 무엇입니까?")resp
Amazon S3의 파일 사용
대황에서 가져오기 DocAnalyticda = DocAnalytic(file_path="s3://path/to/doc/doc.pdf", boto3_session=session)resp = da.run(message="직원 이름이 무엇입니까?")resp
더 많은 사용 예를 보려면 요리책을 참조하세요.
자세한 내용은 기여를 참조하세요.
이 프로젝트는 Apache-2.0 라이선스에 따라 라이선스가 부여됩니다.