SimplyRetrieve 다운로드 - SimplyRetrieve 소스 코드 다운로드

SimplyRetrieve

기타 소스코드

Dependencies Update

다운로드

SimplyRetrieve: 개인용 경량 검색 중심 생성 AI 도구

? 뉴스 : 2023년 8월 21일 -- 이제 사용자는 GUI에 새로 추가된 Knowledge Tab 통해 즉시 지식을 생성하고 추가할 수 있습니다. 또한 구성 및 지식 탭에 진행률 표시줄이 추가되었습니다.

? SimplyRetrieve란 무엇인가요?

SimplyRetrieve 는 기계 학습 커뮤니티에 검색 중심 생성 (RCG) 접근 방식을 위한 완전히 지역화되고 가볍고 사용자 친화적인 GUI 및 API 플랫폼을 제공하는 것을 목표로 하는 오픈 소스 도구입니다.

문서와 언어 모델을 사용하여 사용자 정의가 가능한 채팅 도구를 만드세요. 특징은 다음과 같습니다:

GUI 및 API 기반 검색 중심 생성 플랫폼
? 프롬프트 엔지니어링, 도구 구성 및 검색 분석을 포함한 검색 튜닝 모듈
? 개인 지식 기반 생성자
? 다양한 크기의 오픈 소스 LLM(대형 언어 모델)에 대한 완전히 현지화된 비공개 경량 액세스
? Gradio의 대기열 기능을 활용하여 UI에 대한 다중 사용자 동시 액세스

이 도구에 대한 기술 보고서는 arXiv에서 확인할 수 있습니다.

이 도구에 대한 짧은 비디오는 YouTube에서 볼 수 있습니다.

도구 전체

이 도구를 사용하는 이유는 무엇입니까?

우리는 RCG 접근 방식을 구현하기 위한 오픈 소스 도구를 공유함으로써 안전하고 해석 가능하며 책임감 있는 LLM 개발에 기여하는 것을 목표로 합니다. 이 도구를 통해 기계 학습 커뮤니티가 개인 정보 보호 및 로컬 구현을 유지하면서 LLM 사용을 보다 효율적인 방법으로 탐색할 수 있기를 바랍니다. 컨텍스트 해석에서 LLM의 중요한 역할을 강조하고 지식 기억을 검색기 구성 요소에 맡김으로써 RAG(검색 증강 생성) 개념을 기반으로 구축된 검색 중심 생성은 보다 효율적이고 해석 가능한 생성을 생성하고 생성 작업에 필요한 LLM의 규모. 이 도구는 T4, V100 또는 A100과 같은 단일 Nvidia GPU에서 실행될 수 있으므로 광범위한 사용자가 액세스할 수 있습니다.

이 도구는 주로 Hugging Face, Gradio, PyTorch 및 Faiss의 훌륭하고 친숙한 라이브러리를 기반으로 구성되었습니다. 이 도구에 구성된 기본 LLM은 지침이 미세 조정된 Wizard-Vicuna-13B-Uncensored입니다. 검색기의 기본 임베딩 모델은 multilingual-e5-base입니다. 우리는 이러한 모델이 이 시스템뿐만 아니라 Hugging Face에서 사용할 수 있는 다양한 크기의 오픈 소스 LLM 및 검색기에서도 잘 작동한다는 것을 발견했습니다. 이 도구는 적절한 LLM을 선택하고 대상 언어에 따라 프롬프트 템플릿을 사용자 정의하여 영어 외에 다른 언어로도 실행할 수 있습니다.

? 이 도구를 사용하여 어떤 잠재적인 발전을 탐색할 수 있습니까?

보다 안전하고 해석 가능하며 책임감 있는 AI 시스템을 개발하는 데 있어 검색 중심 생성의 효과를 검토합니다.
검색 중심 생성 접근 방식에서 컨텍스트 해석과 지식 기억을 분리하는 효율성 최적화
검색 중심 생성을 위한 프롬프트 엔지니어링 기술 개선
완전한 로컬 및 에지 컴퓨팅을 위한 Chat AI 구현
개인별 맞춤형 AI 비서 생성

? 이 도구를 실행하기 위한 전제 조건은 무엇입니까?

Git은 이 저장소를 복제합니다.
GPU 기반 Linux 시스템에서 선호하는 Python venv를 활성화하고 필요한 패키지를 설치하십시오.
- pip install -r requirements.txt
선택사항: 자신의 데이터를 지식 소스로 사용하려면 다음 단계를 따르세요. 그러나 더 간단한 예제로 시작하고 싶다면 이 단계를 건너뛰고 도구에서 제공하는 기본 단순 샘플 지식 소스를 사용할 수 있습니다. 샘플 지식 소스는 데모 목적으로만 사용되며 성능 평가용으로 사용되어서는 안 됩니다. 정확한 결과를 얻으려면 자신의 지식 소스나 일반적인 용도의 Wikipedia 소스를 사용하는 것이 좋습니다.
- 검색을 위한 지식 소스 준비: 관련 문서(pdf 등)를 chat/data/ 디렉터리에 넣고 데이터 준비 스크립트를 실행합니다( cd chat/ 이후 다음 명령).
```
 CUDA_VISIBLE_DEVICES=0 python prepare.py --input data/ --output knowledge/ --config configs/default_release.json
```
- 지원되는 문서 형식은 pdf, txt, doc, docx, ppt, pptx, html, md, csv 이며 구성 파일을 편집하여 쉽게 확장할 수 있습니다. NLTK 관련 오류가 발생한 경우 이 문제에 대한 팁을 따르십시오.
- 최신: 이제 GUI 도구의 Knowledge Tab 통해 지식 기반 생성 기능을 사용할 수 있습니다. 이제 사용자는 즉시 지식을 추가할 수 있습니다. 도구를 실행하기 전에 위의 prepare.py 스크립트를 실행할 필요는 없습니다.

? 이 도구를 실행하는 방법은 무엇입니까?

위의 필수 구성 요소를 설정한 후 현재 경로를 chat 디렉터리( cd chat/ )로 설정하고 아래 명령을 실행합니다. 그럼 grab a coffee! 로드하는 데 몇 분 밖에 걸리지 않습니다.

 CUDA_VISIBLE_DEVICES=0 python chat.py --config configs/default_release.json

그런 다음 http://<LOCAL_SERVER_IP>:7860 으로 이동하여 즐겨 사용하는 브라우저에서 웹 기반 GUI에 액세스하세요. <LOCAL_SERVER_IP> GPU 서버의 IP 주소로 바꿉니다. 이제 준비가 끝났습니다!

GUI operation manual docs/ 디렉토리에 있는 GUI readme를 참조하십시오.
API access manual examples/ 디렉토리에 있는 API readme 및 샘플 스크립트를 참조하세요.

다음은 GUI의 샘플 채팅 스크린샷입니다. 포괄적인 RCG 튜닝 패널과 함께 친숙한 스트리밍 챗봇 인터페이스를 제공합니다.

플랫폼 GUI 샘플

현재 이 도구를 실행할 로컬 GPU 서버가 없습니까? 괜찮아요. 이 저장소를 방문하십시오. AWS EC2 클라우드 플랫폼에서 이 도구를 사용해 보는 지침을 보여줍니다.

? 기여

피드백과 의견을 자유롭게 보내주세요. 새로운 기능, 개선 사항, 더 나은 문서를 포함하여 이 도구에 대한 모든 토론과 기여를 환영합니다. 자유롭게 이슈나 토론을 열어보세요. 아직 문제나 토론을 위한 템플릿이 없으므로 지금은 무엇이든 할 수 있습니다.

?️ 로드맵

향후 개발

vLLM PagedAttention 높은 처리량 추론을 지원하려면
검색 중심 메모리(채팅 기록) 구성 요소를 추가합니다.
포괄적인 문서를 작성합니다.

️ 한정

이 도구는 검색 중심 접근 방식 내에서도 생성 AI 모델의 완전히 안전하고 책임감 있는 응답을 보장하기 위한 완벽한 솔루션을 제공하지 않는다는 점에 유의하는 것이 중요합니다. 보다 안전하고 해석 가능하며 책임감 있는 AI 시스템의 개발은 여전히 활발한 연구 및 지속적인 노력 분야로 남아 있습니다.

이 도구에서 생성된 텍스트는 현재 세대 LLM의 다음 토큰 예측 동작으로 인해 프롬프트나 쿼리를 약간만 수정하는 경우에도 변형이 나타날 수 있습니다. 이는 사용자가 최적의 응답을 얻기 위해 프롬프트와 쿼리를 모두 신중하게 미세 조정해야 할 수도 있음을 의미합니다.

소환

우리의 작업이 유용하다고 생각되면 다음과 같이 인용해 주세요.

 @article{ng2023simplyretrieve,
    title={SimplyRetrieve: A Private and Lightweight Retrieval-Centric Generative AI Tool}, 
    author={Youyang Ng and Daisuke Miyashita and Yasuto Hoshi and Yasuhiro Morioka and Osamu Torii and Tomoya Kodama and Jun Deguchi},
    year={2023},
    eprint={2308.03983},
    archivePrefix={arXiv},
    primaryClass={cs.CL},
    journal={arXiv preprint arXiv:2308.03983}
}

?️ 소속: 일본 Kioxia Corporation 메모리 기술 R&D 연구소

확장하다

추가 정보