IncarnaMind 다운로드 - IncarnaMind 소스 코드 다운로드

IncarnaMind

기타 소스코드

1.0.0

다운로드

? 화신

? 간단히 말해

InCarnamind는 개인 문서와 채팅 할 수 있습니까? (PDF, TXT) GPT (아키텍처 개요)와 같은 대형 언어 모델 (LLMS)을 사용하는 (PDF). OpenAI는 최근 GPT 모델을위한 미세 조정 API를 출시했지만 기본 사전 제기 된 모델이 새로운 데이터를 배울 수 없으며 반응은 사실적인 환각에 걸릴 수 있습니다. 슬라이딩 윈도우 청크 메커니즘과 앙상블 리트리버를 사용하면 지상 진실 문서 내에서 세밀한 입자와 거친 정보를 모두 효율적으로 쿼리하여 LLM을 증대시킬 수 있습니다.

자유롭게 사용하고 피드백과 새로운 기능 제안을 환영합니까?.

새로운 업데이트

오픈 소스 및 로컬 LLMS 지원

권장 모델 : 우리는 주로 LLAMA2 시리즈 모델로 테스트했으며 최적의 성능을 위해 LLAMA2-70B-Chat (Full 또는 GGUF 버전)를 사용하는 것이 좋습니다. 다른 LLM을 실험 해보십시오.
시스템 요구 사항 : GGUF 양자화 된 버전을 실행하려면 35GB 이상의 GPU RAM이 필요합니다.

대체 오픈 소스 LLMS 옵션

불충분 한 RAM : GPU RAM으로 제한 된 경우 함께 사용하는 것을 고려하십시오. LLAMA2-70B-Chat 및 대부분의 다른 오픈 소스 LLM을 지원합니다. 또한 무료 사용으로 $ 25를받습니다.
다가오는 : 작고 비용 효율적인 미세 조정 모델이 향후 출시 될 예정입니다.

GGUF 모델을 사용하는 방법

양자화 된 GGUF LLM (GGML과 유사) 획득 및 사용에 대한 지침은이 비디오 (10:45 ~ 12:30)를 참조하십시오.

다음은 참조 만 테스트 한 다른 모델의 비교 테이블입니다.

메트릭	GPT-4	GPT-3.5	클로드 2.0	llama2-70b	llama2-70b-gguf	llama2-70B-API
추리	높은	중간	높은	중간	중간	중간
속도	중간	높은	중간	매우 낮습니다	낮은	중간
GPU 램	N/A	N/A	N/A	매우 높습니다	높은	N/A
안전	낮은	낮은	낮은	높은	높은	낮은

데모

데모 .mp4

문제가 해결되었습니다

고정 청크 : 전통적인 래그 도구는 고정 청크 크기에 의존하여 다양한 데이터 복잡성 및 컨텍스트를 처리 할 때 적응성을 제한합니다.
정밀성 대 의미론 : 현재 검색 방법은 일반적으로 의미 론적 이해 또는 정확한 검색에 중점을 두지 만 거의 둘 다 거의 없습니다.
단일 문서 제한 : 많은 솔루션이 한 번에 하나의 문서 만 쿼리하여 다중 문서 정보 검색을 제한 할 수 있습니다.
안정성 : InCarnamind는 OpenAi GPT, Anthropic Claude, LLAMA2 및 기타 오픈 소스 LLM과 호환되어 안정적인 구문 분석을 보장합니다.

주요 기능

적응 형 청크 : 슬라이딩 윈도우 청킹 기술은 헝겊의 창 크기와 위치를 동적으로 조정하여 데이터 복잡성과 컨텍스트를 기반으로 세밀하고 거친 데이터 액세스를 균형 잡습니다.
멀티 문서 대화 QA : 여러 문서에서 간단하고 멀티 홉 쿼리를 동시에 지원하여 단일 문서 제한을 중단합니다.
파일 호환성 : PDF 및 TXT 파일 형식을 모두 지원합니다.
LLM 모델 호환성 : OpenAI GPT, Anthropic Claude, LLAMA2 및 기타 오픈 소스 LLM을 지원합니다.

? 건축학

높은 수준의 아키텍처

슬라이딩 윈도우 청크

시작하기

1. 설치

설치는 간단합니다. 몇 가지 명령 만 실행하면됩니다.

1.0. 전제 조건

3.8 ≤ Python <3.11 콘다
OpenAI API 키, Anthropic Claude API Key, Ongether.AI API 키 또는 Huggingface Toekn for Meta Llama 모델
그리고 물론, 당신의 문서.

1.1. 저장소를 복제하십시오

git clone https://github.com/junruxiong/IncarnaMind
cd IncarnaMind

1.2. 설정

콘다 가상 환경 만들기 :

conda create -n IncarnaMind python=3.10

활성화 :

conda activate IncarnaMind

모든 요구 사항 설치 :

pip install -r requirements.txt

정량화 된 로컬 LLM을 실행하려면 llama-cpp를 speratly로 설치하십시오.

NVIDIA GPUS 지원의 경우 cuBLAS 사용하십시오

CMAKE_ARGS= " -DLLAMA_CUBLAS=on " FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

Apple Metal ( M1/M2 ) 지원의 경우 사용을 사용하십시오

CMAKE_ARGS= " -DLLAMA_METAL=on "  FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

configparser.ini 파일에서 하나/모든 API 키를 설정하십시오.

[tokens]
OPENAI_API_KEY = (replace_me)
ANTHROPIC_API_KEY = (replace_me)
TOGETHER_API_KEY = (replace_me)
# if you use full Meta-Llama models, you may need Huggingface token to access.
HUGGINGFACE_TOKEN = (replace_me)

(선택 사항) configparser.ini 파일에서 사용자 정의 매개 변수를 설정합니다.

[parameters]
PARAMETERS 1 = (replace_me)
PARAMETERS 2 = (replace_me)
...
PARAMETERS n = (replace_me)

2. 사용법

2.1. 파일을 업로드하고 처리하십시오

모든 파일을 /데이터 디렉토리에 넣고 다음 명령을 실행하여 모든 데이터를 수집하려면 다음 명령을 실행하십시오. (명령을 실행하기 전에 /데이터 디렉토리에서 예제 파일을 삭제할 수 있습니다)

python docs2db.py

2.2. 달리다

대화를 시작하려면 다음과 같은 명령을 실행하십시오.

python main.py

2.3. 채팅하고 질문하십시오

스크립트가 아래와 같이 입력을 요구할 때까지 기다리십시오.

Human:

2.4. 기타

채팅을 시작하면 시스템이 자동으로 InCarnamind.log 파일을 생성합니다. 로깅을 편집하려면 configparser.ini 파일에서 편집하십시오.

[logging]
enabled = True
level = INFO
filename = IncarnaMind.log
format = %(asctime)s [%(levelname)s] %(name)s: %(message)s

제한

인용은 현재 버전에서는 지원되지 않지만 곧 출시 될 예정입니다.
제한된 비동기 기능.

다가오는 기능

프론트 엔드 UI 인터페이스
미세 조정 된 작은 크기 오픈 소스 LLM
OCR 지원
비동기 최적화
더 많은 문서 형식을 지원합니다

? 감사의 말

오픈 소스 커뮤니티에 대한 귀중한 기여를 한 Langchain, Chroma DB, LocalGpt, Llama-CPP에게 특별한 감사를드립니다. 그들의 작업은 InCarnamind 프로젝트를 현실로 만드는 데 중요한 역할을 해왔습니다.

? 소환

우리의 작업을 인용하려면 다음 Bibtex 항목을 사용하십시오.

 @misc { IncarnaMind2023 ,
  author = { Junru Xiong } ,
  title = { IncarnaMind } ,
  year = { 2023 } ,
  publisher = { GitHub } ,
  journal = { GitHub Repository } ,
  howpublished = { url{https://github.com/junruxiong/IncarnaMind} }
}

? 특허

Apache 2.0 라이센스

확장하다

추가 정보

버전 1.0.0
유형 기타 소스코드
업데이트 시간 2025-02-27
크기 49.32MB
출처 Github