HuixiangDou 다운로드 - HuixiangDou 소스 코드 다운로드

영어 | 简体中文

HuixiangDou는 LLM을 기반으로 한 전문 지식 보조원 입니다.

장점:

전처리, 거부, 대응의 3단계 파이프라인 설계
- chat_in_group 그룹 채팅 시나리오에 대처하고 메시지 홍수 없이 사용자 질문에 답변합니다. 2401.08772, 2405.02817, 하이브리드 검색 및 정밀 보고서를 참조하세요.
- 실시간 스트리밍 채팅을 위한 chat_with_repo
CPU 전용, 2G, 10G, 20G 및 80G 구성으로 교육이 필요하지 않습니다.
산업 등급이며 상업적으로 실행 가능한 웹, Android 및 파이프라인 소스 코드의 전체 제품군을 제공합니다.

HuixiangDou가 달리는 장면을 확인하고 WeChat 그룹에 가입하여 내부 AI 도우미를 사용해 보세요.

도움이 되셨다면 별점 부탁드립니다

? 새로운 기능

우리의 웹 버전은 OpenXLab에 출시되었습니다. 여기서 지식 베이스를 생성하고, 긍정적인 예와 부정적인 예를 업데이트하고, 웹 검색을 활성화하고, 채팅을 테스트하고, Feishu/WeChat 그룹에 통합할 수 있습니다. BiliBili와 YouTube를 확인하세요!

Android용 웹 버전의 API는 다른 장치도 지원합니다. Python 샘플 코드를 참조하세요.

[2024/09] 역인덱서로 인해 LLM은 지식 기반을 선호합니다.
[2024/09] 코드 검색
[2024/08] chat_with_readthedocs, 통합하는 방법을 알아볼까요?
[2024/07] 이미지 및 텍스트 검색 및 langchain 제거 ?
[2024/07] Hybrid Knowledge Graph 및 Dense Retrieval로 F1 점수 1.7% 향상
[2024/06] Chunksize, Splitter, text2vec 모델 평가
[2024/05] wkteam WeChat 접속, 이미지 및 URL 파싱, 상호 참조 해결 지원
[2024/05] NLP 작업 SFT LLM, F1 29% 증가
? LoRA-Qwen1.5-14B LoRA-Qwen1.5-32B 알파카 데이터 arXiv
[2024/04] RAG Annotation SFT Q&A 데이터 및 예시
[2024/04] 웹 프런트엔드 및 백엔드 서비스 소스코드 출시 ?
[2024/03] 새로운 개인 WeChat 통합 및 사전 구축된 APK !
[2024/02] [실험 특집] OCR 달성을 위한 다중 모드의 WeChat 그룹 통합

지원현황

법학대학원	파일 형식	검색 방법	완성	전처리
인턴LM2/인턴LM2.5 퀀1.5~2.5 푸유 스텝펀 키미 DeepSeek GLM(지푸) 실리콘클라우드 시아피	PDF 단어 뛰어나다 PPT HTML 가격 인하 txt	문서에 대한 밀도 코드에 대한 스파스 지식 그래프 인터넷 검색 소스 그래프 이미지와 텍스트	위챗(android/wkteam) 종달새 OpenXLab 웹 그라디오 데모 HTTP 서버 문서 읽기	상호 참조 해결

? 하드웨어 요구 사항

다음은 다양한 기능에 대한 GPU 메모리 요구 사항입니다. 차이점은 옵션이 켜져 있는지 여부에만 있습니다.

구성 예	GPU 메모리 요구 사항	설명
구성-cpu.ini	-	Siliconcloud API 사용 텍스트 전용
구성-2G.ini	2GB	openai API(예: kimi, deepseek, stepfun 등을 사용하여 텍스트만 검색)
config-multimodal.ini	10GB	LLM, 이미지 및 텍스트 검색에 openai API 사용
[스탠다드 에디션] config.ini	19GB	LLM의 로컬 배포, 단일 양식
구성-고급.ini	80GB	현지 LLM, 아나포라 해결, 단일 양식, WeChat 그룹에 실용적

스탠다드 에디션 실행

우리는 표준판(로컬 실행 LLM, 텍스트 검색)을 소개 예로 들었습니다. 다른 버전은 구성 옵션이 다릅니다.

I. 종속성 다운로드 및 설치

BCE 모델 계약에 동의하려면 클릭하고 로그인하세요.huggingface

huggingface-cli login

종속성 설치

 # parsing `word` format requirements
apt update
apt install python-dev libxml2-dev libxslt1-dev antiword unrtf poppler-utils pstotext tesseract-ocr flac ffmpeg lame libmad0 libsox-fmt-mp3 sox libjpeg-dev swig libpulse-dev
# python requirements
pip install -r requirements.txt
# For python3.8, install faiss-gpu instead of faiss

II. 지식창고를 만들고 질문하세요

mmpose 문서를 사용하여 mmpose 지식 기반과 필터링 질문을 구축하세요. 자신만의 문서가 있다면 repodir 아래에 넣으세요.

다음 명령('#' 기호 포함)을 모두 복사하고 실행합니다.

 # Download the knowledge base, we only take the documents of mmpose as an example. You can put any of your own documents under `repodir`
cd HuixiangDou
mkdir repodir
git clone https://github.com/open-mmlab/mmpose    --depth=1 repodir/mmpose

# Save the features of repodir to workdir, and update the positive and negative example thresholds into `config.ini`
mkdir workdir
python3 -m huixiangdou.service.feature_store

실행 후 python3 -m huixiangdou.main --standalone 으로 테스트합니다. 이때, mmpose 관련 질문(지식베이스 관련)에는 답변하고, 날씨 관련 질문에는 답변하지 않습니다.

python3 -m huixiangdou.main --standalone

+---------------------------+---------+----------------------------+-----------------+
|         Query             |  State  |         Reply              |   References    |
+===========================+=========+============================+=================+
| How to install mmpose ?    | success | To install mmpose, plea..  | installation.md |
--------------------------------------------------------------------------------------
| How is the weather today ? | unrelated.. | ..                     |                 |
+-----------------------+---------+--------------------------------+-----------------+
? Input your question here, type ` bye ` for exit:
..

메모

매번 LLM을 다시 시작하는 것이 너무 느리다면 먼저 python3 -m huixiangdou.service.llm_server_hybrid ; 그런 다음 새 창을 열고 매번 LLM을 다시 시작하지 않고 python3 -m huixiangdou.main 만 실행합니다.

또한 gradio 사용하여 간단한 웹 UI를 실행합니다.

python3 -m huixiangdou.gradio_ui

출력.mp4

또는 서버를 실행하여 23333을 수신합니다. 기본 파이프라인은 chat_with_repo 입니다.

python3 -m huixiangdou.server

# test async API 
curl -X POST http://127.0.0.1:23333/huixiangdou_stream  -H " Content-Type: application/json " -d ' {"text": "how to install mmpose","image": ""} '
# cURL sync API
curl -X POST http://127.0.0.1:23333/huixiangdou_inference  -H " Content-Type: application/json " -d ' {"text": "how to install mmpose","image": ""} '

repodir 문서, good_questions 및 bad_questions를 업데이트하고 자신의 도메인 지식(의료, 금융, 권력 등)을 시도해 보십시오.

III. Feishu, WeChat 그룹에 통합

Feishu 그룹으로 단방향 전송
양방향 Feishu 그룹 수신 및 전송, 회수
개인 WeChat Android 액세스
개인 WeChat 팀 액세스

IV. 웹 프런트엔드 및 백엔드 배포

우리는 typescript 프런트엔드 및 python 백엔드 소스 코드를 제공합니다.

다중 테넌트 관리 지원
Feishu 및 WeChat에 대한 프로그래밍 액세스가 전혀 없습니다.
k8s 친화적

OpenXlab APP과 동일합니다. 웹 배포 문서를 읽어보세요.

? 기타 구성

CPU 전용 에디션

사용 가능한 GPU가 없는 경우 Siliconcloud API를 사용하여 모델 추론을 완료할 수 있습니다.

docker miniconda+Python3.11을 예로 들어 CPU 종속성을 설치하고 다음을 실행합니다.

 # Start container
docker run -v /path/to/huixiangdou:/huixiangdou -p 7860:7860 -p 23333:23333 -it continuumio/miniconda3 /bin/bash
# Install dependencies
apt update
apt install python-dev libxml2-dev libxslt1-dev antiword unrtf poppler-utils pstotext tesseract-ocr flac ffmpeg lame libmad0 libsox-fmt-mp3 sox libjpeg-dev swig libpulse-dev
python3 -m pip install -r requirements-cpu.txt
# Establish knowledge base
python3 -m huixiangdou.service.feature_store --config_path config-cpu.ini
# Q&A test
python3 -m huixiangdou.main --standalone --config_path config-cpu.ini
# gradio UI
python3 -m huixiangdou.gradio_ui --config_path config-cpu.ini

설치가 너무 느리다면 Docker Hub에 사전 설치된 이미지가 제공됩니다. docker를 시작할 때 간단히 교체하세요.

2G 비용 효율적인 버전

GPU 메모리가 1.8G를 초과하거나 비용 효율성을 추구하는 경우. 이 구성은 로컬 LLM을 폐기하고 대신 Standard Edition과 동일한 원격 LLM을 사용합니다.

siliconcloud 예로 들어 공식 홈페이지에서 적용한 API TOKEN을 config-2G.ini 에 입력합니다.

 # config-2G.ini
[ llm ]
enable_local = 0   # Turn off local LLM
enable_remote = 1  # Only use remote
..
remote_type = " siliconcloud "   # Choose siliconcloud
remote_api_key = " YOUR-API-KEY-HERE " # Your API key
remote_llm_model = " alibaba/Qwen1.5-110B-Chat "

메모

각 Q&A 시나리오에서는 LLM을 최악의 경우 7번 호출해야 하며 무료 사용자 RPM 제한에 따라 config.ini에서 rpm 매개변수를 수정할 수 있습니다.

Q&A 결과를 얻으려면 다음을 실행하세요.

python3 -m huixiangdou.main --standalone --config-path config-2G.ini # Start all services at once

10G 멀티모달 에디션

10G GPU 메모리가 있는 경우 이미지 및 텍스트 검색을 추가로 지원할 수 있습니다. config.ini에 사용된 모델을 수정하면 됩니다.

 # config-multimodal.ini
# !!! Download `https://huggingface.co/BAAI/bge-visualized/blob/main/Visualized_m3.pth`    to `bge-m3` folder !!!
embedding_model_path = " BAAI/bge-m3 "
reranker_model_path = " BAAI/bge-reranker-v2-minicpm-layerwise "

메모:

Visualized_m3.pth를 bge-m3 디렉터리에 수동으로 다운로드해야 합니다.
메인 브랜치에 FlagEmbedding을 설치하고 버그를 수정했습니다. 여기에서 bpe_simple_vocab_16e6.txt.gz 다운로드할 수 있습니다.
설치 요구사항/multimodal.txt

테스트를 위해 Gradio를 실행하고 여기에서 이미지 및 텍스트 검색 결과를 확인하세요.

python3 tests/test_query_gradio.py

80G 컴플리트 에디션

WeChat 체험 그룹의 "HuiXiangDou"는 모든 기능을 활성화했습니다.

Serper 검색 및 SourceGraph 검색 향상
그룹 채팅 이미지, WeChat 공개 계정 분석
텍스트 상호 참조 해결
하이브리드 LLM
지식 기반은 openmmlab의 12개 저장소(1700개 문서)와 관련되어 있으며 잡담을 거부합니다.

다음 주제를 읽어보십시오.

하이브리드 지식 그래프 및 밀집 검색
효과를 향상하려면 config-advanced.ini 구성을 참조하세요.
그룹 채팅 시나리오 아나포라 해결 교육
wkteam WeChat 액세스 사용, 이미지 통합, 공개 계정 구문 분석 및 아나포라 해결
rag.py를 사용하여 SFT 훈련 데이터에 주석 달기

안드로이드 도구

기여자들은 WeChat과 상호작용할 수 있는 Android 도구를 제공했습니다. 이 솔루션은 시스템 레벨 API를 기반으로 하며 원칙적으로 모든 UI(통신 소프트웨어에 국한되지 않음)를 제어할 수 있습니다.

FAQ

로봇이 너무 차갑거나 너무 수다스럽다면 어떻게 될까요?
- 실제 시나리오에서 답변해야 할 질문은 resource/good_questions.json 에 입력하고, 거부해야 할 질문은 resource/bad_questions.json 에 입력합니다.
- 기본 라이브러리의 마크다운 문서에 관련 없는 콘텐츠가 포함되지 않도록 repodir 의 테마 콘텐츠를 조정하세요.
임계값과 기능 라이브러리를 업데이트하려면 feature_store 다시 실행하세요.
️ config.ini에서 reject_throttle 직접 수정할 수 있습니다. 일반적으로 0.5는 높은 값입니다. 0.2는 너무 낮습니다.
실행은 정상이지만 런타임 중에 메모리가 부족합니까?
변환기 구조를 기반으로 하는 LLM 긴 텍스트에는 더 많은 메모리가 필요합니다. 이때 lmdeploy 양자화 설명과 같은 모델에서 kv 캐시 양자화가 수행되어야 합니다. 그런 다음 docker를 사용하여 하이브리드 LLM 서비스를 독립적으로 배포합니다.
다른 지역 LLM에 접속하는 방법 / 접속 후 효과가 좋지 않습니까?
- 하이브리드 LLM 서비스를 열고 새로운 LLM 추론 구현을 추가하세요.
- test_intention_prompt 및 테스트 데이터를 참조하여 새 모델에 대한 프롬프트 및 임계값을 조정하고 이를 프롬프트.py로 업데이트합니다.
응답이 너무 느리거나 요청이 항상 실패하면 어떻게 되나요?
- 지수 백오프 및 재전송을 추가하려면 hybrid llm 서비스를 참조하세요.
- 로컬 LLM을 기본 Huggingface/Transformers 대신 lmdeploy와 같은 추론 프레임워크로 교체합니다.
GPU 메모리가 너무 낮으면 어떻게 되나요?
이때 로컬 LLM 실행은 불가능하며, 원격 LLM만 text2vec와 연동하여 파이프라인 실행이 가능하다. config.ini 원격 LLM만 사용하는지 확인하고 로컬 LLM을 끄십시오.

? 감사의 말

KIMI: 긴 텍스트 LLM, 직접 파일 업로드 지원
FlagEmbedding: BAAI RAG 그룹
BCEmbedding: 중국어-영어 이중 언어 기능 모델
Langchain-ChatChat: Langchain과 ChatGLM의 응용
GrabRedEnvelope: WeChat 빨간색 패킷 가져오기

소환

@misc{kong2024huixiangdou,
      title={HuiXiangDou: Overcoming Group Chat Scenarios with LLM-based Technical Assistance},
      author={Huanjun Kong and Songyang Zhang and Jiaying Li and Min Xiao and Jun Xu and Kai Chen},
      year={2024},
      eprint={2401.08772},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

@misc{kong2024labelingsupervisedfinetuningdata,
      title={Labeling supervised fine-tuning data with the scaling law}, 
      author={Huanjun Kong},
      year={2024},
      eprint={2405.02817},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2405.02817}, 
}

확장하다