Unduh IncarnaMind - Unduh Kode Sumber IncarnaMind

IncarnaMind

Kode sumber lainnya

1.0.0

Unduh

? Incarnamind

? Pendeknya

Incarnamind memungkinkan Anda untuk mengobrol dengan dokumen pribadi Anda? (Pdf, txt) Menggunakan model bahasa besar (LLM) seperti GPT (ikhtisar arsitektur). Sementara Openai baru-baru ini meluncurkan API yang menyempurnakan untuk model GPT, itu tidak memungkinkan model pretrained dasar untuk mempelajari data baru, dan tanggapannya dapat rentan terhadap halusinasi faktual. Memanfaatkan mekanisme pemotongan jendela geser kami dan retriever ensemble memungkinkan permintaan yang efisien dari informasi berbutir halus dan berbutir kasar dalam dokumen kebenaran tanah Anda untuk menambah LLM.

Jangan ragu untuk menggunakannya dan kami menyambut umpan balik dan saran fitur baru?

Pembaruan baru

Dukungan LLMS Sumber Terbuka dan Lokal

Model yang Direkomendasikan: Kami terutama telah diuji dengan model seri LLAMA2 dan merekomendasikan menggunakan LLAMA2-70B-CHAT (baik versi penuh atau GGUF) untuk kinerja optimal. Jangan ragu untuk bereksperimen dengan LLM lainnya.
Persyaratan Sistem: Dibutuhkan lebih dari 35GB RAM GPU untuk menjalankan versi GGUF yang dikuantisasi.

Opsi LLMS Open-Source Alternatif

RAM tidak mencukupi: Jika Anda dibatasi oleh GPU RAM, pertimbangkan untuk menggunakan API bersama -tong.ai. Ini mendukung LLAMA2-70B-CHAT dan sebagian besar LLMS open-source lainnya. Plus, Anda mendapatkan $ 25 dalam penggunaan gratis.
Mendatang: Model yang lebih kecil dan hemat biaya, disesuaikan akan dirilis di masa depan.

Cara menggunakan model gguf

Untuk instruksi tentang memperoleh dan menggunakan GGUF LLM terkuantisasi (mirip dengan GGML), silakan merujuk ke video ini (dari 10:45 hingga 12:30) ..

Berikut adalah tabel perbandingan dari berbagai model yang saya uji, hanya untuk referensi:

Metrik	GPT-4	GPT-3.5	Claude 2.0	Llama2-70b	Llama2-70b-gguf	Llama2-70b-API
Pemikiran	Tinggi	Sedang	Tinggi	Sedang	Sedang	Sedang
Kecepatan	Sedang	Tinggi	Sedang	Sangat rendah	Rendah	Sedang
RAM GPU	N/a	N/a	N/a	Sangat tinggi	Tinggi	N/a
Keamanan	Rendah	Rendah	Rendah	Tinggi	Tinggi	Rendah

Demo

Demo.mp4

Tantangan yang ditangani

Fixed Chunking : Alat kain tradisional mengandalkan ukuran chunk tetap, membatasi kemampuan beradaptasi dalam menangani berbagai kompleksitas dan konteks data.
Precision vs. Semantik : Metode pengambilan saat ini biasanya berfokus pada pemahaman semantik atau pengambilan yang tepat, tetapi jarang keduanya.
Batasan Dokumen Tunggal : Banyak solusi hanya dapat menanyakan satu dokumen pada satu waktu, membatasi pengambilan informasi multi-dokumen.
Stabilitas : Incarnamind kompatibel dengan OpenAI GPT, Anthropic Claude, Llama2, dan LLMs sumber terbuka lainnya, memastikan penguraian yang stabil.

Fitur utama

Adaptif Chunking : Teknik chunking jendela geser kami secara dinamis menyesuaikan ukuran dan posisi jendela untuk kain, menyeimbangkan akses data berbutir halus dan berbutir kasar berdasarkan kompleksitas dan konteks data.
Multi-Document Conversational QA : Mendukung kueri sederhana dan multi-hop di beberapa dokumen secara bersamaan, melanggar batasan dokumen tunggal.
Kompatibilitas File : Mendukung format file PDF dan TXT.
Kompatibilitas Model LLM : Mendukung OpenAI GPT, Anthropic Claude, LLAMA2 dan LLMS open-source lainnya.

? Arsitektur

Arsitektur tingkat tinggi

gambar

Jendela geser chunking

gambar

Memulai

1. Instalasi

Instalasi sederhana, Anda hanya perlu menjalankan beberapa perintah.

1.0. Prasyarat

3.8 ≤ Python <3,11 dengan conda
Satu/Semua Kunci API Openai, Kunci API Claude Antropik, Bersama.
Dan tentu saja, dokumen Anda sendiri.

1.1. Klon Repositori

git clone https://github.com/junruxiong/IncarnaMind
cd IncarnaMind

1.2. Pengaturan

Buat lingkungan virtual conda:

conda create -n IncarnaMind python=3.10

Mengaktifkan:

conda activate IncarnaMind

Instal semua persyaratan:

pip install -r requirements.txt

Instal llama-cpp secara terpisah jika Anda ingin menjalankan llms lokal terkuantisasi:

Untuk dukungan NVIDIA GPU, gunakan cuBLAS

CMAKE_ARGS= " -DLLAMA_CUBLAS=on " FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

Untuk dukungan Apple Metal ( M1/M2 ), gunakan

CMAKE_ARGS= " -DLLAMA_METAL=on "  FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

Siapkan satu/semua tombol API di file configParser.ini :

[tokens]
OPENAI_API_KEY = (replace_me)
ANTHROPIC_API_KEY = (replace_me)
TOGETHER_API_KEY = (replace_me)
# if you use full Meta-Llama models, you may need Huggingface token to access.
HUGGINGFACE_TOKEN = (replace_me)

(Opsional) Mengatur parameter khusus Anda di file configParser.ini :

[parameters]
PARAMETERS 1 = (replace_me)
PARAMETERS 2 = (replace_me)
...
PARAMETERS n = (replace_me)

2. Penggunaan

2.1. Unggah dan proses file Anda

Masukkan semua file Anda (silakan beri nama setiap file dengan benar untuk memaksimalkan kinerja) ke dalam direktori /data dan jalankan perintah berikut untuk menelan semua data: (Anda dapat menghapus file contoh di direktori /data sebelum menjalankan perintah)

python docs2db.py

2.2. Berlari

Untuk memulai percakapan, jalankan perintah seperti:

python main.py

2.3. Mengobrol dan ajukan pertanyaan apa pun

Tunggu skrip untuk meminta masukan Anda seperti di bawah ini.

Human:

2.4. Yang lain

Saat Anda memulai obrolan, sistem akan secara otomatis menghasilkan file incarnamind.log . Jika Anda ingin mengedit logging, silakan edit di file configParser.ini .

[logging]
enabled = True
level = INFO
filename = IncarnaMind.log
format = %(asctime)s [%(levelname)s] %(name)s: %(message)s

Batasan

Kutipan tidak didukung untuk versi saat ini, tetapi akan segera dirilis.
Kemampuan asinkron terbatas.

Fitur yang akan datang

Antarmuka UI Frontend
Ukuran open-source ukuran kecil yang disesuaikan
Dukungan OCR
Optimasi asinkron
Mendukung lebih banyak format dokumen

? Ucapan Terima Kasih

Terima kasih khusus kepada Langchain, Chroma DB, LocalGpt, Llama-CPP atas kontribusi mereka yang tak ternilai bagi komunitas open-source. Pekerjaan mereka telah berperan dalam mewujudkan proyek Incarnamind.

? Kutipan

Jika Anda ingin mengutip pekerjaan kami, silakan gunakan entri Bibtex berikut:

 @misc { IncarnaMind2023 ,
  author = { Junru Xiong } ,
  title = { IncarnaMind } ,
  year = { 2023 } ,
  publisher = { GitHub } ,
  journal = { GitHub Repository } ,
  howpublished = { url{https://github.com/junruxiong/IncarnaMind} }
}