Unduh php rag - unduh kode sumber php rag

php rag

Kode Sumber AI

v1.1.0

Unduh

Membuat aplikasi Retrieval Augmented Generation di PHP

Aplikasi ini menggunakan LLM (Large Language Model) GPT-4o yang diakses melalui OpenAI API untuk menghasilkan teks berdasarkan input pengguna. Input pengguna digunakan untuk mengambil informasi yang relevan dari database dan kemudian informasi yang diambil digunakan untuk menghasilkan teks. Pendekatan ini menggabungkan kekuatan transformator dan akses ke dokumen sumber.

Dalam aplikasi khusus ini, database lebih dari 1000 situs web dicari untuk informasi terkait orang tertentu. Tantangan sebenarnya di sini adalah orang yang dicari "Michał Żarnecki" muncul dalam 2 konteks berbeda sebagai 2 orang berbeda dengan nama yang sama. Tujuannya tidak hanya untuk menemukan informasi spesifik tetapi juga memahami konteksnya dan menghindari kesalahan seperti mencampurkan informasi tentang 2 orang berbeda dengan nama yang sama.

Saya menjelaskan konsep yang digunakan dalam aplikasi ini dengan detail lebih lanjut di artikel di medium.com https://medium.com/@michalzarnecki88/a-guide-to-using-llm-retrieval-augmented-generasi-with-php-3bff25ce6616

Untuk pengaturan, Anda harus menginstal Docker dan Docker Compose terlebih dahulu https://docs.docker.com/compose/install/

Pengaturan:

Jalankan di CLI: cd app/src && composer install
Atur model bahasa - pilih dari opsi di bawah ini: opsi dengan OpenAI API

"A" dengan model gratis melalui ollama API3 lokal

"B" dengan API OpenAI

Opsi B lebih sederhana dan membutuhkan lebih sedikit sumber daya CPU dan RAM, tetapi Anda memerlukan kunci API OpenAI https://platform.openai.com/settings/profile?tab=api-keys Opsi A memerlukan lebih banyak sumber daya CPU dan RAM, tetapi Anda dapat menjalankannya itu secara lokal menggunakan API ollama. Untuk opsi ini ada baiknya memiliki GPU.

Ikuti petunjuk untuk opsi pilihan A atau B di bawah ini:

A. Unduh model Llama3 menggunakan ollama* dan jalankan LLM secara lokal (opsi ini lebih lambat dan memerlukan lebih banyak sumber daya tetapi berfungsi sepenuhnya di lingkungan lokal):
Ollama disediakan sebagai bagian dari docker-compose, jadi Anda bisa langsung menjalankan docker di poin 3.

Jika Anda ingin mengatur ollama secara lokal, silakan gunakan petunjuk di bagian bawah file ini, tetapi jika menggunakan buruh pelabuhan, hal itu tidak diperlukan.

*Ollama menyediakan API lokal yang melayani LLM: "Siapkan dan jalankan model bahasa besar." https://ollama.com/

B. Jalankan GPT-4o melalui OpenAI API (opsi ini lebih cepat tetapi memerlukan kunci OpenAI API):
B.1. Buat file api_key.txt di dalam app/src dan letakkan kunci API OpenAI Anda di sana
B.2. gunakan Ada002TextEncoder.php di kelas di app/src/loadDocuments.php dengan menghapus komentar pada baris 9 dan menghapus baris 10

Jalankan penulisan buruh pelabuhan:

docker-compose up

*PETUNJUK: Skrip perlu mengubah dokumen sumber terlebih dahulu yang dapat memakan waktu bahkan 30 menit. Jika Anda ingin menghemat waktu, cukup hapus sebagian dokumen dari app/src/documents.

Tunggu hingga penyiapan kontainer selesai - Anda akan melihat di log konsol:

php-app | Loaded documents complete
php-app | Postgres is ready - executing command
php-app | [Sat Nov 02 11:32:28.365214 2024] [core:notice] [pid 1:tid 1] AH00094: Command line: 'apache2 -D FOREGROUND'

Buka alamat 127.0.0.1:2037 di browser dan ajukan pertanyaan Anda

Penggunaan:

peramban web

Setelah docker composer selesai menyiapkan wadah, buka alamat 127.0.0.1:2037 di browser dan ajukan pertanyaan Anda

Gunakan sebagai API

Anda dapat menggunakan aplikasi sebagai API dengan menggunakan permintaan seperti di bawah ini:

Opsi A ollama:
curl -d '{"prompt":"what is result of 2+2?"}' -H "Content-Type: application/json" -X POST http://127.0.0.1:2037/processOllama.php?api

Opsi B OpenAI GPT:
curl -d '{"prompt":"what is result of 2+2?"}' -H "Content-Type: application/json" -X POST http://127.0.0.1:2037/processGpt.php?api

CLI

Jalankan docker interaktif docker exec -it php-app sh
Jalankan di CLI: php minicli rag
Ajukan pertanyaan

Contoh keluaran:

Contoh 1

 ##### INPUT:
What is the result of 2 + 2?
##### RESPONSE:
The result of 2 + 2 is 4.

Contoh 2

 ##### INPUT: 
what is specialization of Michał Żarnecki based on his website content
##### RESPONSE:
Michał Żarnecki is a programmer and lecturer specializing in several key areas related to modern software development and data-driven technologies.
 
His expertise includes:
1. **Programming Languages**: Python, PHP, JavaScript.
2. **AI and Machine Learning**: Designing systems and solutions related to artificial intelligence and machine learning.
3. **Data Mining and Big Data**: Extracting valuable insights from large datasets. 
4. **Natural Language Processing (NLP)**: Working on systems that understand and generate human language. 
5. **Software Development Frameworks**: Utilizing various tools and frameworks such as Streamlit, TensorFlow, PyTorch, and langchain. 
6. **Database Systems**: Implementing and working with databases like PostgreSQL, Elasticsearch, Neo4j, and others.
 
His portfolio highlights projects such as an AI chatbot for analyzing company documents and a self-driving vehicle based on TensorFlow and Raspberry Pi.
Additionally, he has contributed to conferences and created e-learning courses focused on machine learning, underscoring his dual role as a developer and educator.

Contoh 3

 ##### INPUT: 
Is Michał Żarnecki programmer the same person as Michał Żarnecki audio engineer?

##### RESPONSE:
Based on the information provided, it appears that Michał Żarnecki the programmer and Michał Żarnecki the audio engineer are not the same person.
Here’s why:
1. **Fields of Expertise**:
 - Michał Żarnecki, the audio engineer, was a well-known operator and reżyser dźwięku (sound director) in Poland, with notable contributions to the Polish film industry, as mentioned in the Wikipedia excerpt.
 - Michal Żarnecki, the programmer, has a portfolio focused on programming in Python, PHP, and JavaScript, with projects related to AI, machine learning, data mining, and software development.
2. **Lifespan**:
 - Michał Żarnecki the audio engineer was born on November 12, 1946, and passed away on November 21, 2016.
 - The projects listed in Michał Żarnecki the programmer’s portfolio date from 2014 to 2016, which would be conflicting if he had passed away in 2016 and was actively working in those years. 
3. **Occupational Focus**:
 - The audio engineer has a career documented in film sound engineering and education.
 - The programmer’s career is centered around software development, mobile applications, ERP systems, and consulting in technology.

Given the distinct differences in their professional domains, timelines, and expertise, it is highly unlikely that they are the same individual

Konsep:

Konsep dasar:

Detail lebih lanjut untuk kutu buku:

Men-debug

Untuk mempercepat pemuatan dokumen atau menggunakan lebih banyak dokumen untuk pengambilan yang lebih baik, manipulasi nilai $skipFirstN di app/src/service/DocumentLoader.php:20

Setelah perubahan pada skrip PHP, bangun kembali buruh pelabuhan dengan perintah:
docker-compose rm
docker rmi -f php-rag
docker-compose up

Sumber daya:

situs web yang digunakan untuk mengisi database vektor berasal dari kumpulan data "Klasifikasi Situs Web" di Kaggle penulis: Hetul Mehta tautan: https://www.kaggle.com/datasets/hetulmehta/website-classification?resource=download

artikel/repositori terkait:

https://medium.com/mlearning-ai/create-a-chatbot-in-python-with-langchain-and-rag-85bfba8c62d2

https://github.com/Krisseck/php-rag

Siapkan ollama secara lokal

A.1. Unduh ollama dari https://ollama.com/download
A.2. Unduh Llama 3 8B dengan ollama pull llama3:latest
A.3. Unduh model penyematan mxbai ollama pull mxbai-embed-large
A.4. Pastikan model diunduh dan ollama berjalan

 ollama list
NAME                    	ID          	SIZE  	MODIFIED       
mxbai-embed-large:latest	468836162de7	669 MB	7 seconds ago 	
llama3:latest           	365c0bd3c000	4.7 GB	17 seconds ago

A.5. Mulai server ollama ollama serve
A.6. gunakan kelas MxbaiTextEncoder.php di app/src/loadDocuments.php (default)

Kontribusi adalah kekuatan!

Harap beri tahu saya jika Anda menemukan masalah atau hal yang perlu diperbaiki. Anda dapat menghubungi saya di alamat email [email protected]. Jangan ragu untuk melaporkan bug dan mengusulkan peningkatan dalam permintaan tarik.

Memperluas

Informasi Tambahan

Versi v1.1.0
Tipe Kode Sumber AI
Waktu Pembaruan 2024-12-26
ukuran 4.87MB
Berasal dari Github

Aplikasi Terkait

stripe php

2024-11-05
PHP Csv

2022-07-07
QCMS PHP

2013-12-09
QCMS PHP

2010-06-02
QCMS PHP

2010-05-17
QCMS PHP

2009-07-18

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua