ConversAI ist ein innovatives Konversations-KI-Framework, das entwickelt wurde, um Benutzern intelligente Interaktionen über verschiedene Dokumentformate und Webinhalte hinweg zu ermöglichen. Mithilfe fortschrittlicher NLP-Techniken (Natural Language Processing) ermöglicht ConversAI eine nahtlose Textextraktion und Abfragefunktionen und ist damit ein unschätzbares Werkzeug für Forscher, Studenten, Fachleute und alle, die regelmäßig mit textbasierten Informationen interagieren.
In einer Zeit der Informationsüberflutung ist eine effiziente Datenverarbeitung von entscheidender Bedeutung. ConversAI begegnet dieser Herausforderung, indem es modernste Technologien nutzt, um unstrukturierte Daten in umsetzbare Erkenntnisse umzuwandeln. Ganz gleich, ob Sie aussagekräftige Informationen aus PDFs extrahieren, Transkripte aus YouTube-Videos abrufen oder Daten von mehreren Webseiten sammeln – ConversAI bietet eine benutzerfreundliche Oberfläche, die diese komplexen Aufgaben vereinfacht.
Mit seinem modularen Aufbau ist ConversAI nicht nur ein Tool, sondern eine Plattform, die erweitert und an unterschiedliche Benutzeranforderungen angepasst werden kann.
Stellen Sie vor der Ausführung von ConversAI sicher, dass die folgenden Abhängigkeiten installiert sind:
apt-get update && apt-get upgrade -y
apt-get install poppler-utils -y
Darüber hinaus müssen Sie Ihre Umgebungsvariablen für die GROQ-API einrichten:
GROQ_API_KEY
in Ihren Umgebungsvariablen fest.Klonen Sie das Repository:
git clone https://github.com/rauhanahmed/ConversAI.git
cd ConversAI
Installieren Sie die erforderlichen Pakete:
pip install -r requirements.txt
Um die Anwendung zu starten, führen Sie den folgenden Befehl aus:
python app.py
Die Gradio-Benutzeroberfläche wird in Ihrem Standard-Webbrowser geöffnet.
Falls eine GPU nicht verfügbar ist, ändern Sie bitte die Datei config.ini
wie folgt:
Ändern Sie im Abschnitt [EMBEDDINGS]
Folgendes:
device = cuda
Zu:
device = cpu
Ändern Sie im Abschnitt [EASYOCR]
Folgendes:
gpu = true
Zu:
gpu = false
Diese Anpassungen stellen sicher, dass die Anwendung auf CPU-Ressourcen reibungslos läuft.
Klicken Sie nach der Nutzung der Benutzeroberfläche unbedingt auf die Schaltfläche „Löschen“, um die Felder zurückzusetzen. Dies ist von entscheidender Bedeutung, da in dieser Version kein Sitzungsmanagement implementiert wurde und das Versäumnis, Eingaben zu löschen, zu einer unbeabsichtigten Datenpersistenz bei nachfolgenden Interaktionen führen kann.
Hier ist eine umfassende Ansicht des Verzeichnisbaums des Projekts:
ConversAI/
├── app.py # Main application file
├── config.ini # Configuration file
├── params.yaml # Prompts for the application
├── requirements.txt # Required Python packages
├── src/ # Source code directory
│ ├── components/ # Component modules
│ │ ├── loaders/ # Data loaders
│ │ │ ├── pdfLoader.py
│ │ │ ├── websiteCrawler.py
│ │ │ └── youtubeLoader.py
│ │ ├── rag/ # Retrieval-Augmented Generation components
│ │ │ └── RAG.py
│ │ └── vectors/ # Vector storage and processing
│ │ └── vectorstore.py
│ ├── utils/ # Utility functions and classes
│ │ ├── exceptions.py
│ │ ├── functions.py
│ │ ├── logging.py
│ ├── pipelines/ # Pipeline logic for data processing
│ │ └── completePipeline.py
└── README.md # Project documentation
ConversAI ist mehr als nur ein Werkzeug; Es handelt sich um eine umfassende Lösung zum Verwalten und Extrahieren von Erkenntnissen aus einer Vielzahl von Dokumentformaten und Webquellen. Mit seinen leistungsstarken Funktionen und der benutzerfreundlichen Oberfläche ist ConversAI bereit, das Abrufen und Verarbeiten von Informationen einfacher und effizienter als je zuvor zu machen.
Sicher! Hier ist ein aktualisierter Abschnitt, der Ihre Beiträge und Danksagungen enthält:
Dieses Projekt wurde während meiner Tätigkeit als KI-Ingenieur bei Tech Consulting Partners entwickelt. Ich habe ConversAI von Grund auf neu entwickelt und dabei fortschrittliche Methoden zum Abrufen von Dokumenten, Reranking-Techniken, hybride Suchmethoden, mehrere Integrationen mit großen Sprachmodellen (LLMs) und viele andere komplexe Funktionalitäten implementiert.
Das Backend umfasst Benutzerverwaltungsfunktionen, anspruchsvolle Datenspeicherlösungen (einschließlich S3-Speicherverwaltung), Datenbankverwaltung und Vektordatenbanken. Die Bereitstellungsstrategie nutzt robuste APIs, Docker-Container, CI/CD-Praktiken, Modellüberwachung und Cloud-Plattformbereitstellung.
Dieser Open-Source-Prototyp dient als Sprungbrett für ein umfassenderes, auf das Gemeinwohl ausgerichtetes Projekt und zeigt das immense Potenzial fortschrittlicher KI-Technologien in alltäglichen Anwendungen. Ich möchte mich ganz herzlich bei Tech Consulting Partners dafür bedanken, dass sie mir diese Initiative anvertraut haben und dass sie mich während des gesamten Entwicklungsprozesses unschätzbar unterstützt haben.
Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der LIZENZ-Datei.
Wir wünschen Ihnen viel Spaß bei der Nutzung von ConversAI! Bei Fragen oder Feedback wenden Sie sich bitte über das Projekt-Repository oder per E-Mail an uns.