Qmedia Download – Download Qmedia Quellcodes

Qmedia

Anderer Quellcode

1.0.0

Herunterladen

QMedia

KI-Inhaltssuchmaschine, die speziell für Inhaltsersteller entwickelt wurde.

Englisch | 简体中文

Änderungsprotokoll – Probleme melden – Funktion anfordern

Hauptmerkmale

Suchen Sie nach Bild-/Text- und kurzen Videomaterialien.
Analysieren Sie Bild-/Text- und kurze Videoinhalte effizient und integrieren Sie verstreute Informationen.
Stellen Sie Inhaltsquellen bereit und zerlegen Sie Bild-/Text- und kurze Videoinformationen, indem Sie Informationen über Inhaltskarten präsentieren.
Generieren Sie individuelle Suchergebnisse basierend auf den Interessen und Bedürfnissen der Benutzer aus Bild-/Text- und kurzen Videoinhalten.
Lokale Bereitstellung, die Offline-Inhaltssuche und Fragen und Antworten für private Daten ermöglicht.

Verzeichnis

? Einführung
? Funktionsübersicht
- 1 Inhaltskarten
- 2 multimodale Content-Rag
- 3 rein lokale multimodale Modelle
? Installationsanweisungen
- mm_server-Installation
- mmrag_server-Installation
- qmedia_web-Installation
️ Nutzung
- Kombinierte Nutzung
- Unabhängiger Modelservice
- rein lokal multimodal

? Einführung

QMedia ist eine Open-Source-Multimedia-KI-Inhaltssuchmaschine, die umfassende Methoden zur Informationsextraktion für Text/Bild und kurze Videoinhalte bietet. Es integriert unstrukturierten Text/Bild und kurze Videoinformationen, um ein multimodales Q&A-System für RAG-Inhalte aufzubauen. Ziel ist es, Ideen zur Erstellung von KI-Inhalten auf Open-Source-Art zu teilen und auszutauschen. Probleme

Teilen Sie QMedia mit Ihren Freunden.

Bringen Sie neue Ideen für die Erstellung von Inhalten hervor

	Treten Sie unserer Discord-Community bei!
	Treten Sie unserer WeChat-Gruppe bei!

? Funktionsübersicht

Inhaltskarten
- Zeigen Sie Bild-/Text- und Videoinhalte in Form von Karten an
- Von der XHS-Webversion inspirierter Web Service , implementiert mit dem Technologie-Stack von Typescript, Next.js, TailwindCSS und Shadcn/UI
- RAG Search/Q&A Service und Image/Text/Video Model Service implementiert mit dem Python-Framework und LlamaIndex-Anwendungen
- Der Webdienst, RAG Search/Q&A Service und Image/Text/Video Model Service können für eine flexible Bereitstellung basierend auf Benutzerressourcen separat bereitgestellt und in andere Systeme zur Extraktion von Bild-/Text- und Videoinhalten eingebettet werden.
Multimodaler Content RAG
- Suchen Sie nach Bild-/Text- und kurzen Videomaterialien.
- Extrahieren Sie nützliche Informationen aus Bild-/Text- und kurzen Videoinhalten basierend auf Benutzeranfragen, um qualitativ hochwertige Antworten zu generieren.
- Präsentieren Sie Inhaltsquellen und die Aufschlüsselung von Bild/Text und kurzen Videoinformationen durch Inhaltskarten.
- Das Abrufen und Fragen und Antworten basieren auf der Aufschlüsselung von Bild/Text und kurzen Videoinhalten, einschließlich Bildstil, Textlayout, kurzer Videotranskription, Videozusammenfassungen usw.
- Unterstützt die Google-Inhaltssuche.
Reine lokale multimodale Modelle
Lokale Bereitstellung verschiedener Modelltypen. Trennung von der RAG-Anwendungsschicht, wodurch es einfach ist, verschiedene Modelle zu ersetzen. Lokale Modelllebenszyklusverwaltung, konfigurierbar für manuelle oder automatische Freigabe, um die Serverlast zu reduzieren
Sprachmodelle :
- Unterstützt den lokalen Wechsel des Ollama-Modells.
  - llama3:8b-instruct Leichte lokale Bereitstellung von LLM-Modellen.
  - llama3:70b-instruct Achter Platz bei Open-Source-LLM-Modellen.
Feature-Einbettungsmodelle :
- Bilderinbettung: CLIP-Encoder Konvertieren Sie Bilder in Text-Feature-Kodierung.
- Texteinbettung: BGE-Encoder Mehrsprachiges eingebettetes Modell, Konvertierung von Text in Feature-Codierung, wobei lokale Modelle an GPT-Encoder ausgerichtet sind.
Bildmodelle :
- Bildtext-OCR-Erkennung: Qanything Local Knowledge Base Q&A System OCR
- Visuelle Verständnismodelle:
  - llava-llama3: Ollamas lokal bereitgestelltes visuelles Verständnismodell auf GPT-4V-Ebene.
Videomodelle
- Videotranskription:
  - Schnelleres Flüstern: Videotranskriptionsinhalte schnell extrahieren, kann auf der lokalen CPU ausgeführt werden.
- LLM-basierte Zusammenfassung kurzer Videoinhalte
- Identifizierung von Highlights in kurzen Videos
- Erkennung kurzer Videostiltypen
- Analyse und Aufschlüsselung kurzer Videoinhalte

Zukunftspläne

Analyse von Bild-/Text-Kurzvideoinhalten und Aufschlüsselung viraler Inhalte
Suchen Sie nach ähnlichen Bildern/Texten/Videos
Generierung von Kartenbild-/Textinhalten
Bearbeitung kurzer Videoinhalte

? Installation

Einführung in die Dateistruktur

QMedia-Dienste: Je nach Ressourcenverfügbarkeit können sie lokal bereitgestellt werden oder die Modelldienste können in der Cloud bereitgestellt werden

mm_server-Installation

Multimodaler Modelldienst mm_server :
- Multimodale Modellbereitstellung und API-Aufrufe
- Ollama LLM-Modelle
- Bildmodelle
- Videomodelle
- Feature-Einbettungsmodelle

mmrag_server-Installation

Inhaltssuche und Q&A-Service mmrag_server :
- Anzeige und Abfrage von Inhaltskarten
- Service zum Extrahieren, Einbetten und Speichern von Bild-/Text-/Kurzvideoinhalten
- Multimodaler Daten-RAG-Abrufdienst
- Inhalts-Q&A-Service

qmedia_web-Installation

Webdienst qmedia_web : Sprache: TypeScript Framework: Next.js Styling: Tailwind CSS-Komponenten: shadcn/ui

️ Nutzung

Kombinierte Nutzung

mm_server + qmedia_web + mmrag_server Webseiteninhaltsanzeige, Inhalts-RAG-Suche und Fragen und Antworten, Modellservice

Service-Startvorgang:

 # Start mm_server service
cd mm_server
source activate qllm
python main.py

# Start mmrag_server service
cd mmrag_server
source activate qmedia
python main.py

# Start qmedia_web service
cd qmedia_web
pnpm dev

Verwenden von Funktionen über die Webseite Während der Startphase liest mmrag_server Pseudodaten aus assets/medias und assets/mm_pseudo_data.json und ruft mm_server auf, um die Informationen aus Text/Bild und kurzen Videos zu extrahieren und in node zu strukturieren, die dann vorliegen in der db gespeichert. Der Abruf und die Fragen und Antworten basieren auf den Daten in der db .

Benutzerdefinierte Daten

 # assets file structure
assets
├── mm_pseudo_data.json # Content card data
└── medias # Image/Video files

Ersetzen Sie den Inhalt in assets und löschen Sie die historisch gespeicherte db . assets/medias enthält Bild-/Videodateien, die durch Ihre eigenen Bild-/Videodateien ersetzt werden können. assets/mm_pseudo_data.json enthält Inhaltskartendaten, die durch Ihre eigenen Inhaltskartendaten ersetzt werden können. Nach dem Ausführen des Dienstes extrahiert das Modell automatisch die Informationen und speichert sie in der db .

Unabhängiger Modelservice

Kann den lokalen Bild-/Text-/Video-Informationsextraktionsdienst mm_server unabhängig nutzen. Es kann als eigenständiger Bildkodierungs-, Textkodierungs-, Videotranskriptionsextraktions- und Bild-OCR-Dienst verwendet werden, auf den in jedem Szenario über die API zugegriffen werden kann.

 # Start mm_server service independently
cd mm_server
python main.py

# uvicorn main:app --reload --host localhost --port 50110

API-Inhalt:

http://localhost:50110/docs

Alternativtext

Reiner Python-RAG-Dienst/Modelldienst

Kann mm_server + qmedia_web zusammen verwenden, um Inhaltsextraktion und RAG-Abruf in einer reinen Python-Umgebung über APIs durchzuführen.

 # Start mmrag_server service independently
cd mmrag_server
python main.py

# uvicorn main:app --reload --host localhost --port 50110

API-Inhalt:

http://localhost:50110/docs
http://localhost:8001/docs

Alternativtext

Sternengeschichte

Lizenz

QMedia ist unter der MIT-Lizenz lizenziert

Danksagungen

Vielen Dank an QAnything für starke OCR-Modelle.

Vielen Dank an llava-llama3 für starke LM-Vision-Modelle.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2024-12-26
Größe 38.5MB
Kommt von Github

Ähnliche Anwendungen

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

Qmedia

QMedia

KI-Inhaltssuchmaschine, die speziell für Inhaltsersteller entwickelt wurde.

Hauptmerkmale

? Einführung

? Funktionsübersicht

Inhaltskarten

Multimodaler Content RAG

Reine lokale multimodale Modelle

Zukunftspläne

? Installation

Einführung in die Dateistruktur

mm_server-Installation

mmrag_server-Installation

qmedia_web-Installation

️ Nutzung

Kombinierte Nutzung

Benutzerdefinierte Daten

Unabhängiger Modelservice

Reiner Python-RAG-Dienst/Modelldienst

Sternengeschichte

Lizenz

Danksagungen

waymo open dataset

SmartTube

Sunamu

viptools for eslam

MySchedule.py

VITAident

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

SmartTube

Sunamu

waymo open dataset

termwind

wp functions