Qmedia下載 - Qmedia源碼下載

Qmedia

其他源碼

1.0.0

下載

青傳媒

專為內容創作者設計的AI內容搜尋引擎。

英語| 簡體中文

變更日誌 - 報告問題 - 請求功能

主要特點

搜尋圖文、短影片素材。
高效率分析圖像/文字和短視頻內容，整合分散的資訊。
提供內容來源，分解圖文、短影片訊息，透過內容卡呈現資訊。
根據用戶興趣和需求，從圖像/文字和短影片內容中產生客製化的搜尋結果。
本地部署，實現私密資料的離線內容搜尋和問答。

？介紹
？功能概述
- 1內容卡
- 2多模式內容抹布
- 3純本地多式聯運模型
？安裝說明
- mm_server安裝
- mmrag_server 安裝
- qmedia_web 安裝
️ 用法
- 組合使用
- 獨立模特兒服務
- 純本地多式聯運

？介紹

QMedia是一款開源多媒體AI內容搜尋引擎，為文字/圖像和短影片內容提供豐富的資訊擷取方法。它整合非結構化文字/圖像和短視訊訊息，建構多模態RAG內容問答系統。目的是以開源的方式分享和交流人工智慧內容創作的想法。問題

與您的朋友分享 QMedia。

激發內容創作的新想法

	加入我們的 Discord 社群！
	加入我們的微信群組吧！

？功能概述

內容卡
- 以卡片的形式展示圖像/文字和影片內容
- Web Service受 XHS 網頁版啟發，使用 Typescript、Next.js、TailwindCSS 和 Shadcn/UI 技術堆疊實現
- 使用Python框架和LlamaIndex應用程式實現的RAG Search/Q&A Service和Image/Text/Video Model Service
- Web服務、 RAG Search/Q&A Service 、 Image/Text/Video Model Service可以單獨部署，根據使用者資源靈活部署，也可以嵌入其他系統進行圖文視訊內容擷取。
多模式內容 RAG
- 搜尋圖文、短影片素材。
- 根據用戶查詢從圖像/文字和短視頻內容中提取有用信息，產生高品質答案。
- 透過內容卡片展示內容來源以及圖文、短影片資訊的細分。
- 檢索和問答依賴圖文和短視頻內容的細分，包括圖像風格、文字佈局、短視頻轉錄、視頻摘要等。
- 支援Google內容搜尋。
純局部多式聯運模型
本地部署各類模型與RAG應用層分離，方便更換不同模型本機模型生命週期管理，可設定手動或自動發布，減少伺服器負載
語言模型：
- 支援本地Ollama模型切換。
  - llama3:8b-instruct LLM 模型的輕量級本地部署。
  - llama3:70b-instruct 在開源 LLM 模型中排名第八。
特徵嵌入模型：
- 影像嵌入：CLIP 編碼器將影像轉換為文字特徵編碼。
- 文字嵌入：BGE編碼器多語言嵌入模型，將文字轉換為特徵編碼，本地模型與GPT編碼器對齊。
圖像模型：
- 圖片文字OCR辨識：Qanything本地知識庫問答系統OCR
- 視覺理解模型：
  - llava-llama3：Ollama本地部署的GPT-4V級視覺理解模型。
視訊模型
- 影片轉錄：
  - Faster Whisper：快速擷取影片轉錄內容，可在本地CPU上運作。
- 基於LLM的短影片內容摘要
- 短視頻中的亮點識別
- 短視頻風格類型識別
- 短影片內容分析與細分

未來計劃

圖文短影片內容分析及病毒式內容細分
搜尋類似的圖像/文字/視頻
卡片圖文內容生成
短影片內容編輯

？安裝

文件結構介紹

QMedia服務：根據資源可用性，可以部署在本地，也可以將模型服務部署在雲端

mm_server安裝

多模式模型服務mm_server ：
- 多模態模型部署與API調用
- 奧拉馬 LLM 模型
- 影像模型
- 視訊模型
- 特徵嵌入模型

mmrag_server 安裝

內容搜尋和問答服務mmrag_server :
- 內容卡展示及查詢
- 圖片/文字/短影片內容擷取、嵌入、儲存服務
- 多模態資料 RAG 檢索服務
- 內容問答服務

qmedia_web 安裝

Web 服務qmedia_web ：語言：TypeScript 框架：Next.js 樣式：Tailwind CSS 元件：shadcn/ui

️ 用法

組合使用

mm_server + qmedia_web + mmrag_server網頁內容展示、內容RAG搜尋與問答、模型服務

服務啟動流程：

 # Start mm_server service
cd mm_server
source activate qllm
python main.py

# Start mmrag_server service
cd mmrag_server
source activate qmedia
python main.py

# Start qmedia_web service
cd qmedia_web
pnpm dev

透過網頁使用函數在啟動階段， mmrag_server會從assets/medias和assets/mm_pseudo_data.json中讀取偽數據，並調用mm_server將文本/圖像和短視頻中的信息提取並結構化為node信息，然後存儲在db中。檢索和問答將基於db中的資料。

自訂數據

 # assets file structure
assets
├── mm_pseudo_data.json # Content card data
└── medias # Image/Video files

取代assets中的內容，並刪除歷史儲存的db檔案。 assets/medias包含圖片/影片文件，可以替換為自己的圖片/影片檔案。 assets/mm_pseudo_data.json包含內容卡數據，可以替換為您自己的內容卡數據。運行服務後，模型將自動提取資訊並將其儲存在db中。

獨立模特兒服務

可以獨立使用mm_server本地圖文影片資訊擷取服務。它可以用作獨立的圖像編碼、文字編碼、視訊轉錄提取和圖像 OCR 服務，可在任何場景下透過 API 存取。

 # Start mm_server service independently
cd mm_server
python main.py

# uvicorn main:app --reload --host localhost --port 50110

API內容：

http://localhost:50110/docs

替代文字

純Python RAG服務/模型服務

可以結合使用mm_server + qmedia_web透過API在純Python環境中執行內容擷取和RAG檢索。

 # Start mmrag_server service independently
cd mmrag_server
python main.py

# uvicorn main:app --reload --host localhost --port 50110

API內容：

http://localhost:50110/docs
http://localhost:8001/docs

替代文字

明星歷史

執照

QMedia已獲得 MIT 許可

致謝

感謝 QAnything 提供的強大 OCR 模型。

感謝 llava-llama3 強大的 llm 視覺模型。

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2024-12-26
大小 38.5MB
來自於 Github

相關應用

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
waymo open dataset

其他源碼

December 2023 Update
SmartTube

其他源碼

24.71 Stable
Sunamu

其他源碼

Release 2.2.0
waymo open dataset

其他源碼

December 2023 Update
termwind

其他類別

v2.3.0
wp functions

其他類別

1.0.0

相關資訊全部

Qmedia

青傳媒