Qmedia下载 - Qmedia源码下载

Qmedia

其他源码

1.0.0

下载

青传媒

专为内容创作者设计的AI内容搜索引擎。

英语| 简体中文

变更日志 - 报告问题 - 请求功能

主要特点

搜索图文、短视频素材。
高效分析图像/文本和短视频内容，整合分散的信息。
提供内容来源，分解图文、短视频信息，通过内容卡呈现信息。
根据用户兴趣和需求，从图像/文本和短视频内容中生成定制的搜索结果。
本地部署，实现私密数据的离线内容搜索和问答。

？介绍
？功能概述
- 1内容卡
- 2多模式内容抹布
- 3纯本地多式联运模型
？安装说明
- mm_server安装
- mmrag_server 安装
- qmedia_web 安装
️ 用法
- 组合使用
- 独立模特服务
- 纯本地多式联运

？介绍

QMedia是一款开源多媒体AI内容搜索引擎，为文本/图像和短视频内容提供丰富的信息提取方法。它整合非结构化文本/图像和短视频信息，构建多模态RAG内容问答系统。目的是以开源的方式分享和交流人工智能内容创作的想法。问题

与您的朋友分享 QMedia。

激发内容创作的新想法

	加入我们的 Discord 社区！
	加入我们的微信群吧！

？功能概述

内容卡
- 以卡片的形式展示图像/文本和视频内容
- Web Service受 XHS 网页版启发，使用 Typescript、Next.js、TailwindCSS 和 Shadcn/UI 技术栈实现
- 使用Python框架和LlamaIndex应用程序实现的RAG Search/Q&A Service和Image/Text/Video Model Service
- Web服务、 RAG Search/Q&A Service 、 Image/Text/Video Model Service可以单独部署，根据用户资源灵活部署，也可以嵌入到其他系统中进行图文视频内容提取。
多模式内容 RAG
- 搜索图文、短视频素材。
- 根据用户查询从图像/文本和短视频内容中提取有用信息，生成高质量答案。
- 通过内容卡片展示内容来源以及图文、短视频信息的细分。
- 检索和问答依赖于图文和短视频内容的细分，包括图像风格、文字布局、短视频转录、视频摘要等。
- 支持Google内容搜索。
纯局部多式联运模型
本地部署各类模型与RAG应用层分离，方便更换不同模型本地模型生命周期管理，可配置手动或自动发布，减少服务器负载
语言模型：
- 支持本地Ollama模型切换。
  - llama3:8b-instruct LLM 模型的轻量级本地部署。
  - llama3:70b-instruct 在开源 LLM 模型中排名第八。
特征嵌入模型：
- 图像嵌入：CLIP 编码器将图像转换为文本特征编码。
- 文本嵌入：BGE编码器多语言嵌入模型，将文本转换为特征编码，本地模型与GPT编码器对齐。
图像模型：
- 图片文字OCR识别：Qanything本地知识库问答系统OCR
- 视觉理解模型：
  - llava-llama3：Ollama本地部署的GPT-4V级视觉理解模型。
视频模型
- 视频转录：
  - Faster Whisper：快速提取视频转录内容，可以在本地CPU上运行。
- 基于LLM的短视频内容摘要
- 短视频中的亮点识别
- 短视频风格类型识别
- 短视频内容分析与细分

未来计划

图文短视频内容分析及病毒式内容细分
搜索类似的图像/文本/视频
卡片图文内容生成
短视频内容编辑

？安装

文件结构介绍

QMedia服务：根据资源可用性，可以部署在本地，也可以将模型服务部署在云端

mm_server安装

多模式模型服务mm_server ：
- 多模态模型部署和API调用
- 奥拉马 LLM 模型
- 图像模型
- 视频模型
- 特征嵌入模型

mmrag_server 安装

内容搜索和问答服务mmrag_server :
- 内容卡展示及查询
- 图片/文本/短视频内容提取、嵌入、存储服务
- 多模态数据 RAG 检索服务
- 内容问答服务

qmedia_web 安装

Web 服务qmedia_web ：语言：TypeScript 框架：Next.js 样式：Tailwind CSS 组件：shadcn/ui

️ 用法

组合使用

mm_server + qmedia_web + mmrag_server网页内容展示、内容RAG搜索与问答、模型服务

服务启动流程：

 # Start mm_server service
cd mm_server
source activate qllm
python main.py

# Start mmrag_server service
cd mmrag_server
source activate qmedia
python main.py

# Start qmedia_web service
cd qmedia_web
pnpm dev

通过网页使用函数在启动阶段， mmrag_server会从assets/medias和assets/mm_pseudo_data.json中读取伪数据，并调用mm_server将文本/图像和短视频中的信息提取并结构化为node信息，然后存储在db中。检索和问答将基于db中的数据。

自定义数据

 # assets file structure
assets
├── mm_pseudo_data.json # Content card data
└── medias # Image/Video files

替换assets中的内容，并删除历史存储的db文件。 assets/medias包含图片/视频文件，可以替换为自己的图片/视频文件。 assets/mm_pseudo_data.json包含内容卡数据，可以替换为您自己的内容卡数据。运行服务后，模型将自动提取信息并将其存储在db中。

独立模特服务

可以独立使用mm_server本地图文视频信息提取服务。它可以用作独立的图像编码、文本编码、视频转录提取和图像 OCR 服务，可在任何场景下通过 API 访问。

 # Start mm_server service independently
cd mm_server
python main.py

# uvicorn main:app --reload --host localhost --port 50110

API内容：

http://localhost:50110/docs

替代文本

纯Python RAG服务/模型服务

可以结合使用mm_server + qmedia_web通过API在纯Python环境中执行内容提取和RAG检索。

 # Start mmrag_server service independently
cd mmrag_server
python main.py

# uvicorn main:app --reload --host localhost --port 50110

API内容：

http://localhost:50110/docs
http://localhost:8001/docs

替代文本

明星历史

执照

QMedia已获得 MIT 许可

致谢

感谢 QAnything 提供的强大 OCR 模型。

感谢 llava-llama3 强大的 llm 视觉模型。

展开

附加信息

版本 1.0.0
类型其他源码
更新时间 2024-12-26
大小 38.5MB
来自于 Github

Qmedia

青传媒

专为内容创作者设计的AI内容搜索引擎。

主要特点

？介绍

？功能概述

内容卡

多模式内容 RAG

纯局部多式联运模型

未来计划

？安装

文件结构介绍

mm_server安装

mmrag_server 安装

qmedia_web 安装

️ 用法

组合使用

自定义数据

独立模特服务

纯Python RAG服务/模型服务

明星历史

执照

致谢

waymo open dataset

SmartTube

Sunamu

viptools for eslam

MySchedule.py

VITAident

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

SmartTube

Sunamu

waymo open dataset

termwind

wp functions