Gelaito4:由协作计算机视觉和生成人工智能提供支持的体育媒体平台
介绍
- Gelaito4是一款应用原型,旨在通过提供实时选手信息、自动视频分类和个性化视频推荐来增强体育赛事的观看体验。
演示
动机
- 在观看体育赛事视频时,观众往往希望快速了解球员的姓名或相关数据,但只能依靠模糊的球衣号码或球员特征在网上进行搜索。这不仅需要暂停视频,错过精彩瞬间,而且还要花费大量时间查找信息。
- 用户在观看大量的体育赛事视频时,往往需要花费大量时间手动对视频内容进行分类和标签,繁琐且耗时。如果平台对视频进行分类,需要大量的人力,费时费力,成本高,而且视频分类的效率较低。
- 观众在观看体育赛事视频时希望快速掌握比赛精彩片段,但制作比赛精彩片段需要人力观看整场比赛、选择片段并进行剪辑,耗时耗力。
- 当用户在观看视频时表达对特定主题的兴趣时,推荐其他类似视频很有可能符合用户的喜好,从而增强观看体验。
特征
- 实时球员信息展示:观看者点击视频中的球员,即可在弹出的对话框中查看其姓名、战术角色以及历史数据,无需自行搜索。
- 快速掌握游戏亮点:利用AI技术,用户可以快速掌握游戏亮点,减少搜索视频的时间,简化繁琐的搜索过程。 AI可以总结比赛内容,标记热点和亮点,为公司节省聘请兼职学生的成本。
- 自动分类:利用AI技术,系统自动对视频进行分类和标签,方便用户快速找到相关视频,提升观看体验。
- 视频推荐:通过分析用户的观看行为,AI根据当前观看的视频推荐其他类似视频,让用户更容易发现感兴趣的内容,提升观看体验。
解决方案与创新
- 球员信息实时同步:利用AI视觉模型识别场上球员球衣号码,结合网络爬虫技术和GenAI对信息进行处理和聚合,生成球员的实时和历史数据。
- 视频分类:使用OpenAI的文本嵌入模型将视频信息转换为向量表示,并使用Kmeans算法对相似视频进行分类。 GenAI分析每个类别集并分配合适的类别名称,实现视频库的自动化分类。
- 生成视频摘要:使用GenAI模型捕获视频音频信息,将其转换为文本文件,并使用GenAI汇总信息,生成视频大纲和摘要片段。
- 生成视频精彩片段:对生成的视频摘要文本进行嵌入搜索,与关键片段的常用关键词(如“进球啦!”、“得分~”)进行比较,识别出精彩片段的时间点。展开前后时间点,利用NLTK模型对展开后的多个视频片段进行修剪合并,保证片段有完整的上下文。
可交付成果
- 主页设计:用户可以在主页上选择自己感兴趣的视频。点击视频会跳转到另一个页面,主要有三个功能:
- 视频播放和实时球员信息:用户可以在比赛过程中点击感兴趣的球员,立即弹出显示球员姓名和信息的对话框。
- 精彩片段:视频播放下方显示比赛精彩片段,用户可以点击感兴趣的标题观看精彩片段。
- 推荐视频:系统根据用户的观看内容,推荐感兴趣的相关视频。
- 菜单栏和视频分类:首页有菜单栏,供用户按类别浏览视频,类别由人工智能自动生成。
如何设置
先决条件
- 颤振:https://docs.flutter.dev/get-started/install
设置项目
git clone https://github.com/deeeelin/Gelaito4.git
- 在项目文件夹中,运行
flutter run -d chrome --web-renderer html