场景自适应的在线多视图融合视频摘要算法

针对视频场景动态多变导致模型精度降低、复杂环境下模型收敛困难的问题,提出场景自适应的在线多视图融合视频摘要算法,利用语义、图像熵、视觉信息等融合的域无关特征对模型奖励进行奖励设计,同时降低特征空间以加速模型微调的收敛速度。

针对视频场景动态多变导致模型精度降低、复杂环境下模型收敛困难的问题,提出场景自适应的在线多视图融合视频摘要算法,利用语义、图像熵、视觉信息等融合的域无关特征对模型奖励进行奖励设计,同时降低特征空间以加速模型微调的收敛速度。 

  算法基于python3.6+环境下的torch、numpy、cv2等依赖库开发。算法输入为多摄像头拍摄的监控视频,输出为输入视频的内容摘要视频。该算法支持在Office、Campus等数据集上进行多视图视频摘要的检测,同时也支持在线多视图视频摘要检测。


算法名称

场景自适应的在线多视图融合视频摘要算法

算法接口

python3 main.py 

输入

多摄像头拍摄的监控视频

输出

输入视频的内容摘要视频

支持数据集

Office、Campus等

依赖库

torch、numpy、cv2等

Gitlab链接:ACK · GitLab (crowdhmt.com)

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
LH
LH

9 篇文章

作家榜 »

  1. 尹懋龙 10 文章
  2. LH 9 文章
  3. mingze 8 文章
  4. admin 6 文章
  5. hcshen 5 文章
  6. Marco Legend 4 文章
  7. 旺仔牛奶opo 3 文章
  8. Hao98 2 文章