场景自适应的在线多视图融合视频摘要算法

针对视频场景动态多变导致模型精度降低、复杂环境下模型收敛困难的问题，提出场景自适应的在线多视图融合视频摘要算法，利用语义、图像熵、视觉信息等融合的域无关特征对模型奖励进行奖励设计，同时降低特征空间以加速模型微调的收敛速度。

针对视频场景动态多变导致模型精度降低、复杂环境下模型收敛困难的问题，提出场景自适应的在线多视图融合视频摘要算法，利用语义、图像熵、视觉信息等融合的域无关特征对模型奖励进行奖励设计，同时降低特征空间以加速模型微调的收敛速度。

算法基于python3.6+环境下的torch、numpy、cv2等依赖库开发。算法输入为多摄像头拍摄的监控视频，输出为输入视频的内容摘要视频。该算法支持在Office、Campus等数据集上进行多视图视频摘要的检测，同时也支持在线多视图视频摘要检测。

算法名称	场景自适应的在线多视图融合视频摘要算法
算法接口	python3 main.py
输入	多摄像头拍摄的监控视频
输出	输入视频的内容摘要视频
支持数据集	Office、Campus等
依赖库	torch、numpy、cv2等

Gitlab链接：ACK · GitLab (crowdhmt.com)

发表于 2022-05-23 11:33
阅读 ( 2205 )
分类：边端协同深度计算

作家榜 »

Panda-admin 38 文章
解弘艺 17 文章
高曾谊 16 文章
旺仔牛奶opo 15 文章
胡中天 14 文章
LH 14 文章
罗柏荣 13 文章
林晨 12 文章