博客
关于我
ECCV18 Oral | MIT&谷歌视频运动放大让计算机辅助人眼“明察秋毫”
阅读量:106 次
发布时间:2019-02-26

本文共 893 字,大约阅读时间需要 2 分钟。

标题:视频运动放大技术:深度卷积神经网络助力计算机辅助人眼“明察秋毫”

引言:视频运动放大技术是一种从视频到视频的滤波处理技术,旨在放大视频中肉眼看不到的小型运动。这种技术在建筑健康监测和医疗环境中的人体生命信号检测等领域具有重要应用价值。然而,现有技术往往因滤波器设计不够理想而导致噪音和模糊效果,限制了其实际应用潜力。本文通过深度卷积神经网络(Deep Convolutional Neural Networks, DCNN)从样本中学习运动放大滤波器,提出了一种新方法,有效解决了这一问题。

本文的主要贡献:本文提出了一种基于深度卷积神经网络的视频运动放大方法。与传统手工设计滤波器的方法不同,本文采用了人工合成的数据集,能够更好地捕捉视频中的小型运动。通过对比实验,我们证明了学习得到的滤波器在真实视频处理中表现优于现有方法,显著降低了振铃伪像和噪声放大现象。

网络架构:我们设计了一种简洁高效的网络架构,包含输入层、特征提取层和输出层。输入层接收待处理视频帧,特征提取层通过深度卷积操作提取视频运动特征,输出层则生成最终的运动放大效果图。

数据合成方法:为训练高质量的运动放大模型,我们采用了MSCOCO数据集中的图像作为前景,结合PASCAL VOC数据集中的目标作为背景。通过合理设计运动系数和尺度系数等参数,我们成功构建了包含丰富运动特征的合成视频数据集。

处理结果示例:实验结果表明,本文方法在视频运动放大方面的性能显著优于传统方法。例如,在高速运动物体的处理中,我们的算法成功消除了一些伪影现象,同时保持了良好的视觉效果。

论文引用:该研究成果已发表在2018年欧洲计算机视觉会议(ECCV'18)口头报告中,论文标题为《Learning-based Video Motion Magnification》。我们也开源了相关代码,供研究人员和开发者参考。

如需了解更多细节,可以访问以下链接:

  • 论文页面:https://arxiv.org/abs/1804.02684
  • 代码仓库:https://github.com/12dmodel/deep_motion_mag

转载地址:http://uopz.baihongyu.com/

你可能感兴趣的文章
PHP函数操作数字和汉字互转(100以内)
查看>>
PHP函数方法
查看>>
PHP创建目录mkdir无写入权限的问题解决方案
查看>>
PHP删除指定目录下的所有文件和文件夹 | 删除指定文件
查看>>
php删除文件夹下面所有文件包括(删除文件夹)不删除文件夹
查看>>
React Collapse Pane 项目教程
查看>>
php判断ip黑名单程序代码
查看>>
php判断复选框是否被选中的方法
查看>>
PHP判断指定目录下是否存在文件
查看>>
php判断数组是否为空
查看>>
PHP判断数组是否有重复值、获取重复值
查看>>
springboot基于Web的社区留守儿童管理系统源码毕设+论文
查看>>
Springboot基于Redisson实现Redis分布式可重入锁【案例到源码分析】
查看>>
PHP利用正则表达式实现手机号码中间4位用星号(*)替换显示
查看>>
PHP加密与安全的最佳实践
查看>>
PHP加速器eaccelerator导致php-fpm进程卡死原因分析
查看>>
PHP区分 企业微信浏览器 | 普通微信浏览器 | 其他浏览器
查看>>
php原生代码怎么连表查询,PHP tp5中使用原生sql查询代码实例
查看>>
PHP去掉转义符
查看>>
php去除字符串开头或末尾的字符(例如逗号)
查看>>