AI:你总要高清视频,它来了
机器之心Pro
2024-01-15 17:51:09
0

原标题:AI:你总要高清视频,它来了

机器之心报道

机器之心编辑部

以后,就算是跑着拍视频,FMA-Net也能给你处理得非常满意。

Magnific 图像超分 & 增强工具还正在火热体验中,它强大的图像升频与再创能力收获一致好评。现在,视频领域也有了自己的 Magnific。

拍摄的街道视频一片模糊,仿佛高度近视没戴眼镜一样:

与之相比,下面的视频清晰度高了很多:

视频画面两边形成鲜明的对比:左边视频已经模糊的看不清人脸,而右边视频建筑物的纹理也看得清清楚楚:

行驶的汽车仿佛从一个模糊的世界穿越到高清世界:

不同的方法进行比较,明显看到右下角的视频在微小的细节恢复方面更加清晰:

通过上述展示,我们可以看出,视频超分辨率(VSR)就像是给模糊的老电影穿上了高清新衣。比如上面展示的一段道路监控录像,由于画质太低,细节看起来像是被涂抹过一样。这时候就需要 VSR 技术出场了,它能够把这些低分辨率的视频变得更加清晰。

不过,这个过程并不简单。常常因为摄像机晃动或拍摄物体的移动,视频就像是被风吹过的湖面,波纹模糊。这时,我们不仅需要提升视频的清晰度,还得「摆平」这些模糊的干扰。这就需要视频超分辨率和去模糊的联合修复(VSRDB),它要在保持视频清晰度的同时,还得处理模糊,确保最后呈现出来的视频既清晰又流畅。

为了实现上述效果,来自韩国科学技术院(KAIST)与中央大学的研究者们提出了 FMA-Net 框架。这个框架基于流引导的动态滤波(Flow-Guided Dynamic Filtering, FGDF)和迭代特征细化的多重注意力机制(Iterative Feature Refinement with Multi-Attention, FRMA),旨在实现从小到大的运动表示学习,并具有良好的联合恢复性能(见图 1)。FGDF 的关键之处在于执行滤波时要注意运动轨迹,而不是拘泥于固定位置,这样就能用较小的核有效处理较大的运动。

  • 论文地址:https://arxiv.org/abs/2401.03707
  • 项目主页:http://kaist-viclab.github.io/fmanet-site/
  • 论文标题:FMA-Net: Flow-Guided Dynamic Filtering and Iterative Feature Refinement with Multi-Attention for Joint Video Super-Resolution and Deblurring

方法介绍

该研究的目标是同时实现视频超分辨率和去模糊(VSRDB)。对于一个模糊的 LR(低分辨率, low-resolution )输入序列,式中 T = 2N + 1、c 分别表示输入帧数和中心帧索引。VSRDB 的目标是预测一个清晰的 HR( 高分辨率,high-resolution )中心框架。如下图展示了 VSRDB 框架 FMA-Net。

FMA-Net 包括两部分:退化学习网络 Net^D ;修复网络 Net^R 。退化学习网络用于估计感知运动的时空变化退化核;修复网络利用这些预测出的退化核来恢复模糊的低分辨率视频。

其中,退化学习网络 Net^D 用来预测运动感知的时空变化退化,而 Net^R 以全局自适应的方式利用 Net^D 预测的退化来恢复中心帧 X_c。

Net^D 和 Net^R 具有相似的结构,它们由 FRMA( feature refinement with multiattention )块和 FGDF( flow-guided dynamic filtering )块组成。

下图 4 (a) 显示了第 (i+1) 步更新时 FRMA 块的结构,图 4 (b) 为多注意力结构。

下图 2 展示了 FGDF 概念。FGDF 看起来类似于可变形卷积(DCN),但不同之处在于 FGDF 学习的是位置相关的 n×n 动态滤波器系数,而 DCN 学习的是位置不变的 n×n 滤波器系数。

此外,新提出的多注意力机制,包括以中心为导向的注意力和退化感知注意力,使得 FMA-Net 能够专注于目标帧,并以全局适应的方式使用退化核进行视频超分辨率和去模糊。

训练策略

该研究采用两阶段的训练策略来训练 FMA-Net。首先对 Net^D 进行预训练,损失 L_D 为:

然后,为了提高性能,本文还提出了 TA 损失,即等式右侧的最后一项。

总的训练损失为:

实验结果

表 1 显示了在测试集 REDS4 上的定量比较结果。从表 1 可以看出:

  • 级联 SR 和去模糊的序列方法会导致先前模型的错误传播,导致性能显著下降,并且使用两个模型还会增加内存和运行时成本;
  • 与序列级联方法相比,VSRDB 方法始终表现出优越的整体性能,表明这两个任务高度相关;
  • FMA-Net 在 PSNR、SSIM 和 tOF 方面显著优于所有 SOTA 方法,具体来说,FMA-Net 比 SOTA 算法 RVRT * 和 BasicVSR++* 分别提高了 1.03 dB 和 1.77 dB。

表 2 为定量比较结果。当对两个测试集进行平均时,FMA-Net 的性能分别比 RVRT * 和 GShiftNet * 提高了 2.08 dB 和 1.93 dB。

下图为不同方法对 ×4 VSRDB 的可视化比较结果,表明 FMA-Net 生成的图像比其他方法生成的图像在视觉上更清晰。

不同方法在 REDS4、GoPro 和 YouTube 测试集上的可视化结果。放大观看效果最好。

了解更多技术细节,请阅读原文。

相关内容

热门资讯

上海九方云智能科技有限公司虚假...   上海九方云智能科技有限公司(九方智投)虚假宣传自家的服务产品,每天给股民发送消息,诱导股民去购买...
四川大决策投顾付费荐股不可靠,...   四川大决策投顾付费荐股不可靠,误导宣传诱导消费推荐垃圾股票!  四川大决策证券投资顾问有限公司的...
杭州高能云投顾公司虚假宣传骗取...   杭州高能云科技有限公司的荐股服务坑骗广大股民朋友,股民以为高能云投顾能给推荐牛股,带着他们赚钱,...
北京天相财富股多多软件不靠谱,...   北京天相财富管理顾问有限公司包括旗下的上海分公司,石家庄分公司,都存在相同的问题:虚假宣传,夸大...
股掌柜证券收费荐股坑骗消费者!...   股掌柜证券夸大营销,虚假宣传,诱导消费!给股民变相承诺收益,诱导股民去购买服务!这都是股掌柜证券...
杭州顶点财经网络传媒有限公司虚...   杭州顶点财经公司的收服务费荐股存在严重的虚假宣传,夸大收益的行为!为了让股民交费购买投顾服务,业...
深圳国诚投资上海分公司坑骗消费...   深圳国诚投资上海分公司坑骗消费者,利用虚假宣传夸大收益来诱导股民!  国诚投顾上海分公司公司给股...
上海汇正财经私人订制服务骗局,...   上海汇正财经顾问有限公司给股民进行夸大宣传,诱导从几百块的服务升级到最终十几万的服务,而这个服务...
上海海能投顾给股民虚假宣传欺骗...   上海海能证券投资顾问有限公司(海能投顾的荐股服务存在虚假夸大宣传,诱导股民去购买他们公司的服务)...
杭州高能云投顾公司荐股服务骗局...   杭州高能云科技有限公司(高能云智投服务存在虚假夸大宣传,诱导股民去购买他们公司的投顾服务),杭州...
天相投资顾问有限公司股多多软件...   天相投顾公司的股多多软件真实使用感受怎么样?股民花高价购买了他们的软件后真有用?  北京天相财富...
四川大决策投顾违规荐股欺骗消费...   四川大决策违规主要违反了《证券投资顾问业务暂行规定》中的第二十四条“证券公司、证券投资咨询机构应...
杭州高能云VIP投顾服务垃圾骗...   杭州高能云VIP投顾服务垃圾骗人的,被业务员虚假宣传诱导消费!  为了让股民去购买他们家公司的服...
上海汇正财经顾问有限公司收服务...   上海汇正财经顾问有限公司金斗云智投荐股不靠谱,牛人掌柜到后面升级的私人订制服务都不靠谱!  上海...
杭州顶点财经七分公司虚假宣传骗...   杭州顶点财经公司旗下的几个分公司在网上给股民虚假宣传,夸大宣传,诱导营销!之前杭州顶点财经网络传...
夜郎醇酒业(广州)有限公司不能...   夜郎醇酒业(广州)有限公司不能上市,虚假宣传买股权送酒骗局!  买酒送原始股股票,存钱不如存酒。...
深圳珞珈投资投顾服务不靠谱骗人...   深圳市珞珈投资咨询有限公司(珞珈投资)是一家正规的投顾公司?在珞珈投资公司交完服务费后,发现他们...
浙江同花顺云软件业务员虚假宣传...   浙江同花顺云软件有限公司前不久刚刚被证监会给调查了,而且做出了三个月的停业整顿!“11月18日,...
深圳国诚投资上海分公司荐股服务...   国诚投资上海分公司正规合法吗?深圳国诚投顾公司业务员都是通过给你发一些所谓的盈利截图或者是做概率...
上海汇正财经顾问公司虚假宣传诱...   上海汇正财经顾问有限公司业务员不断地营销他们的服务,吹嘘他们的投顾服务有多牛,多么智能,并且购买...