目录
- 精彩叙述
- 细节
发表在2017年DCC。
这篇文章立意很简单,方法也很简单,但是做得早、效果好、引用量也不错(40+)。
指标:在HEVC的intra、LDP、LDB和RA模式下,BDBR平均可以下降5%、6.4%、5.3%和5.5%。
 由于是解码端(decoder-end)的网络,因此可以进一步解决inloop-filter没能解决的块效应和振铃效应等压缩伪影。
以下摘一些精彩的叙述,同时重点看清楚实施细节。
精彩叙述
- 提升压缩质量是视频编码的永恒主题。然而,无论我们如何修改编码器,视频冗余已经很难下降。 
- 在解码端增强视频质量,等价于提升了压缩效率。 
- 这种方法受益于端到端训练,并且可以拓展至视频压缩标准。 
- 由于实际的有损压缩标准都不是理论最优的,因此就存在信息冗余可以被继续挖掘和利用。 
- JPEG、H264、HEVC等方法之所以没能突破压缩率极限,就是因为它们没有利用外部信息或先验。 
- 我们无需修改编码器。 
- 作者将那些传统的优化方法称为compressive-sensing-based methods。它们通常不考虑外部先验,但仍然能取得一定效果,说明冗余仍然是存在的。 
细节
DCAD:Deep CNN-based Auto Decoder。

- 训练目标:MSE损失。 
- 网络结构:10层\(64 \times 3 \times 3\)滤波器堆叠,ReLU激活函数(除了最后一层),全局残差网络,各层补零。 
- 作者试过20层,效果并没有更好。 
- 在选择训练块时,作者是根据TU分割信息选择的。作者尽量使得每一种TU分割的数量相同,即均匀出现在训练集中。 
- 对于高QP模型,作者将低QP模型迁移过来,以更好地学习。 
- 图像为YCbCr三通道,只在亮度通道上增强。 
- HM 16.0压缩,考虑了QP = 22,27,32,37。 
- AdaDelta优化方法比学习率衰减方法更好。关于四个QP的初始学习率分别设为1,0.1,0.1和0.01。 
- 最后一层的学习率是全局的1/10。 
