视频包装智能检测技术浅析
前言 做视频后期处理的时候,有一类需求特别常见:把视频里的字幕、台标LOGO、比分牌这些”包装元素”给擦掉。但在动手擦之前,有个更关键的问题——你得先精确地找到这些东西在哪儿。这个”找”的过程,远比想象中复杂。字幕会出现又消失,LOGO从头到尾...
前言 做视频后期处理的时候,有一类需求特别常见:把视频里的字幕、台标LOGO、比分牌这些”包装元素”给擦掉。但在动手擦之前,有个更关键的问题——你得先精确地找到这些东西在哪儿。这个”找”的过程,远比想象中复杂。字幕会出现又消失,LOGO从头到尾...
前言 最近在研究怎么把普通的2D视频转成3D立体视频,说白了就是从一个摄像头拍的画面里”脑补”出左右眼的视差,让你戴上3D眼镜就能看到立体效果。这个方向其实挺有意思的,不管是给老电影”翻新”成3D版本,还是给VR头显生产内容,都有实打实的应用场...
前言 最近在折腾车载摄像头的一些图像处理,想让它变得更“聪明”一点,尤其是在镜头被弄脏或者被什么东西挡住的时候,能及时发现问题。这玩意儿比想象中要复杂,踩了不少坑,也学到不少东西。今天就来简单记录一下我的一些思考和实践,希望能给同样在捣鼓这些东...
前言 本文简单记录一下个人在研究stable diffusion中的过程中对扩散模型(diffusion model)的工作原理和模型结构的学习。
Performance of My Engineering Projects
前言 本文记录了深度学习模型中卷积操作的感受野和特征图尺寸计算方式,以及如何分析网络的参数量和计算量,用来评价一个模型的规模大小与推理速度。