当前位置:首页 > 论文知识 » 正文

计算机视觉OO

 人参与  2022-12-28 12:56:44  分类 : 论文知识  点这评论  作者:团论文网  来源:https://www.tuanlunwen.com/
计算机视觉OO

目录:

计算机视觉OO

计算机视觉OO

计算机视觉OO

1、Abstract:我们介绍一种不使用像素和视差模型的新立体公式。视觉中的许多问题被视为为每个像素分配一个标签。差异是立体的标签。这样的像素标签问题自然地以能量最小化的方式表示,其中能量函数有两个项:一个项惩罚与观察数据不一致的解,另一个项强制空间平滑度。图形切割是解决能量最小化的有效方法之一。然而,只有对于具有凸平滑项的情况,可以通过图形切割来执行多标签问题的精确最小化。在像素视差公式中,凸平滑项不能很好地生成重建的3D结果。因此,使用截短的线性或二次平滑项等,其中近似能量最小化是必要的。在本文中,我们介绍了一种新的站点标注公式,其中站点不是像素,而是三维空间中的线,标注不是视差而是深度数字。对于这个公式,能见度推理自然包含在能量函数中。另外,这个公式允许我们使用一个小的平滑项,这对3D结果没有太大的影响。这使得优化步骤非常简单,所以我们可以开发一种近似方法,用于图形切割本身(不能用于能量最小化)和高性能GPU图形切割程序。对于Middlebury数据集中的筑波立体声对,我们使用GTX1080GPU获得了5ms的结果,使用GTX660GPU获得了19ms的结果。

2、Abstract:人类对图像相似性的感知判断依赖于丰富的内部表征,从低级特征到高级概念,场景属性。现有的方法和数据集试图解释知觉相似性使用OO,这些OO可能无法覆盖影响人类相似性判断的全部因素,甚至包括那些与此目标相关的因素。我们在一个流行的娱乐网站之后引入了一个名为\ textbf {Totally-Looks-Like}(TTL)的新数据集,该网站包含人类配对的图像,视觉上相似。该数据集包含6016个来自野外的图像对,根据人类使用的丰富多样的标准揭示了这些图像对。我们进行实验,尝试通过从最先进的深度卷积神经网络中提取的特征重新生成配对,并进行额外的人体实验以验证所收集数据的一致性。尽管我们创造了条件来人工地使匹配任务变得更容易,但是我们表明机器提取的表示在再现人类选择的匹配方面表现很差。我们讨论和分析这些结果,提出改进学习图像表示的未来方向。

3、Abstract:在OO字幕任务中,最佳实践已通过基于注意力的模型实现,该模型将OO中突出的视觉组件与句子相关联。然而,现有的研究遵循一个通用的程序,其包括在等间隔帧采样上的帧级外观建模和运动建模,这可能导致冗余的视觉信息,对内容噪声的敏感性和不必要的计算成本。

4、我们建议即插即用PickNet在OO字幕中执行信息帧采摘。基于标准的编码器 - OOO框架,我们开发了一个基于强化学习的过程来依次训练网络,每帧挑选动作的奖励是通过最大化视觉多样性和最小化文本差异来设计的。如果候选人被奖励,它将被选择并且编码器 - OOO的相应潜在表示将被更新以用于将来的试验。此过程持续进行直到OO序列结束。因此,可以选择紧凑的帧子集来表示视觉信息并执行OO字幕而不会降低性能。实验结果表明,我们的模型可以使用6-8帧来在各种流行的基准测试中实现竞争性能。

后台-系统设置-扩展变量-手机广告位-内容正文底部

本文标签:我们  视觉  使用  一个  最小

<< 上一篇 下一篇 >>

  • 评论(

赞助团论文网
留言与评论(共有 0 条评论)
   
验证码:

相关文章

随机文章

标签列表

最近发表

    热门文章 | 最新文章 | 随机文章

最新留言

首页 论文知识 教育论文 毕业论文 教学论文 经济学 管理学 职称论文 法学 理学 医学 社会学 物理学 文献 工程论文 学位论文 研究论文

Powered 团论文网 版权所有 备案号:鄂ICP备2022005557号统计代码

全站搜索