百度17篇论文当选全球顶尖视觉盛会CVPR 百度大脑
来源:通信网 发表于2019-07-05 06:30:06 编辑:马明哲
摘要: 跟着深度学习的迅猛发展,核算机视觉已成为人工智能范畴影响最深远的技能之一。在核算机视觉范畴深入研讨、有着强壮技能堆集的百度,以17篇论文当

   跟着深度学习的迅猛发展,核算机视觉已成为人工智能范畴影响最深远的技能之一。在核算机视觉范畴深入研讨、有着强壮技能堆集的百度,以17篇论文当选核算机视觉和形式辨认大会CVPR 2019,其不俗成果再次成为国际视觉尖端盛会中受注目的 我国面孔 。

   据了解,CVPR 2019即将于6月在美国长滩举行,作为人工智能范畴核算机视觉方向的重要学术会议,CVPR每年都会招引全球最顶尖的学术组织和公司的研讨人员投稿。

   CVPR官网显现,本年有超越5165篇的大会论文投稿,终究选取1299篇,选取率约为25%。据了解,上一年的CVPR 2019共有979篇论文被主会录入,录用率约为29%。比较2019,本年的竞赛愈加剧烈。

   本年百度公司有17篇论文被CVPR接纳,内容涵盖了语义切割、网络剪枝、ReID、GAN等许多方向,以下为百度当选CVPR 2019的17篇论文。

   1)Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation

   论文作者:Yawei Luo; Liang Zheng; Tao Guan; Junqing Yu; Yi Yang

   论文介绍:在虚拟图画集上练习出的语义切割网络,往往在实在图画集上体现欠安。网络切割功能下降是由于两个域间存在较大差异,而深度模型泛化才能缺少。传统办法测验经过大局对齐源域和方针域间特征散布的来处理此问题,而该类办法往往疏忽了特征间的部分语义一致性。本文初次结合了联合练习和对立练习来处理此问题。不同于传统办法,本文依据每一个特征的语义对齐程度,自习惯的调整特征对齐的力度。该办法处理了传统办法中特征语义不一致问题和负搬迁的问题。试验成果证明咱们的办法能大大进步网络在方针域图画上的切割精度。

   运用场景:主动驾驶。本办法将电脑组成图画练习出的网络直接泛化到实践数据集上,大大削减了主动驾驶范畴中街景数据收集和数据标示的作业量。

   论文地址:

   https://arxiv.org/abs/1809.09478

   2)Filter Pruning via Geometric Median for Deep Convolutional Neural Networks Acceleration

   论文作者:Yang He, Ping Liu, Ziwei Wang, Zhilan Hu, Yi Yang

   论文介绍:在本文中,咱们剖析了关于网络剪枝的 小范数 -低重要性 的规范。曾经的作业运用 小范数 -低重要性 的规范来修剪在卷积神经网络中具有较小范数值的滤波器,但出它的有用性取决于两个并不总是满意的要求:滤波器的范数的规范差应该很大; 滤波器的最小范数应该很小。为了处理这个问题,咱们提出了一种新的滤波器修剪办法,即经过"几许均匀数"进行滤波器剪枝,以便在不考虑这两个要求的情况下对模型进行紧缩,咱们称之为FPGM。与之前的办法不同,FPGM经过去掉冗余的滤波器来紧缩CNN模型,而不是去掉那些范数小的过滤器。咱们在图画分类使命上的两个数据集上,验证了FPGM的有用性。在Cifar-10数据集上,FPGM在ResNet-110上的核算量下降了52%以上,相对准确度进步了2.69%。此外,在ILSVRC-2019数据集上,FPGM还在ResNet-101上削减了超越42%的核算量。

   运用场景:本文提出的办法能够有用进步神经网络紧缩率。能够将紧缩后的网络布置到便携式设备,比方手机、摄像机等,加速处理速度。

   论文地址:

   https://arxiv.org/abs/1811.00250

   GItHub地址:

   https://github.com/he-y/filter-pruning-geometric-median

   3)Detailed Human Shape Estimation from a Single Image by Hierarchical Mesh Deformation

   论文作者:Hao Zhu; Xinxin Zuo; Sen Wang; Xun Cao; Ruigang Yang

   论文介绍:本文提出了一个新的结构,能够依据单个图画康复具体的人体形状。由于比如人体形状、身体姿势和视角的改变等要素,因而这是一项具有应战性的使命。现有办法一般测验运用短少外表细节的依据参数的模板来康复人体形状。因而,所得到的身体形状好像没有衣服。在本文中,咱们提出了一种新颖的依据学习的结构,它结合了参数模型的鲁棒性和自在3D变形的灵活性。咱们运用深度神经网络在层次网格变形结构中运用身体关节、概括和每像素上色信息的束缚来细化3D形状。咱们能够康复除皮肤模型之外的具体人体形状。试验证明,咱们的办法优于从前的最先进办法,在2D IoU数和3D衡量间隔方面完成了更好的准确性。

   论文地址:

   https://arxiv.org/abs/1904.10506v1

   GItHub地址:

   https://github.com/zhuhao-nju/hmd.git

   4)GA-Net: Guided Aggregation Net for End-to-end Stereo Matching

   论文作者:Feihu Zhang; Victor Adrian Prisacariu; Yang Ruigang; Philip Torr

   论文介绍:在立体匹配使命中,为了准确估量差异,匹配本钱聚合在传统办法和深度神经网络模型中都是至关重要的。咱们提出了两个新的神经网络层,别离用于捕获部分和整个图画的本钱相关性。第一个是半大局聚合层,它是半大局匹配的可微近似;第二个是部分引导聚合层,它遵从传统的本钱过滤战略来细化薄结构。这两层能够用来替代广泛运用的3D卷积层,该层由于具有立方核算/存储器杂乱性而核算本钱高且耗费存储器。在试验中,咱们标明,具有双层引导聚合块的网络很轻易地超越了具有19个3D卷积层的最先进的GC-Net。咱们还练习了深度引导聚合网络,它比场景流数据集和KITTI基准测验中的最新办法具有更好的准确性。

   论文地址:

   https://arxiv.org/abs/1904.06587

   GitHub地址:

   https://github.com/feihuzhang/GANet

   5)Invariance Matters: Exemplar Memory for Domain Adaptive Person Re-identification

   论文作者:Zhun Zhong, Liang Zheng, Zhiming Luo, Shaozi Li, Yi Yang

   论文介绍:本论文旨在处理行人再辨认中的跨数据集问题:运用有标示的源数据集和无标示的方针数据集学习一个在方针数据集具有很好的鲁棒性的模型。干流的研讨办法首要经过下降源域和方针域之间的特征散布的差异。可是,这些办法疏忽了方针域的域间改变,这些改变中包括了影响方针域测验功能的重要要素。在本文的作业中,咱们全面的探讨了方针域中的域间改变,并依据三种潜在的域内不变性提出了一个新的模型泛化办法。为了完成这个办法,咱们在模型练习进程中引进了一个样例回忆模块用以存储方针数据在练习进程中的中心特征。该样例回忆模块能够使咱们快速的核算方针域中部分练习样本和大局样本的相似性,一同有用的在模型练习中参加提出的三个不变性束缚。试验证明本文提出的三个不变性性质对进步范畴习惯的功能是不可或缺的。一同,咱们的办法在三个行人再辨认的方针域中的准确率大大的超越了当时现有的办法。

   运用场景:本文提出的办法能够有用进步行人再辨认模型在跨场景下的泛化才能。使得咱们能够在现有的标示数据情况下,以无监督的办法进步模型在新的场景下的功能。

   论文地址:

   https://arxiv.org/abs/1904.01990

   GitHub地址:

   https://github.com/zhunzhong07/ECN

   6)Searching for A Robust Neural Architecture in Four GPU Hours

   论文作者:Xuanyi Dong, Yi Yang

   论文介绍:本论文旨在处理神经网络查找算法耗费GPU资源过大的问题。现在许多神经网络查找算法在小数据集CIFAR上,都需求耗费成百上千的GPU/TPU。为了进步神经网络的查找功率,咱们提出了一种运用可微网络结构采样器的依据梯度的查找办法。咱们的办法将整个查找空间用一个有向无环图来标明,这个图包括了成百万多个子图,每一个子图都代表了一种网络结构。针对这个有向无环图,咱们规划了一个可微的采样器,运用Gumbel-Softmax技能将离散的采样进程变成可微可导的;在练习进程中,经过验证集上的方针丢失函数来优化这个采样器,使得采样器终究能过取得一个功能较好的网络结构。在试验中,咱们在一个GPU上,经过几个小时的查找时刻,就能够在CIFAR上找到一个高功能的网络结构。

   运用场景:本文提出的办法能够有用地在较短时刻运用少数GPU查找出鲁棒的网络结构,能够广泛地运用在大部分使命里,查找出对更小更快精度更高的网络模型。

   GitHub地址:

   https://github.com/D-X-Y/GDAS

   7)DM-GAN: Dynamic Memory Generative Adversarial Networks for Text-to-image Synthesis

   论文作者:Minfeng Zhu, Pingbo Pan, Wei Chen, Yi Yang

   论文介绍:本论文旨在进步依据文本生成的图片的实在性。当时的办法都是先生成比较粗糙的初始图画,然后再优化图画然后生成高分辨率的实在图画。可是,现在大多数办法仍存在两个问题:当时办法的成果很大程序上取决于初始图画的质量。假如初始图画质量不高,则第二阶段优化很难将图画优化到令人满意的程度。每个单词关于不同的图片内容都有不同的信息量,但当时办法在两个阶段中依然坚持了相同的单词重要性。

   在本文作业中,咱们提出动态回忆生成对立网络来生成高质量的图片。咱们提出了一个动态回忆模块来优化粗糙的初始图画,即便初始图画生成不良,它也能够生成高质量的图画。具体来说,动态回忆模块包括一个依据初始图画挑选重要文本信息的回忆写入门和一个自习惯交融图片特征和文本信息的反应门。咱们在COCO和CUB数据集上评价了咱们的模型。试验成果标明,咱们的办法在FID和IS方针以及实在性上都超越了当时办法。

   运用场景:文本提出的办法能够明显进步依据文本生成图片的实在性,咱们能够完成文章主动配图等功能,能够大大下降创作者的配图本钱。

   论文地址:

   https://arxiv.org/abs/1904.01310

   8)Sim-Real Joint Reinforcement Transfer for 3D Indoor Navigation

   论文作者:Fengda Zhu, Linchao Zhu, Yi Yang

   论文介绍:在室内3D导航中,环境中的机器人依据指令移动到方针点。可是在物理国际中布置用于导航的机器人,需求很多的练习数据来学习有用的战略。为机器人练习取得满足的实在环境数据是价值贵重的,因而咱们提出经过组成数据烘托环境随后将战略搬迁到实在环境中。虽然组成环境有利于来促进实践国际中的导航练习,但实在环境与组成环境有两个方面不同。首要,两种环境的视觉标明具有明显的差异。其次,两个环境的房子计划有很大不同。因而,需求在强化模型中调整两种类型的信息,即视觉标明和战略行为。视觉表征和战略行为的学习进程是互利的。

   咱们提出联合调整视觉体现和战略行为,以完成环境和战略的彼此影响。具体来说,咱们的办法选用了用于视觉表征搬运的对立特征习惯模型和用于战略行为仿照的模仿战略。试验成果标明,咱们的办法在没有任何额定的人类注释的情况下优于根底模型高达21.73%。

   运用场景:本文提出的视觉特征习惯模型和战略模仿模型能够有用将机器人在虚拟环境中学习到的战略和特征搬迁到实践场景中,有利于导航机器人,无人车等需求很多数据练习的运用在缺少杂乱场景的实在数据时,经过烘托环境取得更好的战略。

   论文地址:

   https://arxiv.org/abs/1904.03895

   9)Contrastive Adaptation Network for Unsupervised Domain Adaptation

   论文作者:Guoliang Kang, Lu Jiang, Yi Yang, Alexander G. Hauptmann

   论文介绍:无监督域习惯旨在运用带标签源域数据和无标签方针域数据,取得在方针域数据上的优秀的猜测功能。以往的办法在消除域差异的进程中没有充分运用类别信息,导致对齐过错,影响泛化功能。为了处理这些问题,这篇文章提出了新的域差异衡量方针 比照域差异 来描写类内和类间域差异,而且提出 比照习惯网络 来优化这个方针。咱们规划了新的类感知采样办法,选用替换更新的办法端到端地优化咱们的网络。咱们在两个规范数据集上取得了比现有的办法更好的功能。

  

   运用场景:能够进步单一场景练习模型在缺少标签的新场景下的辨认功能,如运用人工组成带标签数据集,在实践场景图片上进行辨认等使命。

   论文地址:

   https://arxiv.org/abs/1901.00976

   10)ApolloCar3D: A Large 3D Car Instance Understanding Benchmark for Autonomous Driving

   论文作者:Xibin Song, Peng Wang, Dingfu Zhou, Rui Zhu, Chenye Guan, Yuchao Dai, Hao Su, Hongdong Li, Ruigang Yang

   亮点介绍:本文提出了现在已知主动驾驶范畴最大规划的三维车辆姿势数据集,共包括5000+高分辨率图画、6万+车辆的三维姿势信息及对应的车辆二维语义要害点信息。图画中每辆车运用工业级高精度的三维车辆模型进行三维与二维的匹配获取车辆姿势。本数据集的规划是现在主动驾驶范畴相关数据集的20倍左右,如PASCAL3D+,KITTI等;依据此数据集,本文提出了不同的办法进行车辆三维姿势估量,包括依据要害点的办法和非要害点的办法;本文提出了完好的车辆三维信息评价办法,包括车辆的形状和姿势信息,比较现在主动驾驶范畴相关数据集的评价规范,本文的评价愈加全面。

   落地场景:主动驾驶范畴,依据单张图画的车辆姿势估量。

   论文地址:

   https://arxiv.org/abs/1811.12222

   11)UnOS: Unified Unsupervised Optical-flow and Stereo-depth Estimation by Watching Videos

   论文作者:Yang Wang, Peng Wang, Zhenheng Yang, Chenxu Luo, Yi Yang, and Wei Xu

   亮点介绍:只经过双目摄像头的视频,经过深度学习,就能学习到 双目深度视觉,光流和相机姿势。

   落地场景:能够辅佐支撑主动驾驶双目视觉模型,然后更好的从激光的离散深度改换到稠密深度。

   论文地址:

   https://arxiv.org/abs/1810.03654

   12)Look More Than Once: An Accurate Detector for Text of Arbitrary Shapes

   论文作者:Chengquan Zhang, Borong Liang, Zuming Huang, Mengyi En, Junyu Han, Errui Ding, Xinghao Ding

   亮点介绍:受限于神经网络感触野巨细束缚和简略的文字围住盒表达,以往的文字检测器在长词和恣意形状的文字场景简单失利。本文提出了一个新的文字检测器结构,针对性的处理了这两个问题。新的文字检测器结构由三部分组成,直接回归器、迭代改善模块和文字形状表达模块。

   DR输出四边形表达的文字检测候选;IRM依据四边形对应的特征块逐渐感知和改善完好的四边形文字围住盒以处理长词检测问题;SEM模块则经过回归完好四边形候选框内的文字实例几许信息,来重建愈加精准的上下顶点线对称的多边形文字标明。IRM和SEM作为可学习的和可刺进的模块,能够联合DR一同进行端到端的练习。在包括多方向、长词、恣意曲折和多语种场景的五个具有权威性的揭露数据集合上,咱们提出的新检测器和一切已揭露论文中的纯检测办法作比照方针都到达了最好的作用。

   论文地址:

   https://arxiv.org/abs/1904.06535

   13)STGAN: A Unified Selective Transfer Network for Arbitrary Image Attribute Editing

   论文作者:Ming Liu, Yukang Ding, Min Xia, Xiao Liu, Errui Ding, Wangmeng Zuo, Shilei Wen

   亮点介绍:提出了STGAN办法用于图片/视频的端到端特点转化。对传统办法提出了两点改善:1) 在自编码网络结构中引当挑选性特点修改单元强化了特点修改的作用 ;2) 提出了依据特点更改的练习机制。在celebA数据集上转化作用全方位好于已有办法。

   落地场景:视频拍照特效、物料款式生成。

   论文地址:

   https://arxiv.org/abs/1904.09709

   GitHub地址:

   https://github.com/csmliu/STGAN

   14)Attentive Feedback Network for Boundary-Aware Salient Object Detection

   论文作者:Mengyang Feng, Huchuan Lu, and Errui Ding

   论文介绍:最近依据深度学习的明显方针检测办法在彻底卷积神经网络的根底上完成了可喜的功能。可是,他们中的大多数都遭受了鸿沟应战。现在最先进的办法选用特征聚合技能,而且能够准确地找出其间的明显方针,可是它们常常无法将具有精密鸿沟的整个方针切割出来,尤其是那些凸起的窄条纹。因而,依据FCN的模型仍有很大的改善空间。在本文中,咱们规划了留意反应模块,以更好地探究方针的结构。咱们还选用鸿沟增强丢失进一步学习精密鸿沟。咱们提出的深度模型在方针鸿沟上取得了令人满意的成果,并在5个广泛测验的明显方针检测基准上完成了最先进的功能。该网络选用彻底卷积办法,以26 FPS的速度运转,不需求任何后期处理。

   论文地址:

   https://github.com/ArcherFMY/AFNet

   15)A Mutual Learning Method for Salient Object Detection with intertwined Multi-Supervision

   论文作者:Runmin Wu, Mengyang Feng, Wenlong Guan, Dong Wang, Huchuan Lu, Errui Ding

   论文介绍:虽然近来深度学习技能在明显方针检测方面取得了很大发展,但由于方针的内部杂乱性以及卷积和池化操作中的步幅导致的不准确鸿沟,猜测的明显图依然存在不完好的猜测。为了缓解这些问题,咱们主张经过运用明显方针检测,以及远景概括检测和边际检测的监督来练习明显性检测网络。首要,咱们以交错的办法运用明显方针检测和远景概括检测使命来生成具有均匀高光的明显图。其次,远景概括和边际检测使命一同彼此引导,然后导致准确的远景概括猜测并削减边际猜测的部分噪声。此外,咱们开发了一种新颖的彼此学习模块,它作为咱们办法的构建模块。每个MLM由多个以彼此学习办法练习的网络分支组成,功能满意大大进步。咱们对七个具有应战性的数据集进行的很多试验标明,咱们所提出的办法在明显方针检测和边际检测方面都能到达最好的作用。

   GitHub地址:

   https://github.com/JosephineRabbit/MLMSNet

   16)L3-Net: Towards Learning based LiDAR Localization for Autonomous Driving

   论文作者:Weixin Lu, Yao Zhou, Guowei Wan, Shenhua Hou, Shiyu Song

   亮点介绍:自定位模块是无人车体系的根底模块之一,一个老练的L4等级无人车定位体系需求供给厘米级定位精度的输出成果。百度提出了一种依据学习的点云定位技能,不同于传统的人工规划的杂乱算法,该技能对传统的定位办法进行拆解,运用深度学习网络来替代传统的各个环节和过程,并在一个包括多种场景路况和大标准时刻跨度的数据集上验证了算法作用,完成了厘米级的定位精度。该计划是全球范围内,业界初次经过运用直接作用于激光点云的深度学习网络来处理主动驾驶的自定位问题。数据集包括了城市路途、园区路途和高速等多种赋有应战的路况场景,数据总路程达380km,即将在百度Apollo渠道敞开。

   落地场景:百度无人车

   论文地址:

   https://songshiyu01.github.io/publication/cvpr2019_localization/

   17)Improving Transferability of Adversarial Examples with Input Diversity

   论文作者:Cihang Xie; Yuyin Zhou; Song Bai; Zhishuai Zhang; Jianyu Wang; Zhou Ren; Alan Yuille

   论文介绍:虽然CNN已经在各种视觉使命上取得了非常好的体现,但它们很简单遭到对立性示例的影响,这些示例是经过在明晰的图画中参加人类不易发觉的扰动而精心制作的。可是,大多数现有的对立性进犯在具有应战性的黑盒设置下只能取得相对较低的成功率,由于进犯者不了解模型结构和参数。为此,咱们主张经过创立不同的输入形式来进步对立性示例的可搬迁性。咱们的办法不是仅运用原始图画来生成对立性示例,而是在每次迭代时将随机改换运用于输入图画。

   ImageNet上的很多试验标明,咱们所提出的进犯办法生成的对立性示例能够比现有基线更好地搬迁到不同的网络。经过评价咱们针对NIPS 2019对立性竞赛中的尖端防护处理计划和官方基线的办法,增强型进犯的均匀成功率到达73.0%,在NIPS竞赛中的前1次进犯提交率大幅进步6.6%。咱们期望咱们提出的进犯战略能够作为评价网络对立的稳健性和未来不同防护办法的有用性的强壮基准基线。

   论文地址:

   https://arxiv.org/abs/1803.06978

   GitHub地址:

   https://github.com/cihangxie/DI-2-FGSM

时时优惠
投稿邮箱:
相关推荐
百度17篇论文当选全球顶尖视觉盛会CVPR 百度大脑
百度17篇论文当选全球顶尖视觉盛会CVPR 百度大脑

跟着深度学习的迅猛发展,核算机视觉已成为人工智能范畴影响最深远的技能之

时时优惠2019-07-05 06:30:06

震动丨4000万电影项目被曝层层转包?
震动丨4000万电影项目被曝层层转包?

这两天,有网友实名告发河北省张家口市万全区水幕电影项目层层转包一事在网

时时优惠2019-07-05 06:29:57

各部门厚实展开第一批“不忘初心、紧记任务”
各部门厚实展开第一批“不忘初心、紧记任务”

不忘初心、紧记使命主题教育展开以来,中心各部门各单位聚集遵从守初心、担

时时优惠2019-07-04 10:42:36

蔚来因车辆自燃召回4803辆ES8 特斯拉会紧随其后吗
蔚来因车辆自燃召回4803辆ES8 特斯拉会紧随其后吗

6月27日,蔚来轿车发布了近期几起蔚来ES8自燃事情的查询结果,一起宣告召回

时时优惠2019-07-03 17:36:47

24小时自助图书馆成铺排?存在七八年,很少有人
24小时自助图书馆成铺排?存在七八年,很少有人

材料图:数名读者正在自助图书馆阅览。中新社发 刘佩琦 摄 有了24小时自助图

时时优惠2019-07-02 23:06:45