当前位置: 舞台 >> 舞台市场 >> 专访香港大学罗平师从汤晓鸥王晓刚,最早
雷锋网AI科技评论:虽然ICCV落幕已近两周,但是这场对于华人研究者而言具备「转折点」意义的国际学术顶会在大家心中掀起的波澜,想必依旧未了。
在今年这场CV领域的学术盛宴中,我们一如既往地看到了不少长期活跃在国际学术舞台上的华人研究者老面孔,与此同时,也有一些新面孔带着丰硕的学术成果出现在了大家视线的聚焦点。
其中就包括今年带了7篇论文参加ICCV的来自香港大学的罗平教授。作为一位在将深度学习应用到CV领域中做出了很多开创性工作的研究者,他的相关工作对于这一细分领域的研究者而言可能并不陌生:最早将深度学习用于行人、人脸分割、与人脸生成,首先提出CNN求解MRF用于语义分割等。与此同时,他做的人脸关键点工作还是多任务深度学习的代表性工作。
值得一提的是,罗平教授与今年在ICCV上独占鳌头的商汤科技也有着不少渊源和交集:至年在港中文攻读博士时师从汤晓鸥和王晓刚两位计算机视觉领域的领*人物,至年又曾在商汤研究院访问任研究总监。
在ICCV现场,AI科技评论也基于他本次带来的工作成果跟他聊了聊,不仅如此,对话也谈到了罗平教授最初开始研究将深度学习应用到CV领域的契机和背景以及汤晓鸥和王晓刚两位老师对他职业生涯所带来了影响。
以下为AI科技评论与罗平教授的对话实录:
AI科技评论:您的研究组今年在ICCV发表了7篇论文,主题涉及到深度表征学习、深度自学习、多目标对抗网络等,其中哪几篇是您比较看重的,采用了怎样的方法,实现了怎样的成果?
罗平:我们今年在ICCV发表的7篇论文中,涉及到白化和归一化方法(SwitchableWhitening)、结构化搜索NAS、相机重定位、服装图片检索、噪声标签自学习方法、网络的攻击和防御等研究主题。
其中比较重要的工作一个是关于连续单路径结构化搜索,另一个是关于白化和归一化的工作:
在结构化搜索的工作中,跟以往DARTS类的多路径方法不同,我们做的是单路径NAS,这种方法的优势是计算量比较低,缺点是表达能力也较低,即能够搜索到的结构较少。对此,我们定义了卷积操作的连续可微空间,即把一些卷积操作建模成一个连续的可微模块,这些模块能够表示任何卷积操作——即便是没有被手动定义出来的操作也能表示,从而既能保证表达能力,又能够通过单轮搜索保证较高的搜索速度。另一项白化和归一化工作叫做SwitchableWhitening。每个神经网络都需要做归一化,比如说BatchNormalization(批量标准化),它其实是白化的一种特殊形式,而在这项工作中,我们将白化和归一化进行了融合,可以为整个网络的不同层和图像学习白化和归一化方式。此项工作,与探讨前向传播的计算和反向传播的二阶梯度优化算法有着不少联系。AI科技评论:在完成论文期间有哪些可以分享的故事吗?或者说遇到过哪些比较大的挑战和困难?
罗平:挑战和困难肯定是有的,这里可以分享下我的一个学生的故事,我们今年ICCV的7篇论文中,有2篇论文的第一作者都是他。
他本科期间学的专业侧重物理,博士刚开始转向现在的研究领域,适应得并没有那么快,但他具备挖掘新问题的能力。例如他的从大量噪声标签中自学习特征表达(DeepSelf-LearningFromNoisyLabels)这项工作其实已经开展了一年,但是在这个过程中又发现了其他新的问题,例如网络的攻击和防御,所以他同时进行了这两项研究工作,并在ICCV上一下发表了2篇一作论文。
AI科技评论:本次参加ICCV重点
转载请注明:http://www.aideyishus.com/lkjg/3695.html