AI界里有句话:得视觉者得天下。
根据科学研究,人类大脑皮层的70%活动都在处理视觉信息。作为一门研究如何使机器“看”的科学,计算机视觉就是人工智能的“眼睛”,是感知客观世界的核心技术。
提到计算机视觉研究,就不得不提一位近年来声名鹊起的“80后”——何恺明。他是计算机视觉研究领域搅动风云的人物、2023年度未来科学大奖数学与计算机科学奖获得者。
从高考满分状元到“CVPR最佳论文奖”第一位华人得主,再到带领“深度残差网络”研究团队在比赛中击败谷歌等公司夺得第一……年纪轻轻的何恺明早已创下众多同龄人难以企及的荣誉。2022年,年仅39岁的他力压全球25万名科学家,位居全世界最具影响力学者排行榜的首位。他的90篇论文,全球引用次数超过24万。这意味着,他的研究成果正成为奠定行业发展的基石,被网友称为“AI大神”。
何恺明
少年天才的开挂人生
用开挂式人生来形容何恺明的经历一点不为过。
何恺明1984年出生于广州,是家中独子,父母均在企业里从事管理工作,从小就接触优良的教学环境。但因为父母工作比较忙,他的童年不是在游乐场的欢笑声中度过,而是在少年宫的画架前静默成长。那些静心描摹的日子,悄然铸就了他坚毅沉稳的性格。入学后,他对知识的渴求同样细腻而深邃,学业成绩始终领跑,稳如磐石。在师长们眼中,他话语不多,但目标明确,“从小就立志上清华”。
中学时,何恺明参加各种学科比赛,取得了卓越的成绩,包括全国物理竞赛一等奖、广东省化学竞赛一等奖等,并借此获取保送清华大学机械工程与自动化专业的资格。当梦想的学校就在眼前,他却做出了一个令人惊讶的选择:放弃保送机会,走入高考考场,并以900满分的成绩一举成为2003年广东省高考状元,同年进入清华大学更有挑战性的基础科学班。
大学期间,何恺明继续着自己沉稳而优秀的表现,连续3年获得清华奖学金。2007年,还未毕业的他就进入微软亚洲研究院(MSRA)实习。
从清华毕业后,何恺明开挂的人生剧本继续上演。10年时间里,他先后到香港中文大学攻读研究生,加入MSRA从事计算机视觉(CV)方面的研究,2016年加入脸书(Facebook)的人工智能实验室(FAIR)担任研究科学家。其间,何恺明先后师从孙剑、汤晓鸥等AI名家大师,取得一系列“爆炸级”成果。最为人津津乐道的是,他在10年里,以一作身份获得3次CV顶会最佳论文,声名由此远播。
何恺明在MIT授课
“三连炮”演绎AI佳话
大学期间,何恺明也像普通学生一样玩起了网络3D游戏,但他却“玩出了不一样的花儿”。游戏中那些带有雾气的场景深深吸引了他,这个看似简单的视觉效果背后究竟蕴含着怎样的奥秘?如何才能有效地去除这些雾气,让画面更加清晰?这些问题始终萦绕在何恺明脑海,并逐渐成为他研究的方向。
他的努力引起了计算机视觉领域的牛人——孙剑博士的注意,并把他引荐到微软亚洲研究院实习,这对何恺明来说是个重要的转折点。他做出了一个重要的决定,放弃自己深耕的物理和数学研究方向,转而进入形象计算研究,这对他来说是一个巨大的挑战,其间也确实遇到了许多常人难以想象的困难和波折,但他仍坚持自己的选择。
进入香港中文大学后何恺明师从AI大师级人物汤晓鸥,在恩师的指引下,他的第一篇文章发表于2009年,在这一论文里,他提出了“图像去雾算法”,一出手便摘得了IEEE国际计算机视觉与模式识别会议(CVPR)的年度最佳论文奖。这是CVPR创办25年以来首次有华人获奖,同时也是亚洲人第一次获奖。当时汤晓鸥跟何恺明开玩笑说:“你一出手就到了巅峰,从此以后你的学术生涯就只能往下走了。”没想到,何恺明在MSRA和FAIR的研究成果还能一路走高。
何恺明独立开展的第一项工作诞生于MSRA。在2015年之前,深度学习最多只能训练到20多层,但他提出的深度残差网络(ResNet),在网络的每一层引入了一个直联通道,从而解决了深度网络梯度传递的问题。在此之后,人们可以有效地训练超百层的深度学习网络。凭借相关成果,何恺明和团队在ImageNet图像识别大赛中击败了包括谷歌、英特尔等在内的全球顶尖团队,震惊了科技界。也凭借该成果,何恺明在2016年再次获得CVPR最佳论文奖。
在FAIR,何恺明首次提出一个高性能的物体检测和算法框架——Mask R-CNN,这一算法解决了图片中的实例级对象分割问题,不仅能将照片中的人、动物等对象单一检测。他把基于掩码的自编码思想用到了视觉领域的非监督学习上,一下子打开了计算机视觉领域自监督学习的大门。这一工作帮助何恺明在2017年获得了CV届另一顶会——计算机视觉国际大会(ICCV)的最佳论文奖。至此,何恺明成为世界上少有的毕业不到10年,3次以第一作者的身份获得CVPR、ICCV最佳论文的人,演绎了“三连炮”的AI佳话。
对于相关工作的意义,汤晓鸥曾评价:“何恺明把网络做深了,谷歌把网络入口拉大了,才成就了今天的大模型。”如今,相关成果的身影遍及全球,各行各业都在用,从自动驾驶到医疗诊断,从安防监控到智能家居……年纪轻轻,何恺明就被视为人工智能领域最具影响力的人物之一。
2024年,何恺明正式回归学界,加入麻省理工学院(MIT)电气工程与计算机科学系担任教职。近日,他的第一波门下弟子曝光——可以看到,4位研究者中有3位是华人,都是顶尖的青年学者。国际数学奥林匹克竞赛(IMO)、国际信息学奥林匹克竞赛(IOI)双料奥赛金牌得主、清华姚班学霸邓明扬也在列。锦上添花、未来可期。
来源: 我是科学人