~者按Q?018q?2?8日,q易智能、清华大学数据科学研I?5家评审机构共同评出的?018中国AI英雄风云榜”年度h物榜单揭晓,10位h工智能领域的从业者获奖。其中,微Y亚洲研究院副院长刘铁岩凭借多创新研I获得了(jin)本次评选的技术先锋奖?/span>

刘铁岩,1994q考入清华大学?sh)子工程p,分别?998q?000q?003q获得学士、硕士、博士学位。微软亚z研I副院长,IEEE院士、ACM杰出?x)员?018中国AI英雄风云榜技术创Ch物先锋奖获得者?/span>
“我觉得学者的宿命是ln学习(fn)。?/span>
坐在微Y大厦的办公室中,没等记者开口,一向健谈的刘铁岩直接进入畅聊状态?/span>
从“三清”学生到三次研究转型
从小在黑龙江长大Q刘铁岩LҎ(gu)事物充满好奇?j)?994q_(d)他如愿考上?jin)清华大学?sh)子工E系Q回忆v当时的情景,刘铁岩表C,清华大学是理U生梦想的地方,而电(sh)子工E系也是当时最理想的院pR?/span>
pP刘铁岩在清华大学?sh)子pd?fn)?jin)9q_(d)成ؓ(f)?jin)典型的“三清”学生(本科、硕士、博士均在清华大学就读)(j)。据刘铁岩回忆,d期间Q他做了(jin)很多关于多媒体信号处理的研究Q但加入微Y亚洲研究院之后的十几q里Q他的研I涉信息检索、机器学?fn)、博弈论到强化学?fn)等多个领域。“我们所处在的行业飞速发展,唯一不变的就是变化,逆水行舟不进则退Q只有不断学?fn)新知识、拥抱变化,才能保持学术青春。?/span>
交叉、跨界、{型是刘铁岩不断探索新领域新技术的主题?/span>
而作为学者,Ҏ(gu)知识的好奇心(j)Q是刘铁岩敢于研I一个又一个新领域的重大驱动力?/span>
刘铁岩的W一ơ研I{型在加入微Y亚洲研究院之后。据其回忆,当时多媒体信号处理领域有一个公认的问题是语义鸿沟。刘铁岩解释_(d)“我们能处理的多媒体信号Q比如图像、视频,q些本nq不是包含语义的Q但是我们希望从中得到的信息Q比如图像分c,识别、物体跟t等Q都是含有一定的语义信息的。这U底层的单信号与高层的有语义的目标之间的差别是语义鸿沟。”刘铁岩认ؓ(f)Q当时大量的多媒体领域的研究人员都在做特征工E,用以弥补语义鸿沟Q而不是关注算法和模型本nQ刘铁岩感觉自己“偏U”了(jin)?/span>
因ؓ(f)q些问题Q刘铁岩开始关注文本信息处理?004q_(d)刘铁岩与卡内基梅隆大学的文本分类领域的资׃家杨颐明教授达成合作Q他们共同搭Z(jin)当时世界上最大的、近三十万类的文本分cȝl。此后,他还开展了(jin)大量的关于文本信息检索的研究。在信息(g)索领域,刘铁岩最为出名的是引入机器学习(fn)的思想Q创Z(jin)“排序学?fn)”这一个学术流z。在2006?009q_(d)刘铁岩和他的团队在SIGIR、WWW、ICML、NIPS{顶U学术会(x)议上发表?jin)大量的关于排序学?fn)的论文,事实证明Q该研究l信息检索领域带来了(jin)重大变革?/span>
刘铁岩借由排序学习(fn)的研I对机器学习(fn)领域有了(jin)非常深刻的认识,而随着q种认识的进一步深化,也开启了(jin)其第二次研究转型?/span>
“在排序学习(fn)领域做了(jin)多年之后Q我意识C的机器学习(fn)都会(x)假设数据先于学习(fn)q程而存在的Qƈ且不受学?fn)过E的影响Q但是这个假设与我们实践中的很多情况都不一致。比如说我们做的|页搜烦(ch)、广告排序,很多数据都是Zؓ(f)产生的,当你把从q些数据中学到的模型q用到实践中Q是?x)改变h的行为的。而h的行为变?jin),数据也就变?jin)。”刘铁岩_(d)我们希望数据独立于模型而存在,但是数据?x)受到模型?jing)响,q种情况下,我们学到的机器学?fn)模型的效果可能会(x)大打折扣?/span>
Z(jin)解决q个问题Q刘铁岩和他的团队开始研I博弈论Q因为博弈论?x)考虑多个体行为的怺制约Q以?qing)机制对于智能体行?f)的长效媄(jing)响。他们将博弈论的思想用在互联|广告和云计的机制设计上,定?jin)很多研I成果,也ؓ(f)微Y的相关品{化了(jin)很多技术?/span>

q几q_(d)刘铁岩发现博弈论本n也存在一些问题,比如只能分析单的q程、主要关?j)最坏的情况{。而实际中Q我们面临的问题往往非常复杂Q而且q_情况比最坏情冉|有实际意义。ؓ(f)?jin)解册些问题,刘铁岩和团队又开始了(jin)W三ơ技术{型,把博弈的思想和基于数据的机器学习(fn)Ҏ(gu)充分l合Q通过深度学习(fn)、多体强化学?fn)等最新技术手D,来综合解决问题?/span>
刘铁岩自己ȝ_(d)“解军_有学U面临的挑战Q是刺激我去研究新方向的主要动因。”但他同时表C,d的学术{型和盲目q逐热Ҏ(gu)着天壤之别。主动{型的目的是扩大知识面、开拓学术边界、增大实践h(hun)倹{ؓ(f)此,常常需要从热点方向上{出来、去学习(fn)和研I一些目前相对小众的方向。这U{型是Z(jin)使学术实力更强大Qؓ(f)日后做出更了(jin)不v的研I打下基?/span>
“指哪打哪”研I流z与对偶学习(fn)
如果研究也有风格派的话Q刘铁岩自q研究风格ȝ为有着强烈直觉Q“指哪打哪”的研究派。他ȝZ下两个方面:(x)
W一Q研I是要去解决重要问题的,要有一个非常明的目标?/span>
W二Q解决问题的技术要有很强的逻辑链\作ؓ(f)支撑Q要有规划、有设计Q而不是误打误撞、盲目尝试?/span>
他不仅自p行着q种研究思\Q也其所能,培养C代年Mh的研I品呻Iq不断的影响和渗透。“我能够l与q轻研究员最多的不是研究的想法、写论文的套路,而是培养他们的研I品呻I也就是选择什么值得做,什么不值得做,把好钢用到刀刃上。”比如面对大安在追的风口,要保持冷?rn),听从自己内?j)的声韻I不ؓ(f)发论文而发论文Q而是要去解真正重要的问题Q发明可以推qѝ可以Ş成体pȝҎ(gu)?/span>
2017q_(d)刘铁岩同时获选IEEE Fellow以及(qing)ACM杰出?x)员Qƈ晋升微Y亚洲研究院副院长?/span>
保持好奇?j)和不断探?ch)新领域、勇于{变研I方向的?j)态,让刘铁岩永远不会(x)满于既有的技术成,相反Q他时刻都在创新与突破的路上?/span>
2018q?月,微Y宣布中英机器译pȝ辑ֈ与h工翻译媲的水^Q是首个在新L道的译质量和准率上可以比肩h工翻译的译pȝ。支撑这Ҏ(gu)果背后的重要技术之一Q便是刘铁岩和他的团队最新研发的技术——对偶学?fn)?/span>
对偶学习(fn)的生是Z(jin)要解决现有深度学?fn)方法过度依赖大量有标签训练数据的问题。据刘铁岩表qͼZ兛_(j)的绝大部分AId都是Zh服务的,但凡是需要交的dQ就?x)有一个输入和输出Q通常都会(x)存在一个对偶结构。“两个Q务,一个Q务的输入恰好是另一个Q务的输出Q反之亦然。”刘铁岩举例_(d)比如机器译Q中译英是一个Q务,p中是另外一个Q务,两个d互ؓ(f)输入和输出,形成对偶关系。再比如语音识别和语韛_成,也是一l对偶Q务?/span>

也就是说Q很多机器学?fn)Q务其实天然有l构对偶性,可以形成天然的闭环。一旦有闭环Q就有反馈信P可以有效的去训l模型,q样q只有很少的标注,也可以训l,从而解决了(jin)q度依赖数据训练的问题?/span>
除此之外Q刘铁岩q向|易介绍?jin)自己最新的研究。第一个就是Learning to TeachQ这个研I基于对现在机器学习(fn)框架局限性的反思,希望机器学?fn)的三个要素Q训l数据、目标函数、模型空间变成可以优化、学?fn)和改变的对象,从而提升训l效果?/span>

W二个是G-spacelearningQ这个研I是Z(jin)解决经|络中由于用ReLUȀzd数带来的“病态”优化问题,告诉大家经|络的权重空间存在很多冗余,在该I间中直接做优化是不好的Q应该在更加紧致的链路空间中做优化,q样可以大幅提高模型的准率?/span>

新的Z(x)
在微软亚z研I润?6q_(d)对于研究工作本nQ刘铁岩颇有感受。在他看来,自己之所以能取得如此多的成就q不断进行着新领域的研究Q主要在于微软亚z研I的开攄、积极向上的环境?/span>
“研I没有那么明的KPIQ因为它本n是多元的,更多的时候,我们是靠着自己的研I素L判断研究的h(hun)倹{?/span>
刘铁岩认为,作ؓ(f)学者,他们正在q来一波新的机?x)。随着微Y亚洲研究院成立创新汇Q刘铁岩和团队得以在金融U技、物等领域与国内龙头企业进行合作,真正AIq用到这些领域,推动其数字化、智能化转型?/span>
对于创新汇的目Q刘铁岩依然保持着强烈的好奇心(j)。在他看来,虽然拥有AI技术的人和拥有领域知识的h来自两个世界Q在合作的时候会(x)l历一个痛苦的合期,但业大q只是刚刚拉开QQ何的AI落地都不是那么简单的Q双斚w需要去?jin)解?gu)?/span>
“比如,金融?jng)场是动态的Q传l机器学?fn)领域的基本假设在这个问题上不再成立。我们只有充分了(jin)解金融市(jng)场的内在规律Q才能研I出全新的机器学?fn)模型。我们有强烈的好奇心(j)d?fn)金融领域的知识Qƈ且ؓ(f)光w定做出高效的机器学?fn)方法。过Mq的实践表明Q通过和合作伙伴的深入互动Q我们已l开发出?jin)行业领先的投资?gu)。”刘铁岩说到?/span>