许东的「AI生命科学」进化史:从90年代泡沫繁荣,到深度学习复兴

数码 0 214
数码资讯
雷锋网 数码资讯 发布于 2022年9月8日 15:30
本条新闻为单纯事实消息的时事新闻,转载自雷锋网,版权归源站所有,如有侵权,烦请联系我们

命运攸关的时刻充满戏剧性,在个人的一生及历史的进程中都是难得出现的;这种时刻可能集中在某一天、某一时,甚至常常发生在某一分钟,但它们的决定性影响超越时间。对于许东来说,这一分钟,可能在志愿填报单上、在出国的飞机上、在1995年的那一场会议上。

许东在密苏里大学哥伦比亚分校生活了二十年。

2003年,38岁的许东来到该校计算机科学系,开始了他第一份教职。这也是他近二十年来唯一一份教职。许东在这所学校安了家,做起科研,2007年成为了该校最年轻的系主任。

这所学校坐落在美国密苏里州的第四大城市哥伦比亚。因为所处土地广阔,农业发达,被称为美国中部大农村,得名“哥村”。

许东总说,自己是被这座小城留住,研究了半辈子的生物信息学。

这些年里,许东主动投入到跨学科研究风潮中,先后为蛋白质结构预测、单细胞数据分析、DNA序列、蛋白序列分析、系统生物学建模、图像文本分析、中医舌相、分子动力学模拟等,做出了每个时期好用的算法工具。

2001年,许东凭借蛋白质结构预测工具——Prospect,与好友徐鹰(现任佐治亚大学校董事会教授)共同获得《R&D》100奖。该奖项由《R&D Magazine》1963年创设,被国际科技领域誉为科技界的“创新奥斯卡奖”。

此后,许东又在2015年和2020年接连当选美国科学促进会(AAAS)会士和美国医学与生物工程院(AIMBE)会士,并成为了密苏里大学的校董事会教授。

这些高光时刻,映射了他人生中的黄金三十年。

二十五年前,他趟过生物信息学泡沫期;十五年前,他成为密大最年轻的系主任;十年前,他先于大多数人换到深度学习赛道。

在那些时刻,许东大放异彩。正如茨威格在《人类群星闪耀时》的第一章“巴尔博亚发现太平洋” 中写到:人生中最大的幸事,莫过于在富于创造力的壮年发现了自己的使命。

18岁的决定:宁选北大,不去清华

“教育是一个很特殊的行业,很难高质量地批量生产,培养一个人效率低、成才的确定性也不高。”

站在父母的高起点上,许东对这句话深有体会。

新中国成立后四五年里,许东父母考入清华,就读于电子工程系。

随后,父亲留在了本校,在工程力学系(现航天航空学院)任教,并于1981年在国家支持下赴丹麦读博,成为了中国最早出国研究流体力学的一批人。母亲则去了北京灯泡二厂、灯泡总厂担任厂长,并在八九十年代担任了十多年的北京电光源研究所所长。

这是一个标准的知识分子家庭,许东称,虽算不上大户人家,倒有机会从小接触到教授级的叔叔阿姨。

回忆起来,许东觉得那是一种无差别的人际交往,”绝想不到其中一个人就是某一领域的领军人物。”

但许东没去清华,而是选择了北大。

相比于清华的工程师气息,北大要更加自由,尤其是北大没有校训,没有校歌,甚至北大校园中的标志性湖泊,也被钱穆先生带头唤为“未名湖”。

在许东看来,这代表了北大上上下下的一种求学态度,要敢于不合群,不听话、既要批判,也要兼容,做中国维新图强的“先锋者”。

1983年,十八岁的许东走进了北大物理系。

这是在中国高校中设立的第一个物理系。许东入校时,北大物理系已经走过70年岁月,期间还诞生了四个首创学科,如我国第一个原子能人才培养基地——物理研究室、我国第一个半导体专业、我国第一个地球物理专业、我国第一个计算机系微电子专业。

而与北大颇有渊源的西南联合大学物理系,也走出了李政道、杨振宁、朱光亚、邓稼先、黄昆等一大批杰出科学家。

这是许东第一次感受到国内学科的昂扬姿态,“原来中国人在物理方面做得很好,我也跃跃欲试。”

一进大学,许东被各种“奇奇怪怪”的研究吸引住。大一上学期快要结束时,他无意中看到学生宿舍里贴着一个告示——“自然之谜研究会,研究气功、特异功能等人体科学现象”。许东对这些神奇现象特别好奇,加上告示中写到能够去北京师范学院(现首都师范大学)做研究特异功能的实验,当即报上了名。

大一寒假,许东都泡在了实验室。尽管没有研究出什么名堂,但许东却产生了非常多的奇思妙想,还写成了一份挺长的实验报告,全文论证人体特异现象的真实性和其中的问题。

1983年寒假,许东(前排左二)在北京师范学院和部分研究人员及特异功能人士合影

为此,许东还担任了一届的自然之谜研究会会长。

80年代前后,人体特异现象研究方兴未艾,时任国防科委科技委副主任的钱学森和主任张震寰两位,都是特异功能现象的支持者与参与者。

尤其是钱学森,他认为,人还没有能动地去发掘人体的潜在能力,今后应该用现代科学技术进行研究,对中医理论、气功、特异功能等,都要科学地进行研究。

那段时间,各种人体特异功能研究会成立,从科学界到医学界,一场关于人类生命现象的研究开始风靡全国。

北大加入了这场研究中,由许东所在的协会协助承办了人体特异功能的表演,钱学森到场观看。

这之后,许东对生命现象的研究热情更加高涨,他对很多同学讲到,“我跟钱学森握过手了,虽然没说过话。”

1983年钱学森成立人体特异功能研究所,与90年代的气功热

但许东没想到,到了90年代,“气功热”出现神论倾向,冒出了气功治病、灭火、拦截核武器等言论,学术研究也受此波及,被视为伪科学研究。1994年,国家下达《关于加强科学普及工作的若干意见》,一部分尝试用现代科学做出解释的科学家就此偃旗息鼓。

给许东讲授固体物理课的严守胜教授,也曾劝大家不要研究这个方向。他讲到,布赖恩·约瑟夫森三十岁出头就拿了物理学诺贝尔奖,之后专注于超自然神秘现象研究,却一生没有实质性的进展。

这也让许东决定留在北大继续做物理研究。他被保送硕士研究生,选择了固体物理方向,师从磁学研究的导师周文生教授。

在周教授的指导下,许东将研究放在了固体物理中一个基础问题——自旋玻璃。

简单来说,自旋玻璃理论研究的是物理学中的复杂系统,对于理解无序自旋相互作用系统发挥了非常重要的作用,近年来该理论框架为约束满足、组合优化、统计推断、神经网络等理论研究提供了众多启发。

但在当时,自旋玻璃更多体现在陶瓷、高温超导等应用领域,需要用到大量的实验研究,记录不同陶瓷所用的配方,测量陶瓷的属性。

许东将其描述为“工匠型”研究,每天就是烧炉子、测材料属性。他发现自己的动手能力不强,实验做得不好,还把老师的仪器弄坏了。

回忆起那段经历,许东称,“我最大的实验结论,就是我不适合做实验。”

既然实验不成功,许东也不再硬着头皮做,他开始想着兑现自己的理论天赋,经常在硕士论文中顺着几个实验结果自我发挥,写出十几张纸的理论猜想。

在导师看来,这些猜想毫无根据,多次提醒许东不需要写进毕业论文,许东就在草稿上继续写。

现在看来,尽管那些猜想称不上科研,甚至没什么价值,却在无意中锻炼了许东举一反三、触类旁通的能力。这是一种天赋,冥冥之中决定了他将终生与理论研究打交道。

1990年,许东硕士毕业后,来到美国纽约市立大学皇后学院读起了物理博士。但因为当时女朋友(现在的妻子)读研选在了UIUC,许东果断转校。次年5月,许东向西出发,跨越千里与爱人会和。

他与妻子在北大结识,妻子就读于化学系,比他小三届,两人从相恋时就约定去更远的地方,从北大到UIUC,两所学校成了二人从相识到婚姻的重要见证。

这段经历有一位见证人——许东的博士导师Klaus J. Schulten教授,也是许东一生中最重要的一位导师。

Klaus是一位理论物理学家、也是一位计算生物学家,博士师从诺贝奖获得者Martin Karplus(从学术脉络上看,现在深圳湾实验室周耀旗的博士后导师也是Martin Karplus,与许东一脉相承)。

早在1978年,Klaus就较为完整地描述了磁感应和动物迁徙的Radical Pair假说(也称为化学指南针假说),此后便投身到生物学领域。

1991年许东加入时,Klaus实验室已经非常活跃,他本人是UIUC里最抢手的导师之一。许东的导师首选是Klaus。

但进入Klaus组里,许东觉得多少沾了些运气。

UIUC有一个重要的导师双选机制,学生可以和许多导师单独见面,由学生提交5个导师的排序志愿,导师也排序选择5个和他(她)见过面的学生交到系里,由系里协调分配。

所以,这份实力和运气兼具的选择机制总会伴随意外和惊喜。

谈到被选的原因,许东猜测,或许是自己初到UIUC时一次性通过了博士资格考试,一下子让Klaus注意到了。但其他同学就没有这么幸运了,很多美国同学在这场入学考试中表现吃力,或者没有参加,两次补考也有一半的博士生没有通过考试,被降为了硕士。

时至今日,谈起选择导师时的经历,许东还深有感慨,“我们是选择了彼此,夸张点说,师生关系对职业的发展可能不亚于配偶关系。”

进了Klaus组之后,许东在校内的贝克曼研究所(Beckman Institute)做研究。

这是伊利诺伊大学里一栋专门为跨学科研究而建设的大楼,主要集中在工程和物理科学、生命和行为科学方面的研究,超越了当时众多传统大学在组织和结构方面所存在的众多内在局限性,一切服务于跨学科交流。

在那里,许东第一次同时运用起“生物、计算机、物理”三门学科的知识。

对许东来讲,最难的还是补上生物的背景。组里的同学一起成立了“学习小组”,一起读沃森等人写的《细胞分子生物学》一书,每人轮流负责主讲一章,相互交流学习笔记。只用了半年,许东连同组的同学,都补上了生物知识。

从事交叉学科研究仍不轻松。那个年代的学术界有一种说法:只有在本领域做得不好的人,或者在本领域做到了天花板,才会转向交叉学科。90年代初,生物信息学甚至不能被看作一门学科,Klaus所领导的小组对外也是自称为“理论生物物理研究组”。

许东谈到,他所认识的物理系同学中,转向生物物理的人并不多,甚至有人不理解许东的转行。但许东相信自己的选择,导师Klaus就是一颗定心丸。他也曾在父亲多年的流体力学研究中,感受过交叉学科的魅力。

对于走上生物信息学这条路,他只做出过一次解释,“就像在计算机上设计波音777飞机,可以先根据数据建立模型并预测结果,等确定设计无误,再实际建构飞机,既省力、省时,也省钱。

同样的道理,生物信息学刚刚起步,主要结合生物、计算机、统计三门学科的知识,发展计算软件,用来分析生物数据、建立模型、预测结果,从而辅助设计药物,或者改良农作物。”

这种说法遭到嘲笑,许东确实遇到了一些问题。

他研究的是当时最火的蛋白质结构的分子动力学问题,简而言之就是研究蛋白质怎么运动。由于蛋白质的生物功能与结构动力学特征紧密相关,并且其研究对象为蛋白质分子个体,所以也是一门与分子生物学互补的研究。

但在90年代初,计算机内存容量太小,用计算机模拟分子运动常常受限,算力局限导致能做的事情也不是特别多。

许东称,“当时最好的机器才一个G,学生们都要抢着用,这与现在用云平台模拟出来的效果不能相提并论。”

在那个环境下,但他与导师做的第一个工作——《光合反应中心蛋白质运动与电子转移的耦合:在自旋玻色子模型框架下研究低温行为》,发挥理论研究优势。

许东借鉴了系里另一位教授安东尼·莱格特(2003年诺贝尔物理奖得主)的自旋波色子理论,在量子力学的知识体系下做出了一个新的理论模型,细致解释了光和反应中电子在蛋白质里电子传递的现象,在领域内得到了高度认可。

直到许东毕业十几年后,Klaus还会经常提到许东的这项研究。此后,在与导师的合作中,许东接连发出了9篇论文,其中6篇发布于1995年,与当时最火的分子动力学、活细胞中超分子系统等领域相关。

回忆起那段时光,许东称,在学术上对他影响最大的人就是Klaus,在遇到Klaus之前,他的理论天赋被隐匿以来,甚至不能写在论文中,他一度质疑什么才算是真正的科研。直到遇到Klaus,许东才有种找到了科研大门的感觉。

许东至今对一个场景印象深刻:半夜两点钟,Klaus为了一篇论文把许东叫到家里改稿,尖锐的点评与详细的建议劈头盖脸般地过来,一直改到他满意为止。

“我就是在批评中成长起来的“,许东称,”世界上有一些领域可以自无师自通,但在科研上,我还没有见过谁是自学成才的,每一个真正会做科研的人,至少是被另一个科研高手口传心授、精心调教,才能入得了科研的门。”

Klaus属于那种“严父型”的教授,但他对学生却不乏真诚的关心和骄傲。在他的实验室里有一面特殊的墙,上面挂满了学生们的论文封面,一一做了装裱。

在许东的印象中,Klaus每天只睡4个小时,从不锻炼、从不养生,却能每周高效率地工作上百小时。

2016年,Klaus去世。许东回到那所实验室,对墙感叹,“或许我一生都到不了Klaus那样的高度,他完全是用生命做科研。”

葬礼那天,在西式的吊唁中,欢声笑语与掩面拭泪同步进行。Klaus在遗言中留给大家的最后一句话——“我不喜欢你们这样消沉,打起精神,还是像过去那样想起我。”

点赞 0 收藏(0)  分享
0个评论
  • 消灭零评论