自传(杂谈个人经历和职业生涯)
Click here for English version
我的好友和同事经常说我的决定毫无根据,但似乎经常奏效。这篇自传或许可以解释其中的原因。
成长
我生于1968年,在圣路易斯附近长大。 因为我源源不断地问他们问题,我亲爱的父母常常招架不住甚至感到精疲力竭。 在童年,我受到太空时代精神的感召,库布里克和克拉克的 《2001太空漫游》 让我幻想着一个充满空间探索和智能机器的未来。 我的家庭中没有人上过大学,而且几乎我身边所有人都怀疑高等教育的意义 (他们会说:“为什么你要让他们把你变成个书呆子?”或者“在上了大学后,他会失去常识。”) 这种情况下,我几乎不可能向自己想象中的未来靠近。 同时,随着我长大,太空时代也慢慢远去。
在80年代初期,我大部分空闲时间都在玩街机和雅达利 2600家用机。 当我听说街区里另一个孩子能用一台电脑“设计自己的”电子游戏时,我感到十分震惊。 我很快读了一本书,并开始定期在Kmart店里一台 TI 99/4a上练习编程。 我惊讶地发现我能让这台机器做任何我想做的事! 最终,我东拼西凑到了足够的钱,买了一台最便宜的家用电脑(TS 1000,2KB内存)。 16岁那年,我整个夏天做了很多冗杂的餐饮服务工作,最终买了一台Commodore 64。 这让我能用BASIC或者机器码写各种各样的程序,我那时最爱的还是设计各种电子游戏。 与此同时, 得益于编程这项课外活动和一些善于启发学生的老师,我逐渐建立起自己的信心,我也从一个垫底的高中生变成了擅长每一门课的顶尖学生。 这需要我完成大量的功课并有坚定的决心。 我认为这让我不太受那些有更好家庭条件的同学欢迎。
在我高中快毕业时,我还认为工程师大部分是开火车的,但是我的学业顾问指出,根据我在数学、科学和计算机上的兴趣,我应该成为一名电子或计算机工程师。 他给我讲解了一份大学报考指南,并试图说服我一所在密苏里的大学是“顶尖”的(那所学校没有列在指南的顶尖学校名录里),我没有完全听从他的话——我看到在那份单子上排名前三的学校是“麻省理工学院”,“斯坦福” 和 “伊利诺伊”。 他似乎对“伊利诺伊”一无所知,但我决定要了解那所学校。 我逐渐意识到只有另外一个世界的有钱人会读麻省理工学院和斯坦福大学,但是“伊利诺伊”离我更近,她就是由圣路易斯在密西西比河对岸的那个州命名的。 我很快意识到“伊利诺伊”就是 伊利诺伊大学香槟分校(UIUC) ,也就是小说(《2001太空漫游》)中HAL 9000主机的发源地! 那台电脑会在1992年(电影中)或者1997年(书中)建成,也就意味着我有机会为实现电影中那辉煌的未来出一份力。 我花了很多年通过能想到的各种复杂方法借钱,为了能支付州外学生接近三倍的学费。 当我终于凑够了钱,我还要以个人名义向UIUC工学院院长申请从州外转学,他们说我是过去十年唯一从州外转学成功的人。 坚持就是胜利! 之后的两年我又争取到把在之前大学的全部学分转到UIUC,最终我在1989年以顶尖的成绩从电子与计算机工程专业毕业。
我选择把这部分也加入自传,是为了解释自己为何非常理解那些因为身处弱势群体而挣扎痛苦的人。 我曾经因为来自一个相对贫穷的工薪阶层家庭而感到弱势。 我做一些展示自己才智的事总会招致欺凌。 当我成功时,我能感觉到人们对我的蔑视,因为我可能比他们做得更好。 但如果通过我的说话方式、穿着方式等来评判,我应该很容易落入下风。 我不在意竞争;我只是想保证自己能身处一个可以和智慧、思想开放的人一起学习工作的环境。 我很确定那些因为种族、性别认同、身体残疾、外国人身份等问题遇到不公平待遇的人会感到更加痛苦,他们会遇到更多的困难。 我不得不学习如何适应更高社会阶层的说话和做事方式,但直到今天我依然受到 冒名顶替综合征 的困扰。 如果你理解我所说的,请心怀同情并帮助其他人(不只是和你同类的人)!
在UIUC的研究生生活
一个学士学位远远不够满足我的好奇心。我学得越多,就意识到还有更多知识需要学习。 在1989年,我很高兴被当时在美国排名第二或者第三的UIUC的电力工程博士项目录取了。 Beckman学院 是一栋闪闪发光的新建筑,在我看来,这个学院似乎是专门为设计HAL 9000计算机成立的。 我在第一年学习了人工智能的各个方面,但很快就大失所望。 人工智能似乎很依赖于软件(这是我喜欢的),但缺少数学和物理的基础。 那是在1990年,大部分的人工智能研究人员甚至还没有接受概率论,更不要说有趣的工程问题比如随机性系统和控制理论。 在第一年后,我选择了一位富有启发性的新教授, Seth Hutchinson ,作为我的PhD导师,然后我就开始在Beckman学院工作了! 我告诉他我想研究不确定型决策问题,然后我之后几年都在研究底层的机器视觉问题。 我深入地研究了随机性方法,贝叶斯分析,蒙特卡洛方法,甚至还有实分析。 我最终有了足够的自由选择我想上的课,特别投入地学习为博士生开设的纯数学课,包括代数,拓扑学,微分几何和分析。 这些课让我在思维方式上受益良多。 我的硕士工作产出了三篇期刊论文, CVIU 95, PAMI 95,和 TIP 97, 同时我受到了当时学术先驱们友善的关注和积极的评价,他们包括Ruzena Bajcsy,Azriel Rosenfeld和David Mumford。 这让我的冒名顶替综合征有所缓解!
当我提出想更换研究方向时,我的博士生导师被吓到了。 我和他说自己认为计算机视觉中研究的问题不够优美,更想研究机器人运动规划问题 (我提出这个请求也有他的责任,因为他受到Jean-Claude Latombe 新书 的影响也对机器人运动规划问题产生了兴趣)。 这个领域中的问题可以被清晰准确地定义,而且在运动规划问题中(机器人和障碍物)有电子游戏里一样的几何形状,让我回想起自己少年时的编程经历。 直到我阅读 Basar和Olsder关于动态博弈论的书 时,我才终于意识到该如何把我关心的问题统一起来:几何,动力学系统和控制,以及不确定型决策问题。 我总是很好奇该如何准确地建立不同学科间的联系。 我特别喜欢信息空间这个概念,这在之后成为了我大部分工作的中心。 这个概念在顺序博弈论中被发展,之后主要被von Neumann和Morgentern研究(在Shannon的信息论之前!)。 这篇在Algorithmica上发表的 论文 解释了统一看待这些概念的视角。
我非常想研究能解决更一般化运动规划问题的计算方法,不仅仅是避开障碍物,也能处理其他挑战, 比如最优性,微分约束(控制系统模型),预测中的不确定性,以及传感器的不确定性。 我长时间在工学院图书馆阅读思考,终于发现了基于Richard Bellman的动态规划思想(研究运动规划问题)的正确方法, 在那时动态规划对于计算机科学家(一种分而治之的算法策略)和电力工程师(一种约束最优解的微分方程)还没有什么不同。 我成功地把Larson和Casti在60年代提出的数值解法从一维推广到多维运动规划问题中。 沿着这个方向进行研究,我做出了自己 博士论文 中的三项主要工作: 1)通过把Dijkstra算法推广到偏序集实现对多机器人系统的Pareto-最优规划 [TRA 98], 2)有传感器不确定性时的最优反馈规划 [IJRR 98], 3)有随机性预测不确定性时对混合系统的最优反馈规划 [IJRR 97]。
一件我研究生时的趣事是,我之所以从研究人工智能转为研究机器人,是因为我想学习并使用更多的数学,特别是实变量类型的。 尽管我在毕业论文中的的大部分工作,使用了被现在人工智能科研人员广泛接受的方法。 比如说,强化学习主要是数值动态规划(价值迭代,最优控制理论)。 但是,在我提出这种思考算法机器人的方式时,计算机科学家对微分方程还不感兴趣。 很多时候你可能会有正确的想法,但是要等待一个科研圈里的人慢慢地接受它,除非这已经是主流(但我发现沿着主流做研究比较无聊)。 我很想统一有着不同(学术)背景的人的思考方式,这个想法最终在我的 《规划算法》 这本书中得以施展。 我总感觉我的背景是“错误的”并需要弥补知识的不足,一旦我在多学科的知识中找到了答案、弥补了不足,我就想将打破学科界限来分享洞见。
在斯坦福任博士后
当我1995年从UIUC获得博士学位时,我有近20篇发表的文章(在当时很多了),大部分都发表在高质量刊物上。 我申请了近60所学校的助理教授职位,但没有收到一个面试邀请。 机器人学在当时不受关注,我选择这个方向主要是为了探索新知识而不是为了有好的就业机会或者出名。 我的冒名顶替综合征让我不敢自信地与人交流,我也没有能建立一个社交圈。 幸运的是,我不同寻常的工作受到了斯坦福Jean-Claude Latombe教授的认可,就是那位在我的领域“写了书”的人,然后他邀请我去他的团队工作。 因此,我唯一的就业机会就是去斯坦福做博士后,在运动规划领域最富盛名的团队工作。 已经很好了!
在斯坦福计算机科学系的科研经历让我探索了新的研究方向。 我从和Leo Guibas教授的合作中了解了计算几何学,从和Rajeev Motwani教授的合作中了解了随机性算法。 我的科研经费主要来自于一个DARPA项目的最后阶段,我在这个项目中让一个移动机器人用相机识别并跟踪另一个移动机器人。 我在这个项目中发表了一些关于 保持可视性 和 基于可视性的追-逃问题 的文章(后者来自于思考当机器人的照相机不可避免地失去追踪目标时该怎么做)。 有一次我们需要为Bill Gates做演示,那时以他命名的斯坦福建筑刚刚揭幕,但那次演示在我眼前失败了。 那是因为机器视觉部分凌晨三点还在正常工作,而当加利福尼亚州明亮的日光射入窗户时,那个系统已经无法工作。 在斯坦福工作的最后一年,我被安排到一个由辉瑞出资研究药物设计的项目。 我们设计的软件被用来从候选药物配体中寻找满足药效团约束的低能量构象 (参见 RECOMB 99 和 JCC 00 )。 我之后无从知道他们是否用那个软件发现了任何新药!
艾奥瓦州和RRT算法
在斯坦福完成博士后之后,我申请了近80所学校的助理教授职位,这次我只收到了一个学校的面试邀请:艾奥瓦州立大学。 谢天谢地,我得到了那份工作并有机会在那里做出了自己最重要的一些科研成果。 除了继续研究追-逃问题( TRA 01 和 IJCGA 02 ),我主要的兴趣在于设计一个能在有微分约束的高维空间(高于三维的空间)中有效解决运动规划问题的算法。 我还是感觉算法机器人学家(侧重于计算机科学的科研人员)把连接无障碍物的高维空间中两个位形这件事想得太简单了(比如说,PRM算法), 但是了解控制工程学的人都知道这是个很难的两点边值问题。 我从1994年起就认为一定有一个简单、高效的方式来生成某种填充空间的搜索树。 我几乎可以在我的脑海中看到那个方法,但一直没能找到一个简洁的算法来契合我心中的图景。 最终,当我在1998年六月开车闲逛时,我意识到树应该在空间拉力下自然生长,而不是用某种启发式估计去选择生长点。 我想象着在整个空间中随机采样的点就像在嘲弄那棵树,说着“朝我走来啊”。 自然而然的,我们选择搜索树上与随机选取的位形距离最近的位形,从最近的位形向随机位形延伸。 我激动地花了一个晚上的时间去实现了这个算法,在午夜,我已经能看到它生成出美丽的随机分形图。 我很快将这个算法命名为 RRT ,全称是快速搜索随机树(这个名字受到了快速混合马尔可夫链的启发)。 我很快联系到了我的好友James Kuffner,他那时还是斯坦福大学的一名学生,我们之前试图合作开发运动规划算法但是没有取得成功。 没过几个月的时间,在创意和实践交替进行后,我们很快写成了这篇激动人心的 ICRA 99论文 。在经典测试问题上,论文中非常高效的双向规划方法比同时期有竞争力的方法在速度上要快了几个数量级。 为了提高我们工作的影响力,我创建了这个RRT页面和 Motion Strategy Library (运动策略算法库,第一个开源的运动规划算法库)。 RRT算法至今也是我被引用次数最多,在科研领域最有影响力的贡献。
在2019年,James和我甚至收到了由IEEE ICRA会议颁发的第一个里程碑奖,以表彰我们那篇论文被选为1997年到2001年ICRA上最有影响力的论文。 RRTs被拓展并应用到了成千上万的问题中;渐进最优的RRT*可能是最有影响力的一个推广,这个算法由Sertac Karaman在他的博士毕业论文中提出(他于2012年从MIT毕业)。 有趣的是,我最初两篇关于RRT的论文被拒稿了,甚至有一篇是一个简短的技术性摘要,而且获奖的ICRA论文只是勉强被接受(远远不够那时的最佳论文标准)。 我提到这件事是希望其他人不要因为几次拒稿或者同行们不感兴趣就放弃自己的研究!
返回UIUC
在提出RRT算法后,我的学术贡献让我受到了顶尖大学的青睐。 我在UIUC的好友邀请我申请那里的教职,之后我获得了返回我博士毕业学校教书的机会,事实上这在大部分美国学校是被禁止的。 我从2001年到2018年在UIUC任教,我非常幸运地和很多才华横溢的学生与同事一起工作。 到UIUC展开科研后,我首先开始怀疑随机性运动规划的理论基础, 在那时运动规划领域里的人都认为随机取样是避免高维度灾难的关键。 在我学习准蒙特卡洛法的相关文献后(参见 这本数学教材 ),我开始相信这种观点并不正确(参见 IJRR 04 )。 事实上在低维空间中,决定性取样法比随机取样有优势,同时这两者在高维情况下的性能是差不多的。 在问题有解的情况下,决定性算法有一定会发现一个解的优势(在使用恰当规划算法的前提下)。 随机性唯一的优势似乎是可以让新手避免犯严重的错误。 这对于RRT类算法也有深刻的意义,之后我们试图设计没有随机性的RRT类算法(参见 ICRA 04 和 ICRA 11 )。 当我意识到随机性采样对于运动规划并不重要时,我建议使用基于采样的运动规划定义这类算法,这个定义现在已经被广泛使用了。
在2004年,我一整年都在学术休假,其中一半时间我在波兰的波兹南居住。 我写了 这本1000页的书 ,其中统一描述了各种形式的规划方法,涉及了人工智能、机器人、博弈论以及控制理论中的问题。 在那段时间,我大脑的思维能力似乎到达了最佳状态。 我可以非常清楚地看到各种技术性的问题。 在此之后,下一个重大挑战近在眼前了:如何精简机器人(对环境、自身的)表示来自动地完成特定任务? 换句话说,我们是否可以用最少量的传感器数据并设计更简单的传感器融合方法,以更低的数据要求,来成功解决导航、搜索、操控和巡逻之类的问题?
我向DARPAR申请到八百万美元来启动一个叫做SToMP的科研项目。我与数学家Robert Ghrist共同领导这个项目。 这个项目专注于研究机器人系统的基础性问题,很大程度上基于信息空间这个概念。 我在研究生阶段就学到了信息空间的定义,之后我在遇到不同问题(比如追-逃问题)都有针对性地对这个概念进行完善。 我们组建了一个超过10人由纯数学家和机器人学家共同组成的团队来解决这些困难的问题。 在SToMP项目中,以及之后一个耗资六百万美元被称为“简约信息空间中的推理”的ONR MURI项目中,我们产出了 很多新成果 ,和当时机器人上常用的传感器融合以及SLAM方法相比,我们大大减少了机器人用于进行决策的所需要的感知信息。 我们遇到的主要困难在于寻找一类被称为虚拟传感器的有用的数学模型,这类模型有很多可能的物理实现。 在这之后,我们研究的问题就自然地被转化到了信息空间(I-space),这和经典力学与运动规划中的位形空间(C-space)类似。
在意识到只有最少量传感信息的机器人没有足够的信息推测自己的状态后, 我开始用技巧引导一些简单的机器人让他们解决自己规划问题,但大部分机器人的运动结果并不稳定。 这个方法受到了 动态台球 的启发,也可以被认为是一种允许多种碰撞规则的推广。 这个想法是,很多简单的运动规则组合起来可能会形成对整个位形空间的全覆盖,甚至有遍历性。 机器人可以在实际或虚拟的边界发生碰撞,这些边界由传感器和地标生成。 这让少量的感知与控制能够对系统产生巨大影响:参见这个 关于野生机器人的页面。
深入工业界:Oculus VR和华为
大约2012年,我开始感觉机器人领域的研究人员逐渐对基础研究失去了兴趣,很多人开始强调所有工作应该有实验依据并且有应用价值。 因为我自己的背景,我对所有研究方向都保持尊重和支持,所以这个趋势让我有些沮丧。 但从另一个角度看,我想一个人如果想做很实用的东西,为什么不在工业界做出一个产品呢? 不然,我找不到在学术界继续工作的价值。 所以,我试了一把……
在2012年九月,我突然收到了Jack McCauley的一封邮件,他来自于两个月前由一名19岁少年Palmer Luckey成立的虚拟现实公司。 Oculus VR刚刚取得一项Kickstarter活动的成功,他们急需让Oculus Rift的头部追踪部分正常工作。 Jack在谷歌上搜索“四元数”和“欧拉角”时找到了我 《规划算法》 那本书。 我本打算让他们去找一些和工业界合作更紧密的同事,但是考虑到我家的财务状况,包括我的孩子们之后的大学学费,退休后的储蓄准备,以及不断增加的医疗费用。 我天真地认为一个成功的创业公司可以解决这些困难。 没过太久,我就成为了他们的首席科学家,我主要为消费级虚拟现实开发了有专利的动作追踪技术,同时带领了一个由知觉心理学家组成的团队来提供有理论支持的方法, 以解决虚拟现实中的校准、健康和安全问题,并设计舒适的用户体验。 在2014年三月,Facebook同意以30亿美元收购了这家公司。 我感觉自己在工业界的第一次经历就很幸运了! 完整的故事在 这本Blake Harris的书 中有详细描述。
Oculus空前的成功让我开阔了眼界,我认识了许多之前没有机会接触的人,包括CEO,风险投资家,连续创业家,亿万富翁,政治家,以及好莱坞的人。 于此同时,我返回UIUC继续我的终身教职。 我对消费级虚拟现实技术的革命感到无比激动,之后我开设了一门新课程,并基于那门课写了 这本关于虚拟现实的书。 其中最重要的经验是,要在工程上实现虚拟现实技术并设计用户体验,理解人的感知习惯和生理习惯至关重要。 因此,这门课和这本书提供了一个统一描述这些概念的独特方法。 2015年访问IIT Madras时我在那里讲授了这门课,这个版本的课程由NPTEL录制可以 在线上免费地观看。
在2016年,华为邀请我担任他们VR/AR/MR消费级产品的首席科学家和副总裁。 我提出在UIUC的科研公园建设一个巨大的研究中心,那将需要伊利诺伊大学和华为的共同努力。 双方都很高兴,在一年的准备后,我 加入了华为 并保留了在UIUC的兼职职位。 和很多的美国大学一样,UIUC最近几年录取了数千名中国学生,他们要交高昂的学费(大概是为了应对不断增加的支出和短缺的税收支持)。 这些学生在知道我主导这一项目后欣喜激动,他们认为这个项目将有机会缓和中美之间的隔阂。 很遗憾的是这个项目在2017年因为民族主义的抬头以失败告终,在中美贸易战中,华为被加入了美方的 实体清单。 尽管如此,我从华为的工作经历中收获颇多,我学到了很多开发消费级产品的经验。 我认识了很多努力工作、善良、并且很有趣的人,同时我也十分享受深圳、上海和杭州的文化。
在这些工业界的经历后,我感受到学术界和商业界之间令人震惊的不同。 我更享受大学的环境,在那里我可以自由地学习、发展、并和任何我认识的人分享知识。 而在工业界,信息是受保护的,由此演化出复杂的谋略,人们基于不对称的信息进行竞争。 如果你喜欢分享自己的知识和体会,并且通常帮助别人完成他们的项目,那么你会发现自己很难适应工业界。 我也发现 Dunning-Kruger效应 在工业界造成了严重的问题,特别是那些控制下属和公司方向的掌权者,他们有时候不知道自己的无知。 学术界和工业界都有重要的作用,但我感觉大学的研究环境最让我开心。 我很幸运能够在两个领域都达到很高的层次。
移居芬兰
当教授的一种“职业风险”就是会接触到各种国家、文化和来自世界各地的人。 我很幸运地走访了数十个国家,经常被当地的同行接待。 这让我思考如果自己在另一个地方长大,人生经历会有何不同。 我被波兰吸引,因为我的家族来自于那里,之后我对北欧国家产生了兴趣。 2007年,在Vaasa大学教授了一门短期课程后,我深深地喜欢上了芬兰;我收到了Pekka Isto的邀请,他是一位芬兰的运动规划专家。
在2012-2013年间,我带家人到Oulu利用学术休假写书,同时也是为了进一步了解芬兰。 在那里居住了九个月之后,我们深深地喜欢上了芬兰的文化和生活习惯。 芬兰似乎很适合我的性格。 在这里,人与人之间相互尊重,人民互相合作,共同建立一个安全、负责、公平的社会。 他们强调谦逊和尊重文化差异。 教育事业与教育工作者受到了极高的尊重。 我想这对我的孩子来说是个极好的成长环境,这里有安全、好玩同时富有教益的基础设施。 这里的公民可以享受免费的医疗和教育(私立大学甚至是违法的)。 从我的职业角度看,这里对于开发高新技术很有兴趣,同时对自然、环境和社会福利有深切关心。 这是我赞同的价值观,也是希望家人接受的。 2018年,我受邀成为了Oulu大学的一名教授,没有什么比这更让我高兴了。 我现在是 感知工程课题组 的领导人之一,这个课题组关注解决虚拟现实、机器人和远程呈现中的问题。 大学给我制作了一段 友好的视频, 同时一家 芬兰报纸 详细介绍了我移居Oulu的原因。 我也参与帮助建设芬兰的工业生态系统,尤其是虚拟现实和其它相关方向(VR,AR,MR,XR,……)。
我期待之后更多的冒险,去发现新知!
翻译:姚少雄
审校:何美瑄,蔡明芝,余京津教授