近年来读过最好的自传。看完译后记后突然明白了为什么阅读过程中完全没有反感,如果整本书都像译后记一样在不停的罗列头衔,阅读体验能好到哪里去。
01 如坐针毡的华盛顿之行
我写道,人工智能对世界的真正影响,将在很大程度上取决于推动这项技术发展的动机 —— 在人脸识别功能和定向广告投放不断发展的时代,这一观点挑战了现有认知。我认为,如果我们能够进一步拓宽对人工智能设想的边界,明确提出人工智能需要“对人类和社区产生积极影响”的要求,如果我们对成功的定义可以包含类似提法,我相信人工智能可以让世界变得更加美好。时至今日,我对这一点依然深信不疑。
看完全书后,再看这段发现即使在提到“伦理框架”和“以人为本的人工智能”时也没提到过[[阿西莫夫]]的[[机器人三定律]],虽然全书没怎么涉及到机器人,但还有有些奇怪。
02 逐梦之旅
从侧面解释了为什么做出伟大贡献的都是华裔。
父亲带我出去玩,不是为了交给我什么东西 —— 他喜欢大自然,但并不是专家 —— 可这种经历却在我心中播下了哲学的种子,成为了塑造我人生的最大力量:我对探索自己视野以外的事物产生了永不满足的渴望。
偏见往往会缓慢而无声地吞噬一个人,母亲的困境亦是如此。没有人以暴力或监禁之名威胁她,没有阴谋,没有丑闻。有的只是老师和教务人员话里话外的消极打击,即使在她成绩最好的时候,也礼貌而坚定地阻止她报考最好的学校。他们对她的否定和冷落如影随形,令人窒息,让她的少年和青年时代笼罩了颓废的阴霾,也加重了外公的愤懑之情,给她平添了上一代人的重担。曾经意气风发、充满活力的她变得麻木,好奇心也被推向了与父亲相反的极端:她跟父亲一样充满探索欲,却缺少了天真烂漫,变得尖锐犀利,令人生畏。成年后的她非常好看,颧骨饱满,眼睛会说话,但在美丽的外表之下,是一股天生的叛逆,注定了她将永远对约束或礼仪规范嗤之以鼻。
彼时的我还无法理解母亲渴望逃离的原因,但我读的书越多,就越像她一样,热爱现实世界之外的幻想国度。每当读完一本书,那些故事就会在我的脑海中久久萦绕,仿佛是另一个现实世界在与我所处的世界相抗衡。无论是在步行上学的路上、骑车去公园的途中,还是去小卖部买东西的时候,我眼中看到的生活日常都与脑中遥远的景象交织在一起:狄更斯笔下英国的鹅卵石街道,海明威书中波涛汹涌的大海,大仲马描写的欧洲海岸的浪漫冒险。这些故事色彩斑斓,让我觉得自己与众不同,仿佛是母亲为我拉开了神秘的帷幕,向我展示了我从未想象过的可能性。
她对当时普遍的育儿目标进行了微调,并引以为傲:我当然要努力学习,充分发挥自己的潜力,但这么做并不是为了取悦任何人,或者得到任何东西。虽然她从来没有明确表达过,但我能感觉到,她认为“模范学生”和“好居民”等提法带有居高临下的评判色彩。她教导我,我的努力不是为了让老师满意,也不是为了符合某种意识形态,甚至不是为了迎合某种虚无缥缈的规则。我的努力只是为了自己。
的确是这样,对小朋友来讲越早领悟到这点越好。
他们并不认同他们这代人中盛行的重男轻女的观念,而是跟父母一样,鼓励我展开想象,并坚守原则:我首先是个独立的个体,其次才是个女孩。跟母亲一样,他们给我买了很多书,涵盖海洋生物、机器人和中国神话等各类广泛的主题。
又过了一会儿,种种疑问被另一种感觉所替代,它沉重而强烈,从我体内不知何处升腾而起。这种感觉不是气馁,甚至不是感到被冒犯,而是愤怒。这是我不熟悉的愤怒之感—是一股悄然而炽烈的怒火,一种我从母亲身上见过的愤慨,但它无疑是属于我自己的。
老师的话虽然让我震惊,但并没有让我气馁。相反,这些话强化了我成长过程中形成的理念:无论周围有什么障碍,都要奋力超越现实,构想出更加广阔的未来。现在我不仅想看得更远,还想走得更远。如果说数学和科学这类领域是属于男生的游戏,那又怎样,学习毕竟不是球赛,他们无法阻止我在这里上场参赛,我暗下决心,一定要赢。
反常的是,我越为他的离去感到悲伤,就越发意识到,我所怀念的关于他的种种情景,正是物理学想要教给我的东西。父亲天生就能从光、速度、扭矩、力、重量和张力的角度来看待世界。他即兴制作齿轮和滑轮装置,解决了家里的各种难题;他通过万用表和焊接工具来利用电力。物理学一直是父亲思维的隐性基础,然而直到现在,在我最想念他的时候,我才豁然领悟。
在初二结束时,我意识到,物理学已经不仅仅是我在青春期为填补父亲缺席而做出的努力。我爱物理学,就像父母爱着他们从我幼年时期就跟我分享的追求一样,这份爱简单而纯粹。父母向我展示了世界上还有更多可能性,他们给了我冒险、故事和想象力。这些曾经定义了我的生活。但在此之前,我只是个旁观者而已。物理学则是我第一次自己发现的东西,感觉很不一样。这一次,我可以追逐了。
03 鸿沟渐窄
费根鲍姆的创新开启了后来被称为“[[知识工程]]”(knowledge engineering)的全新子领域。在这个子领城中,有关特定领域(医学、制药、金融或儿乎其他任何领域)的事实被整理成数据库。机器可以读取相关数据,像威诸格拉德的几何形状一样进行分析,并以自然流畅的书面向答形式提供答案,实现了媲美咨询人类专家的自动化体验。
知识工程在维基百科上居然没有中文页面。
此前的几代人试图用规则详尽描述智能,算法相对僵化,这种人工智能通常被称为“[[符号人工智能]]”(symbolic AI); 20世纪80年代末到90年代初,潮流开始转向更自然的方法。 杨立昆的成果就预示着一个大胆的未来。随着时间的推移,行业研究重点从“通过明确编程来解读问题”转变为“从示例中发现模式”。换言之,算法不是被告知该做什么,而是去学习该做什么。研究人员给它起了一个贴切的名字:“[[机器学习]]”(machine leamning)
直到有一天,经理直截了当地告诉我看书是在浪费时间,还不如利用这个时间去打扫卫生间。回想起来,我觉得同为移民的他绝不是在居高临下地对我指手画脚,只是这件事再次提醒我,对我们这样的人来说,想象力在新生活里是多余的。这实在令人沮丧。
科学史往往是曲折、讽刺而又残酷的。新的思想被发现,然后被丢弃,接着又有新的思想被发现。被几代人视为基石的范式有时会在一夜之间被推翻,而推翻这一切的常常是显而易见的观察结果。恰恰因这些观察太过简单,反而更容易被领域内最杰出的人物所忽视,从而为局外人发起革命创造了条件。正是这种既和谐又冲突的摇摆节奏,才使得科学追求如此戏剧化。
这是父亲真正的天赋所在 —— 不是工程学,不是相机修理,甚至不是文字游戏,而是在任何情况下,哪怕再平淡无奇,都可以发现幸福和快乐。因观念的不同,我们飞越半个地球,来到陌生的国度,深陷贫困,每天都在为生存苦苦挣扎。但从父亲身上看不出这些。他正在专注地研究别人家的滑雪镜或咖啡机,他的满足感如此纯粹,让我也感同身受,几乎忘却了尘世间的烦恼。
我想起了上海的浦江饭店,想起了登机前那一闪而过的乐观情绪(踏上飞机的那一刻,我和自己关心的人和事已有千里之隔)。也许我是对的。也许这一直是一个好兆头,只是被推迟了。我从小就有的好奇心可能只是被新环境吓到了,但它并没有消失。 我又重新找到了追逐的目标。
他似乎完全没有想到。他靠在椅子后背上,惊讶又欣喜地呵呵笑着。这是第一次有美国人没有把我仅仅视为一个说中文的移民。于是,我们聊的话题越来越广泛,也越来越不拘谨。他不再关注我的国籍、我在语言上的挣扎,甚至我作为学生的潜力,而是看到了一个孩子 —— 孑然一身,挣扎着融入新的环境,但又渴望表达自己。
母亲一直激励着我,但她对数学和物理学没兴趣,我没办法跟她分享。随着她的健康状况越来越差,我们的母女关系变得更加复杂。父亲是第一个鼓励我对自然世界保持好奇的人,也是我学习物理学的启蒙老师,他是我心里最亲的人,但我不得不承认,我早已不再以他为榜样了。在很多方面,萨贝拉先生都提供了我跟父母关系中缺失的那块拼图。他在我身上看到了别人未曾察觉的东西,发现了我自己都没有意识到的潜力,而且,他拥有专业知识和能力,可以帮助我发掘这种潜力。
时隔数年,我才真正完全理解这一刻的重要意义,我父母也是一样。虽然母亲在听到这个消息后表现得非常冷静,但我知道这件事对她意味着什么。她生命中的每一个里程碑都在提醒她,她站在了那些无法弥合的鸿沟的错误一边。几十年来,她已经习惯了假装自信,但我知道,她从来真正感受到自信。现在,也许是有生以来第一次,她终子有理由相信这个故事可能没有如此简单。她已经押上了所有,至此才有了一种真正如释重负的感觉,而这种感觉我永远无法完全感同身受。
04 心智探索
“请大象深呼吸,让这张图片荡涤你的心灵。”他措辞严谨,语调轻柔,“那些微小的光点不是恒星,甚至不是恒星系统。它们是整个星系,成千上万的星系,其规模之大,非我们渺小的大脑所能理解。但借助哈勃望远镜这样的工具,人类终于第一次瞥见了宇宙之宏大。我之所以在最后一堂课给大家看这张照片,就是希望你们能够永远铭记这种感受,永远保持好奇心和勇气,永远愿意追问那些看似不可能的问题。‘哈勃深场’的镜面曝光,让我们看到了答案有多么美妙。”
最让我振奋的是,我看到了多年来未曾见到的东西:父母变得自信、自在了。他们不是在疲于应对,也不是在挣扎生存,而是真的有所作为。他们成了社会的一分子,每天都在以自己的方式做出贡献。我看到了他们的创造力和聪明才智,以及对勤奋工作的渴望(至少从母亲身上看到了)。
笑中带泪。
最终,即使我进入了这个令人向往的地方,也无法改变一个事实:我来自一个同龄人难以理解的世界。当然,我也同样难以理解他们的世界。
我甚至养成了每周五参加高等研究院员工下午茶的习惯。虽然我跟高等研究院没什么关系,但这个下午茶活动并不是严格意义上的闭门研讨会。有时,我会遇到一些研究生,可以一起讨论学业。但我真正渴望的是一种真切的置身其中的感觉,能够在伟大的思想中漫游(正是这些思想让这里成为科学家们向往的传奇之地),哪怕只是偶尔亲耳聆听他们谈话的片段。有时,当人群散开时,我会在无意间瞥见约翰•惠勒(JobnWheeler)这样的物理学先驱,或者爱德华•威滕(EdwardWitten)这样的前沿弦理论研究者。这是我梦寐以求的时刻。让我感到更加不真实的是,此刻的场景是那么平淡无奇:各个领域的巨匠们绕着楼梯闲庭信步,摆弄茶歇点心时伸手拿餐巾,闲聊时不时地点头。巨匠们就存在于和我的生活一样平凡的生活之中。
我的阅读清单越来越五花八门,无所不包。我沉浸在侯世达(Douglas Richard Hofstadier)所写的《[[哥德尔、艾舍尔、巴赫:集异壁之大成]]》中,也被罗杰•彭罗斯(Roger Penrose)的《皇帝新脑》的广度和深度所吸引。就这两本书而言,挑战我的不仅仅是其思想之精辟、智慧之高深,还有它们之间丰富的联系。它们挖掘了人类上千年来对理解心智的渴望,实际上,是对理解智慧本身的渴望,比我以前所接触的抽象领域更深人,同时又保持了明确无误的人文主义主线。这些书真正体现了科学的美德是严格细致、以假设为导向,但又不失浪漫和敬畏。事实上,对我这样的读者来说,他们严谨的方法极大地增强了我的惊叹之情。
虽然实验只持续了一个暑假,但再次回到普林斯顿大学,我已脱胎换骨。物理学是我最初的痴迷,但我开始意识到,物理学的魅力并不在于方程式,甚至也不在于概念,而在于对其象征意义的追逐和探索。我现在清楚地知道,我热爱研究,我能感觉到那种激情。每当我打开螺旋装订的笔记本记下想法时,每当我听到记号笔修改方程式发出的吱吱声时,每当我启动实验室的计算机进行运算、风扇呼呼作响时,一种新发现的热情就会涌上心头。
比起普林斯顿大学,伯克利更能代表父母来到这个国家所追求的东西:自由地认清自己的激情,毫不妥协、无怨无悔地活出激情。无论未来是什么样的,那些在实验室里一边倾听一边心跳加速的时刻已经是够让我确信,他们做出了正确的抉择。
05 第一道光
他们自由奔放,总会毫不迟疑地就复杂的话题提出探索性的问题,仿佛只需聊上几句,就能解开生命中最深奥的谜题。尤其是克里斯托夫,他经常沉浸在自己的思考中难以自拔,即使我们两个人在交谈,他似乎也更喜欢在自言自语中探索这些问题。但他的专注并不是因为冷漠,而是源于天真,就像一个被白日梦弄得神魂颠倒的孩子。看到他这个样子,我就会想到常常心不在焉的父亲,觉得特别可爱。
我们对影像的感知包括由边缘和纹理形成的一团团的色块,我们会下意识地解读这些色块,这是一种纯粹的感知体验。而在我们有意识地处理所看到的东西之前,有多少次是下意识地看到了图像?研究人员很快就发现两者不可分割:看到即理解,因此科学挑战既存在于感官层面,又存在于智力层面。所以,视觉不仅仅是我们对智力的应用,实际上,它就是智力的同义词
在黑暗实验室的时刻改变了我的一生,当时那些噼里啪啦的声音让我第一次瞥见了其他生物大脑的内部运作机制。如今已经过去了两年。两年的追求才刚刚开始。我对工程学这门充满挑战性的艺术很感兴趣,但我不想成为单纯的工程师。尽管我被神经科学的奥秘所吸引,但我也不想成为纯粹的神经科学家。我想不受约束,对两者兼面用之。
06 北极星
除了有机会沉浸在自己心仪的视觉研究领域,我并不知道自己想从研究生阶段获得什么,但我希望在此期间找到可以全力追求的目标。我会像自己的榜样那样全情投人,就像埃里克•维斯乔斯把对果蝇异常现象的痴迷转化成了诺贝尔奖,或者尼尔•德格拉西•泰森把字宙变成了数字诗歌。我想要一颗属于自己的北极星。但在找到北极星之前,我只想围绕一个问题展开思考,那就是不可言喻的视觉体验究竟是如何实现的,用《视觉科学》那本教科书生动的副标题来说就是,光子是如何成为现象学的。
这个例子彰显了科学界最伟大的传统:虽然既定的观念符合直觉,广为人知,却能被更加错综复杂的现实打破。
我想到了我的榜样们,从物理学的传奇人物到我的教授。多年来,我一直崇敬激励他们成科学家的思想力量,也敬仰他们在各自领域产生的激励效应。现在,我接受研究生教育不过短短几年时间,但我相信我在自己的视野看到了一丝微光,虽然遥远而朦胧,但足以照亮我前进的道路。无论采取何种方法,我们将要让机器熟悉视觉世界。我本身就比较执着,但这次的痴迷程度是前所未有的。 我找到了属于自己的北极星。
我们选择的机器学习算法的数学核心是“贝叶斯网络”(Bayesian network),这是一种概率技术。接二连三的问题都是有关这种技术的,但没有一个人问及我们训练算法时所用的数据。数据被公然视为一种惰性商品,只在算法需要时才重要,虽然这种观点并不稀奇,但我开始意识到,有一些重要的东西一直都被低估了。
这可能是我第一次有机会在学术世界之外以一个完全成熟的个体身份展示自己,我充满了平日里没有的信念。当然,我是个不折不扣的书呆子,但这只是我的一面而已:多年的奋斗锻炼了我,让我拥有其他候选人从未有过的拼搏精神,以及一种实用主义本能(我现在才意识到,这种务实使我与众不同)。
“我怎么能没有这种感觉呢?我现在本来可以养活咱们全家,而且————” “你没明白我的意思。这从来就不是你一个人的路。从一开始,这就是我们全家的路。不管你是注定要成为科学家、研究员,还是其他我没有办法想象的职业,也不管你能不能从中赚到钱,从我们的飞机离开上海的那一刻开始,我们全家就一直在为这个目标努力。” 我不知道该说什么。
虽然图像整理是个苦差事,但这个过程让我深受启发。在对视觉世界的多样性进行深入思考之后,我开始以一种前所末有的方式看待这个世界:视觉世界本身是单一的现实,其中包含了手风琴、搅拌机、手机、龙虾、比萨、停车标志、雨伞和其他各种各样的东西。这是一种诗意的存在。我意识到这个世界是多么丰富多彩、变幻莫测,而我们留意到的细节却少之又少。
那些看似经过有效训练的算法,却无法将它们所学到的知识,或者说它们本应学到的知识,应用于现实世界。从本质上讲,这与人类的感知能力恰恰相反。人类的感知能力是由泛化能力决定的,泛化能力增强了我们的灵活性和适应性,甚至让我们富有创造力,让我们能够随时利用新想法的力量锐意进取,而不是停留在过去的经验中止步不前。任何缺乏泛化能力的生物都会很快被自然界的不可预测性击垮,因此这种能力是生物进化思维的关键特征。然而,对机器来说,泛化在很大程度上仍然是遥不可及的。
07 一个假设
视觉不仅仅是一种“感觉”,至少不是那种可以用温度计或盖革计数器测量的“感觉”,而是一种体验的催化剂。加油站的招牌在我每小时80千米的车速下一闪而过,它的颜色让我的大脑释放出了大量信息和情感。视觉是定义人类思维情感最为重要的能力之一,是通往整个记忆、联想、概念和推理世界的人口,所有这些都交织在我们与周围环境的视觉联系中。
无论等待我的是突破还是失败,我都感到激昂振奋。科学的追求可能是循序渐进的,但其突破却是由突如其来的巨变推动的,而这样巨变的引发者,不是某一个孤军奋战、雄心勃勃的天才,而是很多人的贡献被幸运之手汇聚在一起。回想起激发这个想法的种种线索,我不禁感觉即将到来的时刻便是如此。
我说:“那我们从生物学的角度思考吧。孩子是怎么长大的?我们的物种是怎么进化的?现实世界非常复杂,对不对?没有什么是非黑即白的,一切都在不断变化,但是我们依然学会了如何理解世界。我们生活在所有这些细节当中,自然而然地就成了专家。”我拿起桌上的马克杯,“但你问到了数字。那你告诉我,这个杯子在照片里有多少种不同的外观呢?”
尽管如此,我们两个都知道努力是有意义的。它们可能只是权宜之计,过于简单,甚至粗糙,但每解决一个问题,我们都离自己的愿景更近一步,这个愿景就是让机器看到一个完整的世界;我希望在不久之后,机器甚至可以理解这个世界。
[[当我们不再理解世界]],如何让机器理解这个世界。
更重要的是,反对标签过程自动化的真正原因并不是在技术层面,而是在哲学层面。我们意识到,即使是微妙的算法捷径,也与 ImageNet 的使命背道而驰。
我浅浅地吸了一口气。 “科学的诀窍是跟随着你的领域一起成长。不要太超前。” 这真是出乎我的意料。吉滕德拉竟然站在反对者的一边,让我深受打击。这种打击不仅仅是在个人层面:等到我将来需要请人写终身教职推荐信的时候,我原本计划请他做我的推荐人之一(虽然在这样巨大失败的阴影笼罩下,能获得终身教职的可能性已经变得非常渺茫)。
我几乎可以看到我的北极星在逐渐暗淡下来,我的道路又陷入了黑暗之中。一个可怕的想法开始在我心头升起:我承担的风险比我意识到的更大,而现在回头已经为时太晚。
08 实验验证
我们实验室所做的每一件事都充满了活力。有一次,我们利用 ImageNet 快速训练了数百个图像分类算法的实例,让它们识别一组日常事物,然后将所有实例应用在一张照片上。实验目的并不是简单地检测单个物体的存在,而是通过寻找物体组合来诠释整个场景。例如,如果检测算法发现了一个人、一艘船、一只桨和一片水域,它就会将照片作为一个整体归类为“划船”。这是一种更深层次的理解,可以说接近于原始的视觉推理。
我乐观地认为突破就在眼前,但又担心通往突破的道路崎岖难行,毕竟 ImagelVet 体量庞大,对任何一种算法来说都是难以驾驭的。我们讨论了目前流行的各种算法,如支持向量机(Support Vector Machine, SVM)、随机森林(random forest)、自适应提升(boosting),甚至是我和彼得罗在单样本学习论文中使用的贝叶斯网络,都会不堪重负,这迫使我们去创造一些真正的新算法。 “我不认为 ImageNet 会把现有的算法变得更好。”我说,“我认为它会让它们过时。”
我们全家人都沉浸在极大的悲痛之中。父亲一听到这个消息就泪流满面。母亲依旧沉默寡言,但我知道她和父亲的心情是一样的。他们也和这位“大胡子数学老师”有着特殊的情谊,多年来,他们一起帮助我这个容易陷人痴迷的移民女孩度过了艰难的青春期。就连西尔维奥也受到了影响,他只见过鲍勃几次,但已经逐渐明白他在我生命中独一无二的重要性。此外,鲍勃的家人跟西尔维奥一样来自意大利那不勒斯。西尔维奥知道依照医嘱,我不能去参加葬礼,但他担心我会因此遗憾终身,于是他放下手头的一切,从西海岸到东海岸,飞越整个美国,代表我参加了葬礼。
《[[至少还有书]]》中也有一个鲍勃,虽然是虚拟的,但同样都是对作者最重要的存在。
斯人已去,但足迹不灭,思想不朽。鲍勃的梦想是出版自己的科幻作品,虽然这个梦想没能实现,但他始终笔耕不辍,也总会在每个月底把自己的日记通过电子邮件发送给我。我们成了数字笔友,像往昔年代的人一样通过长篇通信保持联系。这些邮件成为我所认识的那个人的最后遗存:每一个黑白网页都记录着他的所思所感,有的深刻,有的平淡。时至今日,这些文字仍让我时而莞尔,时而捧腹,偶尔还会翻白眼,但总能引发我的思考。我的职业生涯致力于理解人类心灵的本质,而我此生最大的荣耀之一就是有机会更好地了解鲍勃的本性。
这就是假设的另一个特点——有时候,假设需要一些时间才能赢得所有人的认同。 即使是西尔维奥最温暖的安慰也充满了理性,他很擅长帮我振奋精神。不过,没过多久,我就不再需要他的鼓励了。科学总是以一种耐人寻味的方式打破预期,即便那些与之最接近的人也始料未及。
AlexNet 是卷积神经网络(Convolutional Neural Network,CNN)的一个实例。卷积神经网络的叫法源于图形卷积过程。在这个过程中,一系列滤波器在图像上扫过,寻找与网络所识别事物相对应的特征。这是一种独特的有机设计,灵感来自休伯尔和威塞尔对哺乳动物视觉系统的观察,即视觉处理在多个层次上进行。就像在自然界中一样,卷积神经网络的每一层都会逐渐整合更多的细节信息,从而形成越来越高层次的感知,最终将真实世界的物体完整地呈现在我们的视野中。
但失败并非无用功。错误会触发纠正信号,在网络的数千万个组成部分中蔓延开来,同时对每个部分对于结果的贡献进行评估,并按比例推动它们下次采取不同的行动。这是最简单的学习方式:减少失败的行为,增加成功的行为。但学习的规模极大,算法会仔细审查每个错误的每个细节:每一片光影、每一个图案和纹理、每一个柔和的渐变和坚硬的边缘。
我在来时飞机上狂躁的思绪和焦灼的问题一扫而空,取而代之的是一种意外的感觉。不是平静,而是大悟,是沉思。这一次,从起飞到着陆,我一直静静地坐着,脑子里只回荡着一个念头:历史刚被创造出来,而世界上只有少数人知道。