0%

假如回到20年前--《深度学习革命》

假如回到20年前,这个时候的我应该在大学城忙碌着,既有对未来不确定的担忧,又有着认真专研专业课的热情,还有全力投身学生工作的激情。之所以会突然有这样的感慨,那是因为我刚刚兴致勃勃地看完了《深度学习革命》这本书,辛顿和哈萨比斯两位2024年诺贝尔物理奖和诺贝尔化学奖的得主,是这本书的几位主角之一。

第一次感觉到诺贝尔奖描述的故事与我的生活是如此相近,毕竟书中叙述的大部分的故事,都发生在我上大学之后。我很认真的说,虽然自己也很努力,也愿意钻研,但是应该选择什么方向,为什么这么选,全凭一时意气。有句笑话是这么说的,以运气挣回来的东西会凭实力让它失去!

假如回到20年前–《深度学习革命》

这20年,还是有几次机会让我选择,是否要靠近深度学习这个领域的,然而我是一次又一次地擦身而过。第一次是2004年。

大二的那个秋天

这是2004年的夏天,远在加拿大的杰夫·辛顿开始举办了“神经计算和适应性感知”研讨会,杨立昆和约书亚·本吉奥加入了他的行列。而我,张罗着大家从五山搬家到小谷围,不经意间,成为了学院学生会的主要成员,负责张罗学术一块的活动。

尽管,学生会在很多人的印象和记忆中,都不曾有过太正面的形象,而我要说的是,我们任职的那两年,实现了自己的很多梦想,当然也尽力地让大家留下正面的形象,这不是一厢情愿,这是一件MIssion Impossible的事情,不过我们做到了,We Did It。以至于,多年以后回忆起来,这都是一个不可想象的事情,很幸运,我们经历了也做到了。

小镇做题家的局限–品味从何而来?

20年后的软件学院就业率很好,以至于大家或许不会去思考,为什么要设立软件学院,它和计算机学院有什么不一样,区别在哪?作为第一届本科招生的专业,我们其实挺委屈的,所以我也很认真地思考这个问题。自此,我并不是在炫耀自己特别愿意思考,而是从另外一个角度来印证了小镇做题家的局限。

在进入象牙塔之前,我和大部分的同学并没有真切地接触过计算机,当然上网、重装系统和打游戏,这个不算。我们还有一些同学,以及以后的一些师弟师妹们是凭借信息学奥赛获奖保送来到学院的。作为师兄,让我惊叹的是,他们已经对算法比赛无感了,自己开始构建自己的编译器,或者自己更大规模深层次的算法。

回到现在来看,我们和他们对话,或许真的就是夏虫不可语冰,牛头不对马嘴吧。他们现在很认真地在西雅图(微软)和山景城(谷歌)工作,而我只能默默地坐在这里回忆。

20年前的互联网世界,只有经历过的才能想象得出来。虽然我是读计算机专业的,但是关于专业的事情,像是现在的主流计算机世界在做什么?哪一个细分领域做到了什么层次?我应该选择哪一个细分领域,为什么?这都是无法获得的,连好一点的进口教材,我们好像都没法买到,只能简单地使用影印版。

当我很痛苦地开啃影印版的教材时,突然像发现了新世界似地,因为相当多的中文教材的字我都懂,连起来就懵了,英文虽然查单词费劲,查出来之后很多晦涩的东西仿佛一下就明白了。这是我第一次明白了,读书是需要品味的,然而没有见识,品味从何而来?

人工智能俱乐部

回到和深度学习擦肩而过的话题,我在当年曾经在新生见面会的时候说过:

我们学院还有学术创新俱乐部,有人工智能俱乐部,主要以学习VC++,和人工职能知识为主要的目标,其中今年的软件设计大赛的一等奖和二等奖均出自此俱乐部的成员;有数码艺术俱乐部,…;还有java技术俱乐部,…;还有的就是网络专家俱乐部,…。

没有过往的积累和资源,我们不希望下一届的师弟师妹和我们一样迷惘,于是搞了这样的俱乐部,其中人工智能俱乐部的伙伴,就是我的同班同学,时不时就把我从宿舍薅出来,跟我探讨一些我不曾想过的哲学问题,以及他关于人工智能的思考。书中DeepMind提到的强化学习,他当年也用过类似的方法来做黑白棋智能对弈以及设计小飞机自动穿越路障的游戏。

他擅长把学术的语言,转化成我能听懂的人话,这是我本科期间最好的朋友之一,关于人工智能的通用算法包括神经网络和遗传算法,他都给我介绍了一遍,至于以后怎么做,他也是迷糊的。不过,他立志搞人工智能,我一直想,只有这样的人才能搞人工智能吧,我真的不懂。

大三的那个秋天

如果2004年的那一次是,第一次邂逅,那么2006年的这一次,就算是被它撞了一下腰。经历了两年的不懈努力,个人感还是有些回报的。时间来到了2006年,2005年的时候,我们迎来了一位新的青年教师,武大的博士,教授我们嵌入式设备开发的课程。

Arm和Linux

这是一个我从来没有接触过的领域,做软件的人,对硬件的世界充满了好奇和向往,一方面是不懂感觉太高深,另一方面是无从接触。老师告诉我们,linux才是这个计算机世界的主流,别把时间都堆到了微软的技术上面。因为我们学习的C++是VC++,到底是选择MFC还是.Net Framework?选择SQL Server还是Orcale?无论哪个选择,都还在微软的平台上,那个时候我真的以为微软体系,才是技术的正确路线。老师这么说,我还是愿意相信,去尝试新鲜事物。

恰好遇上了倪光南院士主导的开源浪潮,我是这个潮头上的玩家,那个时候第一次在自己的机器安装上了redhat,fedora,openSUSE,solaris还有各种麒麟和红旗系统,最后发现还是redhat最好用。然而,无论是哪个发行版,窗口操作的GUI都非常弱,经常假死。

那个暑假,老师组织我们学习Linux的文件系统,以及ARM处理器的一些开发,争取做一个网络文件系统出来。2005年的网络,依然是很弱,Linux的代码充斥着许多超越我认知的知识点,而我却找不到答案,我第一次感觉到,我是不是不适合读这个专业?硬着头皮啃了两个月的linux资料和ARM文档,虽然还是不懂,但是多少了解个皮毛。

海量中文的知识发现和信息安全

还是这个时候,我开始参加老师的科研项目以及毕业设计了。两个工作可谓是同步的,一个是关于数据挖掘的,一个是关于信息安全的,都是基于java的项目,前者是海量中文的知识发现,后者是基于Spring的安全框架Acegi的应用项目。

前者用的是数据挖掘中的统计方法,其实就是人工智能领域中的多维特征向量的关联度分析及回归,想解决的是智能中文数据分类,完成一个主题搜索的大愿景,通过关键字获得某一个主题的各种资讯,为解决当年搜索引擎返回的大量重复结果和类似结果的困难。后者是通过对比主流传统Windows基于角色的权限管理(RBAC)和基于linux的访问控制列表(ACL),研究了当年java的主流框架Spring的安全组件Acegi的原理和使用。

保研

很快就到了保研的时候,关于读什么专业,往哪个方向走的分岔口了。当时洋洋得意,觉得自己既可以架构开发项目,又能搞人工智能,还能研究信息安全,仿佛找保研专业的时候多了两重机会。从现在来看,这明明是自己不知道自己擅长什么,看不清计算机三个方向的发展前景,更不知道自己心理到底想做什么研究。选择是需要见识的,缺乏足够的见识,只凭意气,终究是一场赌博,以运气挣回来的东西会凭实力让它失去。这个分岔对我的命运改变如此之大,我却不知道,只把这个选择推说是做决定那天发烧了。

辛顿,成长在一个科学家的家族,从小就想研究大脑,相比起我们,无论是他就读的剑桥大学还是爱丁堡大学,工作的是加州大学圣迭戈分校还是卡内基·梅隆大学,至少每一个领域,都是明确知道当下世界最先的进展是什么,有什么最新的动态也会第一时间掌握,哪怕当年资讯并不是那么发达。

我想,相比而言,作为小镇做题家,如果不到清北,估计也无法做到辛顿那样,退一万步来说,突然到了清北,也未必能做到辛顿那样。

研二的那个夏天

如果说第二次与人工智能失之交臂,是因为保研选择了信息安全领域的混沌密码学,从事了非线性的复杂科学研究,那么第三次无缘于人工智能领域,便是研究生毕业的时候。

虽然,我慢慢地喜欢上了混沌这门学科,但是越喜欢的话,心里的问题就越多。当越多的问题堆积起来的时候,人就越难受,图书馆没有太多的书,手上也没有太多的书,网络也没有太多的资讯。只有老师给我们学习的论文,有点小聪明的我,把老师给的用来学习基础知识的论文,迅速转化成一篇新论文,并发表在国际刊物的时候,我只确认了一点,认为自己是有一定研究能力的。

但是,如何研究,往哪里研究,我始终想不到。曾经有师姐提醒我,其实我还是有点科研能力的,不一定要待在这里,去别的地方也成。当年,我只当这是一句笑话,多年以后,其实后悔不已。毕竟导师一直在劝说我们硕博连读,既然有了基础,也开始了科研,何必放弃呢。是啊,何必放弃呢?

当是时,我与外界几乎毫无沟通,也不知道该如何沟通。即便是大厂通用的技术和方向,我也无从得知;非线性密码学的方向和顶级专家,我也不知道,只是知道香港城大有一位叫陈关荣的教授和川大有一位叫做廖晓峰的教授是做这个领域的。

回想那个时候,一个又一个现在看起来都非常有前途的机会,在我的指缝中悄悄地划走,自己明明能力一般却自命不凡,因为眼中当年看不到更好的人、更优秀的人。无论是客观上缺乏沟通机制,还是主观上自己的自大,这只说明了一点,我给自己编制了一个看不见的数字茧房。因为我不知道该如何更新我的认知和见识,然而变成了无知者无畏的孤勇者,缺乏见识的人,一定会走向偏执

读研究生的几年,我几乎和整个计算机世界脱钩,除了搞了一下混沌密码学以外。虽然我想继续地做安全产品,继续地将密码算法的理论深入研究下去,可是我不知道应该怎么干,没有人能给我指路,这种绝望是从来没用过的。我终究没做到像辛顿那样,无论如何,觉得对的就要坚持。坚持,何不是一种见识,因此不为他人所左右。

宁人遗憾的某个春天

2018年的春天,我不晓得在哪里看到了一篇香港方面研究深度学习和气象预报的论文,觉得饶有兴趣,也便报了母校的工程博士项目。原以为凭借对技术的一枪热忱和对科学的无限向往,我能在深度学习中,继续地研究确定性混沌系统和深度学习之间的差异,并借此找出自己的独立的路径。

不得不说,这是我离深度学习这个领域最为接近,最有可能重返科研领域的时候了。春寒是料峭的,心伤是隐隐的,答辩时竟被说这个选题大而无意义,后来谷歌、微软还有英伟达相继在这方面也做出了应有的探索后,我只有遗憾。

我好像没有错,但是为什么总是没有对?我也好像一直在努力,但是为什么总是不见有进展?

不过,我终于慢慢地认识到了小镇做题家的局限,偶然的一次或几次运气并不能带来真正的见识,只有当自己放下了自命不凡和风华意气的时候,不再有偏执的时候,真心实意去积累和探索的时候,或许真正的见识才会浮出水面

结语

关于见识的探索,我花了将近二十年。然而,二十年,辛顿带着他的信念成功角逐了诺贝尔物理学奖。我只希望我的探索不要白费,至少希望我的孩子长大后,不要再傻傻地去走父辈们曾经走过的弯路,题是要做的,重要的是见识也是得要有的。