0%

数学的美--《数学之美》

吴军老师的书躺在书柜了真的很久了,这会儿终于有勇气拿出来认真看看了,我的数学学的不太好,尤其是上了大学之后,一个是个人悟性与课本不太合得来,虽然我把高数的所有习题都做了一遍,二是并没有把高等数学、线性代数以及概率论的理论体系建立起来,虽然我考试的成绩还过得去。

除了自身太笨的原因,我还是要吐槽一下,高中的学习体验太糟糕了,因为像我这种不太聪明的人还是需要人指点一下努力的方向。天赋秉异的人或许自己理解的快而且能迅速找到一个适合自己的方向,然后到达一个他人难以到达的高度。而对于一般人,如果方向错了,好久自己都发现不了,原地打转久了可不和他人的差距就大了。

回到这本书,关于数学的内容我只能理解其中的6成,不过这并不太影响理解吴军博士的观点,书中的内容是吴博士在Google的时候写的黑板报,介绍google的技术却又不能泄漏商业机密。


罗赛塔(Rosetta)

这是古埃及的地名,出土了一块刻有三种语言的石板,语言天才商博良通过这石板破译了埃及文字,所以google以及很多的翻译的软件都命名为罗赛塔(Rosetta)。语言文字的出现是为了通信,更重要的是承载信息,但必须说的是文字却不是信息。

正如麦克斯韦方程很简单,但是我看不懂,意味着这个信息没有被正确的翻译到我的脑子里;于我而言,这只是文字,却不是信息。无论是什么翻译,只要能达成,都是因为在不同的描述中,信息是等价的,无论是公式还是不同的语言。

通信的本质

通信的本质是一个解编码和传输的过程,我们讲话也是这样的。所谓语音识别,就是听到讲话的人去猜测说话者要表达的意思。所以人和人沟通出现问题,就是编码器和解码器不一致啊,本质上就是语言模型不一致嘛,口音的话是声学模型,理解上是翻译模型,还得加上纠错模型

信息熵

一条信息的信息量,和它的不确定性有着直接的关系。再简单一点就是给你10个字,有多少种意思?若果是给定的10个字,似乎是可以预计得出来的,如果是所有的汉字呢?你一定懵了吧。香农说,我们用比特(1与0)来表示把,常用汉字6700个,编码需要13比特,但是前10%的汉字占使用量的95%以上,压缩一下就是9比特,如果再根据上下文相关,只剩下5比特,于是10个汉字的信息量就是50比特,传递出来的信息是2的50次方中的一条或者一些,超不出这个范围了,这就是信息熵。

这可是我想了很久都没明白的东西,被吴博士一提点,醍醐灌顶啊!

中文的冗余

不同文字的冗余度差别很大,而汉语在所有语言中的冗余度是最小的,一本英文书,翻译成中文,可能厚度就会薄很多。吴博士还真就这个问题还专门发表过一篇论文,其实如果翻译的不好的话,分分钟比原书还厚呢。


安抚寂寞的灵魂

吴博士写书的初衷在于鼓励年轻人,学习大师的思维方法,因为当今中国社会物欲横流,学术界浮躁,年轻人浮躁,少数有远大志向的年轻人世纪上是非常孤独的。吴博士觉得这就像罗曼罗兰描写一战后的法国,他为那些追求灵魂高尚而非物质富裕的年轻人写下了《巨人三传》:《贝多芬传》、《米开朗基罗传》、《托尔斯泰传》。

吴博士通过记录自己和贾里尼克的聊天,表达他们都不赞同中小学生只会上学考试的教育方式。

  1. 吴军和贾里尼克都觉得小的时候不应该花那么多时间读书,而是他们的社会经验、生活能力以及那个时候树立的志向会影响他们的一生。其实费曼也是这么说的,巴西的小学生就开始读物理,考试成绩也不错,但是物理专业的大学生却回答不出身边的物理原理,所以比不上美国真正喜欢物理然后研习物理的学生,别看他们开始接触物理的年龄都比较大。
  2. 中学阶段话很多时间比同伴多读的课程,在大学以后用非常短的时间就可以读完,因为在大学阶段,人的理解能力强很多。
  3. 学习和教育是一辈子的事情,很多中学成绩好的亚裔学生进入名校厚的表现明显不如那些因为兴趣而读书的美国同伴,因为前者的读书动力不足。
  4. 书本的内容可以早学,也可以晚学,但是错过了成长阶段是无法弥补的。

现在中国的很多好学校的学生读书应该都比吴军和贾里尼克多,应该是多得多,但是这些孩子99%在学术上不如他们,不是教育的误区吗?

大师

贾里尼克在MIT遇到过许多世界级的大师,这些人对贾里尼克后来的研究方向产生了重要的影响。吴军觉得

一个人想要在自己的领域做到世界一流,他的周围必须有非常多的一流人物,贾里尼克的幸运在于年轻的时候得到了这些大师的指点,以后在研究境界上比同龄人高出一筹

在普林斯顿的费曼,当时在物理学家爱因斯坦、天文学家罗素、数学家冯诺伊曼、物理学家泡利面前讲演,体会到老一辈科学家的谨慎认真以及对不同观点的宽容,让他感到莫大的鼓舞。

贾里尼克从IBM退下之后,在霍普金斯大学建立了语言与文本处理中心,短短3年就把这个机构变成了世界一流的学术中心。他做了两件大事:

  1. 从美国政府申请到很多经费
  2. 邀请世界上20-30名顶级的科学家和学生来中心工作

两件小事:

  1. 招募来一批当年很有潜力的学者
  2. 利用自己的影响力把学生送到世界上最好的公司实习

贾里尼克帮助吴军提高了学术上的境界,说的最多的就是,“什么方法不好”,至于什么方法好,他相信吴军自己能找到。

道和术

技术分为道和术两种,具体的做事方法是术,做事的原则和原理是道。术是不断推陈出新的,只有掌握本质与精髓才能柔韧有余,如果总希望一个算法、一个模型就能毕其功于一役,是不现实的。

AK47

一个好的算法应该想AK47那样,有效、简单、可靠性好,而且容易读懂。有一种做事的哲学是先帮用户解决80%的问题,再慢慢解决剩下的20%的问题,许多失败并不是因为个人不优秀,而是做事的方法不对,一开始追求大而全的方案,最后长时间不能落地,不了了之。然而那些简单而有效的方案尝试是深思熟虑去伪存真的结果,并非草率了事。

但是很多资深的工程师都会倾向低估简单方法的有效性,Google也是这样的。