友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
信号与噪声-第1部分
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!
人类最初的信息技术革命并非始于微型芯片的发明,而是以印刷机的诞生为开端的。1440年,约翰内斯…古腾堡发明了印刷机,这项发明使普通民众能方便地了解信息,由此产生的思想洪流带来了前所未有的结果和影响。印刷机的发明点燃了1775年的工业革命之火,也促成了人类文明的迅猛发展——由从前那种科学和经济几乎止步不前的状态迅速跨越到呈指数型增长的状态,还带来了我们今天所熟悉的变化。除此之外,这一发明促成了一些历史事件,这些事件开启了欧洲启蒙运动,也加速了美利坚合众国的建立。
但是,印刷机发明之初并没有引发上述各种巨变,倒是可能催生了另外的事件,如持续了几百年的“圣战”。当人类开始相信他们可以预知和选择自己的命运时,人类历史上最血腥的时代也就开始了。
早在古腾堡发明印刷机之前,书籍就已经存在了,但当时书的数量和读书的人都很少,书籍只是贵族阶层的奢侈品。因为抄写员每次只能抄写一份副本,复制一份原稿的费用大约是每5页1弗洛林(一种金币,1弗洛林约合200美元),因此像你现在读的这本书,在当时可能要花费20000美元才能得到。而且,经过无数次的抄写,书中难免有大量的抄写错误,这些错误代代相传,成倍增加,甚至还会演变成与原意相反的错误。
这就使得知识的积累变得极其困难。要想阻止以文字记录的知识的不断减少,就需要付出巨大的努力,因为书籍腐烂的速度远远大于其生成的速度。只有几个版本的《圣经》和少量的哲学论述——比如柏拉图和亚里士多德的文章——被保留了下来,其他那些数不清的智慧,由于缺乏记载动机,都遗失在那个年代了。
过去,也许人们觉得对于知识的追求即使不全是无用功,似乎也没什么实际价值。如今世事瞬息万变,我们总会有一种“世事无常”的感觉,而对于我们的前辈来说,这种“无常的世事”则更受关注。《圣经…传道书》中有一句唯美的诗句:“日光之下无新事”,可事实却并非如此,之所以说“无新事”,并不是因为每件事都已经被发掘出来了,而是因为所有事情都将被遗忘。
印刷机永久而深刻地改变了这一状况。几乎是一夜之间,一本书的成本就骤降近300倍,书的售价从相当于今天20000美元的价格剧降至70美元。印刷机迅速在欧洲普及,到1470年,印刷机已从德国传播到罗马、西班牙塞维利亚、法国巴黎和瑞士巴塞尔,随后的10年里,几乎所有的欧洲主要城市里都有了印刷机的影子。印刷机问世的第一个世纪里,书籍的生产规模呈指数型增长,数量增长了近30倍。人类知识旋即进入快速积累期。
然而,正如万维网建立初期那样,印刷机使用之初的信息质量也是参差不齐的。当时,人们只顾追逐眼前利益,印刷机几乎都用来印制那些质量较高的地图了,异端的宗教文章和一些伪科学文章也很快就占据了畅销书单的主要位置。印刷错误大量出现,那本被叫作《邪恶圣经》的书便是如此,这本书犯了史上最严重的印刷错误——《十诫》中的“不可奸淫”误印成“应当奸淫”。与此同时,人们一下子接触到大量的新思想,这难免会产生诸多混淆。信息的增长速度远远超过了人们处理信息和分辨信息的速度。共享信息的不断增长反而加速了民族和宗教的孤立进程,其速度之快不禁让人瞠目结舌。面对“过量的信息”时,我们会本能地进行筛选,选出喜欢的,忽略其他的,与同道中人为友,与意见相左之人为敌。
印刷机的早期使用者中,最狂热的要数那些传播福音的人了。马丁…路德的《九十五条论纲》还不是那么激进,而对其中类似情绪的争论已然不绝于耳了。正如《现代欧洲早期印刷革命》一书的作者伊丽莎白R26;爱森斯坦所写的那样,马丁…路德这些论纲的革命之处就在于,它们“没有一直钉在教堂的门上”。而是被古腾堡的印刷机复印了30多万次,即使按照今天的标准来看,这个印刷量也可算作巨大的成功了。
路德的新教改革所导致的教会分裂,很快使欧洲陷入了战争。1524~1648年间,欧洲爆发了德国农民战争、施马尔卡尔登战争、八十年战争、三十年战争、法国宗教战争、爱尔兰南联邦战争、苏格兰内战和英国内战,其中许多战争几乎是同时爆发的。当然,1480年出现的西班牙宗教法庭和1508~1516年出现的康布雷同盟也值得一提,尽管两者与新教思想的传播关系不大。单单一个三十年战争,德国人口就减少了1/3,即使是与20世纪早期的第一次世界大战相比,17世纪也称得上是史上最血腥的时代。
但就是在这样一个充满战乱的时代,印刷机却悄然推动着科学与文学的进步,所以人们才得以分享伽利略的科学思想,品味莎士比亚的舞台剧。
莎士比亚舞台剧的主题通常关乎人的命运,这一点与戏剧如出一辙。剧中人物的理想和命运之间的差距增添了这些舞台剧的悲剧色彩。莎士?亚时期,掌控自身命运看似已成为?们思想意识的一部分,但要做到这一点却很难,所以那些挑战命运的人总是遍体鳞伤,直至死去。
这一主题在莎士比亚的著名悲剧《朱利叶…恺撒》中得到了最生动的诠释。在这部戏的前半部分,恺撒接收到各种各样明显的警示,他称之为预言(比如“留心3月15日”),这些预言预示了他的加冕礼可能会演变为一场屠杀。恺撒当然不会在意那些预言,他始终自信地认为,这些预言只是预示着别人的死亡,否则,他当时就会留意。结果,恺撒遇刺了。
莎士比亚借西塞罗的话警示我们,“(可是)人们照着自己的意思解释一切事物的原因,实际上却和这些事物本身的目的完全相反”。这句话对于所有正在对自己新发现的大量信息进行选择的人,都不失为一条好的建议。人们很难从干扰他们的噪声中分辨出有用的信号。数据展示给我们的通常都是我们想要的结果,而且我们通常也能确保这些数据令我们皆大欢喜。
然而,如果说《朱利叶斯…恺撒》这部戏剧中含有的宿命论、占卜术和迷信思想,是古代预言思想的开端,它同时也介绍了一种较为现代且较为激进的思想:我们可以对这些迹象进行解释,从中获益。在戏中,卡修斯说,“有时,人们可以掌控自己的命运”,他希望能劝服勃鲁托斯参与谋害恺撒的阴谋中。
于是,“人们可以掌控自己的命运”这一思想便广泛传播开来。“预言”和“预测”这两个词在今天大多数的情况下可以互换使用,然而在莎士比亚时代,它们却有着不同的含义。“预言”是指占卜者告诉你的话,而“预测”则更像是卡修斯的想法。
“预测”一词源于日耳曼语,而“预言”一词源自拉丁语。“预测”反映的是新教世俗思想,而不是神圣罗马帝国的理想世界。“预测”是指在不确定的条件下进行计划,这一行为需要谨慎、智慧和勤奋,更像我们今天所说的“预见”一词。
预言思想的神学含义是十分复杂的,但对于凡尘俗世中那些追逐利益的人来说,这些含义就不那么复杂了。预言思想的这些特质与那些新教徒的职业道德是密不可分的,马克斯…韦伯认为,资本主义的诞生和工业革命的开始与预言思想不无关联。“预测”与“进步”两个概念紧密相关。所有相关书籍中的所有信息都应有助于我们规划生活,都应成功地预见整个世界的发展历程。
几个世纪以来,引领“圣战”的新教徒们都在学习如何用自身积累的知识改变社会。工业革命主要始于新教国家,而且多半发生在那些言论自由的国家,因为在这些国家,宗教思想和科学思想可以自由传播,人们也不必对审查制度心存顾虑。
工业革命的重大意义难以尽数。纵观人类社会的历史进程,经济增长的速度曾经为年均0。1%,这个增速足以匹配当时人口数量平缓增长的状况,但人均生活水平却没有得到任何显著提高。然后,经济形势突然出现了前所未有的进展,经济增速急剧超越了人口数量增长的速度,尽管偶尔也会出现全球金融危机,但这种高速增长的态势时至今日仍未改变。
历史证明,印刷机引发的信息大爆炸为我们创造了一个好的世界,因为它仅用了330年的时间就为我们带来了不可尽数的好处,而与此同时有几百万人在欧洲战场上丧命。
生产力悖论
一旦信息增长的速度过快,而我们处理信息的能力尚且不足,情况就很危险。过去40年的人类历史表明,把信息转变为有用的知识可能还需要很长时间,一不小心,我们就有可能倒退回去。
“信息时代”并不是特别新的术语,自20世纪70年代后期开始,这个术语便得到越来越广泛的使用。而与之相关的术语“计算机时代”使用得还要早一些,1970年就有人用了。也就是在那个时候,计算机虽然没有在家庭中普及,但在许多实验室和学术机构中却越来越普及了。这一次,没有经过300年的时间,信息技术的增长就已经开始为人类社会创造实实在在的利益了,但是人们也等了15~20年才享受到这些利益。
正如美国经济学家、诺贝尔经济学奖得主保罗…克鲁格曼曾经对我讲的那样,20世纪70年代是典型的“大量理论堆积如山,验证数据少得可怜”的时期。当时,人们已经开始用计算机制作地球模型,但是一段时间以后,人们发现这些模型太过粗劣,而且与实际不符,计算机可达到的精确度根本无法替代预测的准确度。这一时期,人们作过很多大胆的预测,涉及范围从经济学到流行病等各个领域,但是这些预测通常都不准确。比如,1971年,人们声称可以预测出未来10年内的地震次数,而实际上,这在40年后的今天仍实现不了。
20世纪七八十年代的计算机热非但未能推动经济和科学的发展,反而造成了两个领域生产力水平的短暂下降。经济学家将这种现象称为“生产力悖论”。罗伯特…索洛曾经在1987年写道:“计算机无处不在,可生产统计中却不见其身影。”1969~1982年,美国经历了4次经济大衰退,直到20世纪80年代后期,美国经济才开始好转,而世界其他国家的经济状况则鲜有起色。
科学发展比经济发展更难判定,但科技进步有一大标志,即专利的数量,尤其是与研发投资相关的专利数量。如果一项发明的成本降低了,这就表明我们善于利用信息,并将其转变为知识。而如果发明的成本增加了,那就说明我们正在噪声中寻找信号,这无疑是在错误的方向上浪费时间。
20世纪60年代,美国在每个发明者的每项专利上的耗资都接近150万美元(通货膨胀因素考虑在内)。这一数字在信息时代初期有增无减,1986年更是成倍增长,最高达到300万美元。
因为越来越注重新技术带给我们的实惠,20世纪90年代我们又一次提升了科学研究的生产力。各项研究不再硬钻“牛角尖”,计算机开始被用于改善人们的日常生活,促进经济发展。通常情况下,许多预言从长远角度看算作进步,而从短期角度看则成了倒退;而许多从长远来看似乎可以预知的事情,同时也会妨碍我们进行完美的计划。
“大数据”的承诺与陷阱
时下最流行的术语要数“大数据”了。根据国际商业机器公司(IBM)估计的数据来看,现在我们每天生成的数据高达250兆亿个字节,超过过去两年里生成的数据总量的90%。
信息的指数型增长有时被人们视为万灵药,就好比20世纪70年代出现的计算机一样。《连线》杂志的前主编克里斯…安德森曾经在2008年的一篇文章中说:“数量庞大的数据会使人们不再需要理论,甚至不再需要科学的方法。”
本书着重介绍了前沿科学和高端技术,我认为其内容是积极乐观的,却被严重曲解了。虽然那些数字不能为自己辩护,但我们却可以作为数字的发言人,赋予它们意义。这就好比对恺撒密码解码一样,我们可能会以对自己有利的方式对这些数据进行分析和解释,而这些方式很可能与这些数据(所代表)的客观现实不相吻合。数据驱动预测机制可能会成功,也可能会失败。一旦我们否认数据处理过程中存在着主观因素,失败的概率就会增加。要提高数据分析的质量,首先要对我们自身提出更高的要求。如果对我的情况不甚了解,你可能就会对前面的提法颇感意外。我在数据和统计学领域还算小有建树,曾经据此做出不少成功的预测。2003年,由于厌倦了咨询工作,我设计了一个名为“PECOTA”的系统,主要用来预测美国职业棒球联盟球员的各项数据。这个系统有很多创新点——其预测是概率性的,比方说其中为每位球员都列出了一系列可能出现的结果——当我们将这些预测结果与比赛系统给出的结果进行比较时,发现这套系统的性能更加优越。2008年,我建立了“FiveThirtyEight”(538网站,因538张选举人总票数得名)网站,试图对即将举行的美国总统大选进行预测。该网站对两位美国总统候选人在美国50个州中的竞选结果进行了预测,结果命中49次竞选,只有1次失手。另外,我的网站还预测出美国参议院选举的35个席位归属。
美国总统大选过后,很多出版商找到我,希望我能为《点球成金》和《魔鬼经济学》这类关于小人物征服大世界的书籍估个价。本书涵盖很多行业和领域,从金融领域,到国家安全,对这些行业和领域中的数据驱动预测机制进行了调查。
在4年时间里,我曾与十几个领域中的100多位专家交流过,读过数百篇期刊文章和论文,为了实地调查,我跑遍了从拉斯韦加斯到哥本哈根的许多地方,却发现“大数据”时代的预测活动发展得并不顺利。我的成功也只是因为我在某种程度上比较幸运,一是尽管出现了本书中提到的一些错误,但还是取得了成功;二是选对了调查案例。
本书提到了几个值得研究的例子,集人类判断与计算机功能为一体的天气预报就是其中之一。虽然气象学家的名声不好,可是他们也取得过显著的进步,比如他们预测飓风着陆位置的准确度比25年前提高了3倍。与此同时,我还拜访过一些在赌城拉斯韦加斯轰动一时的扑克牌玩家和(体育赛事)赌徒。
但是,这些预测成功的案例必然是建立在一系列失败案例的基础之上的。
如果让我们用一个特点来定义美国人——一个令其与众不同的特质——那就是美国人对卡修斯精神的信仰:我们的命运由我们自己主宰。一些宗教叛逆者迎着工业革命的曙光建立了美国,他们认为自由流动的思想不仅有助于传播其宗教信仰,也有助于传播科学和商业贸易,“作为一个民族,我们的智慧、我们的勤劳、我们的傲慢和急躁、我们所有的强项和弱项,都源自我们那不可动摇的信念,那就是我们要为自己做主”。
新千年给美国人带来的是噩梦般的开始。我们没有预测到“9…11”恐怖袭击事件,而这一惨剧的出现并非因为我们的信息匮乏。正如60年前的“珍珠港事件”一样,其实所有的信号都在那里,只是我们没能将它们联系起来。因为对恐怖分子可能会
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!