商业和其他领域的决策者正在以你从未想象过的方式使用统计分析,以进行各种选择。
为什么电商比你自己更懂你的需求?
为什么资深品酒师也比不过一个简单的数学公式?
为什么棒球教练能够精准评估一个从未见过的球员的未来潜能?
大数据已然成为现代社会的底层架构,数据里隐藏着基于现实而影响未来的线索。耶鲁大学教授、“魔*经济学”专栏作者之一的伊恩·艾瑞斯在《魔*统计学》中,以大量真实生动的案例,讲述了统计学如何化腐朽为神奇,干脆利索地解决一系列传统社会科学语焉不详的问题。
本文节选自《魔*统计学》,这一小节讲述了一位超级数据分析师的崛起,一个经济学家如何被误解、攻击,到最后被另一个高端行业接受的故事。
《魔*统计学》
[美]伊恩·艾瑞斯著
刘清山译者
后浪丨九州出版社
年11月
丨奥利·阿森费尔特非常喜爱葡萄酒,“你只要把优质红酒放上一段时间,它就会发生一些非常神奇的事情。”奥利不仅对于葡萄酒的品鉴很着迷,而且希望知道优质葡萄酒和普通葡萄酒背后的推动力量。
“当你购买优质红酒时,”他说,“你是在进行一项投资,因为它未来很可能会变得愈发诱人。你希望知道的不是它现在的价值,而是它未来的价值,尽管你可能不会卖掉它或者喝掉它。你可以通过推迟品尝获得多少快乐呢?这是一个非常有趣的话题。”过去二十五年,这个话题占据了他的很大一部分时间。
奥利的日常工作是分析数字。他用统计量提取隐藏在大型数据集合中的信息。作为普林斯顿的经济学家,他曾考察同卵双胞胎的工资,以估计多上一年学所带来的影响。他曾考察限速差异,以估计各州对于统计寿命的重视情况。他曾在多年时间里担任美国顶级经济学期刊《美国经济评论》的编辑。
阿森费尔特个子很高,留着浓密的白色络腮胡子,他那洪亮而友好的嗓音往往会成为会场上的主旋律。他并不胆小。你可能认为数字分析师是一些懦弱而腼腆的人,但阿森费尔特会使你迅速消除这种成见。我曾见过奥利在教室里踱步,用和蔼而热情的语气阐述一篇研讨会论文背后的原理。当他以高度赞扬的语气开始他的评论时,你就要当心了。
奥利通过分析数字评价波尔多葡萄酒品质的做法使他陷入了很大的麻烦。他不是使用罗伯特·帕克等葡萄酒大师的“痛饮和回味”方法,而是用统计量寻找与拍卖价格高低相关的年份酒特征。
“这是显而易见的,”他说,“葡萄酒是农业产品,它会受到不同年份天气的极大影响。”根据法国波尔多地区数十年的天气数据,奥利发现,较少的收获期降水量和较高的平均夏季气温可以给人们带来品质最佳的葡萄酒。正如彼得·帕塞尔在《纽约时报》中所说,奥利的统计方程与数据吻合得相当完美。
当葡萄成熟、汁液浓缩时,波尔多酒是最好的。在夏季特别热的年份里,葡萄会充分成熟,其酸度会降低。在降水量低于平均水平的年份里,水果汁液会浓缩。所以,你往往会在炎热干燥的年份得到具有传奇色彩的年份酒。成熟的葡萄可以酿造出口感柔和的(酸度低的)葡萄酒。汁液浓缩的葡萄可以酿造出风味浓郁的葡萄酒。
奥利大胆地将他的理论简化成一个公式:
葡萄酒品质=12.+0.?冬季降水量+0.?生长季平均气温-0.?收获期降水量
没错。通过将当年的天气数据代入这个公式,阿森费尔特可以预测任何年份酒的总体品质。通过另一个更加复杂的公式,他可以更加准确地预测一百多个庄园的葡萄酒品质。“这看上去可能有一点数学成分,”奥利说,“但这正是法国人在著名的年分类中为葡萄酒厂排名时使用的方法。”
传统葡萄酒评论家并不接受阿森费尔特基于数据的预测。英国《葡萄酒》杂志说,“这个公式显然很可笑,不值得尊重。”纽约葡萄酒商威廉·索克林说,在波尔多葡萄酒从业者眼里,阿森费尔特的工作“介于野蛮和歇斯底里之间”。奥利时常遭到葡萄酒交易者的轻视,当他在佳士得葡萄酒部门发表关于葡萄酒的演讲时,会场后排的交易商公然对他的演讲发出嘘声。
罗伯特·帕克也许是世界上最有影响力的葡萄酒作家,他也是《葡萄酒先锋》的出版人。他生动地将阿森费尔特形容为“彻头彻尾的骗子”。虽然阿森费尔特是世界上最受尊重的计量经济学家之一,但是在帕克看来,他的方法“是尼安德特人看待葡萄酒的方式。它太荒谬了,简直不值得嘲笑”。帕克否认了数学公式有助于鉴别优质葡萄酒的可能性,“我不想去他家做客,喝他家的葡萄酒。”
帕克说,阿森费尔特“就像一个从不看电影、仅仅根据演员和导演判断电影好坏的影评人一样”。
帕克的观点有一定的道理。既然通过观影得到的判断更加准确,通过品尝葡萄酒得到的判断不也应该更加准确吗?但是,这里有一个问题:波尔多和勃艮第葡萄酒需要在橡木桶里存放十八到二十四个月,然后封装在酒瓶里。像帕克这样的专家在葡萄酒装进酒桶四个月以后才能开封品尝。即便此时,他们喝到的仍然只是正在发酵的非常难闻的混合物。我不知道品尝这种无法饮用的早期葡萄酒能否为品酒师带来关于葡萄酒未来品质的非常准确的信息。例如,巴特菲尔德拍卖行葡萄酒部门前主管布鲁斯·凯泽说过,“早期葡萄酒变化很快,在其存放至少十年甚至更长时间以前,没有一个人可以对葡萄酒做出准确评价。”
与之形成鲜明对比的是,奥利通过分析历史数据找到了天气和价格之间的关系。他通过这种方式发现,冬季降水量每增加一厘米,预期价格往往会增加0.美元。当然,这只是一种趋势。不过,通过分析数字,奥利可以在葡萄收获时立即预测出未来的年份酒品质——比首次品尝提前几个月,比首次销售提前几年。由于葡萄酒期货交易频繁,因此阿森费尔特的预测为葡萄酒收藏者带来了巨大的竞争优势。
20世纪80年代后期,阿森费尔特开始在半年度简报《流动资产》上发布他的预测。他首先在《葡萄酒观察者》上用小篇幅广告宣传他的简报,逐渐积累了大约名订阅者。订阅者来自世界各地,包括许多百万富翁和品酒专家——其中大多数人来自接受计量经济学方法的葡萄酒收藏者小圈子。罗伯特·帕克的简报《葡萄酒先锋》有三万订阅者,年费为30美元。相比之下,阿森费尔特的订阅群体显得不值一提。
年初,《纽约时报》头版发布了一篇关于阿森费尔特新型预测机器的文章,使更多的人接触到了他的思想。奥利公开批评帕克对于年波尔多葡萄酒的评估。帕克认为八六年葡萄酒“非常好,简直称得上出类拔萃”。阿森费尔特不同意这种观点。他认为这种酒的生长季平均气温低于平均水平,收获期降水量高于平均水平,因此该年份酒一定很平庸。
不过,这篇文章中真正的重磅炸弹与奥利对年波尔多葡萄酒的预测有关。这些葡萄酒在酒桶里只存放了三个月,还没有机会得到评论家品尝,但奥利认为它们将成为“这个世纪的葡萄酒之选”。他表示,这种酒一定“非常好”。根据他的评分标准,如果上好的年波尔多葡萄酒是分,那么年波尔多葡萄酒将达到惊人的分。奥利公然表示,它们的“售价不会输给过去三十五年酿造的任何一款葡萄酒”。
葡萄酒评论家被激怒了。帕克此时称阿森费尔特的定量估计“荒谬可笑”。索克林说,人们的反应夹杂着“愤怒和恐惧。奥利的确惹恼了许多人”。在几年时间里,《葡萄酒观察者》不再为奥利(和其他人)的简报发布任何广告。
传统专家团结在一起,试图诋毁奥利及其方法。他们说,奥利的方法存在缺陷,因为它无法精确预测未来的价格。例如,《葡萄酒观察者》品尝主管托马斯·马修斯抱怨说,阿森费尔特对于二十七种年份酒的价格预测只有三次是完全准确的。虽然奥利的“公式得到了特别设计,以拟合价格数据”,但他的“预测价格不是高于实际价格,就是低于实际价格”。不过,对于统计学家(以及其他任何稍作思考的人)来说,拥有时高时低的预测是一件好事,它是无偏估计的象征。实际上,奥利指出,帕克最初对于年份酒的评价存在系统性的上偏趋势。帕克常常需要对他最初的评价进行下调。
年,奥利做出了更加冒险的举动。在将年葡萄酒称为世纪年份酒之后,他发现,根据数据,年的葡萄酒将会表现得更好。他宣布了这一结果。事后来看,我们知道《流动资产》的预测是非常准确的。八九年葡萄酒成了非常优秀的年份酒,而九零年葡萄酒表现得更好。
你怎么能连续两年拥有“世纪年份酒”呢?原来,自从年以来,每一年的生长季气温都要高于平均水平。法国天气已经温暖了二十多年。这是种植柔和的波尔多葡萄的好时机,对葡萄酒爱好者来说也是一个好消息。
传统专家现在对天气的重视大大提高了。许多人从未公开承认奥利的预测威力,但他们自己的预测与奥利那个简单公式得到的结果更加吻合了。奥利仍然在维护他的网站,但他不再制作简报了。他说,“现在和过去不同了,品酒师不会再犯可怕的错误了。坦白地说,我是在自掘坟墓。我再也没有像之前那么高的附加值了。”
阿森费尔特的诋毁者将他看作异端。他揭开了葡萄酒的神秘面纱,对他们产生了威胁。他回避了华丽而荒谬的术语(“强健”“紧实”“轻快”),为他的预测给出了理由。
葡萄酒行业毫不妥协的态度不仅与审美有关。“葡萄酒交易商和作家不想让公众获得奥利提供的那种信息,”凯泽评论道,“事情始于八六年陈酿。奥利称之为骗局,因为那一年很糟糕,下了很多雨,气温也不够高。不过,当时所有葡萄酒作家都在唱赞歌,称之为伟大的年份酒。奥利是正确的,但正确并不总是受人欢迎。”
通过维持对于葡萄酒品质的信息垄断,葡萄酒交易商和作家可以从中获利。交易商通过长期高估的初始评价稳定价格。《葡萄酒观察者》和《葡萄酒先锋》维持着葡萄酒品质主要评判者的地位,并以此获取数百万美元收入。正如厄普顿·辛克莱(以及现在的阿尔·戈尔)所说,“当一个人的工资取决于他对某件事情的不理解时,你很难让他理解这件事情。”同样的道理也适用于葡萄酒。“许多人的生计取决于葡萄酒饮用者对于这个公式的不信任,”奥利说,“他们突然之间变得有些过时了,这使他们感到愤怒。”
你可以看到一些变化的迹象。伦敦佳士得国际葡萄酒部门主席迈克尔·布罗德本特以外交家的口吻表述这件事:“许多人认为奥利是个怪人,我认为他在许多方面的确如此。不过,我发现他的思想和研究每年都与事实相符。他所做的事情对于希望购买葡萄酒的人相当有帮助。”
-End-
各位左边右边的朋友,由于