◇◇新语丝(www.xys.org)(xys4.dxiong.com)(www.xysforum.org)(xys2.dropin.org)◇◇ 极值理论(Extreme Value Theory) MrMathematica节译自《25 Big Ideas》,ISBN 1-85168-391-7,原作者Robert Matthews 简述   每过一段时间,小概率事件就会发生,比如巨大的台风,或者跳高纪录被 打破。但是到底这样的事件有多极端?极值理论(Extreme Value Theory)可以回答 这个问题。利用以往的记录,比如说500年来的洪水记录,极值理论就可以预测将 来发生更大的洪水的可能性。   极值理论19世纪20年代被数学家发明。长久以来,因为其魔法般预测从未发生 过事件的能力,它往往受到人们的质疑。但是现在EVT正在获得越来越广泛的应 用,从金融风险评估到海事安全等等,也越来越受到人们的信任。一个重要的应用 领域是保险行业,EVT被用来计算重大灾难发生的可能性,并由此来确保必要时有 足够的赔付资金。 正文   某时某地,几百年来未见的事情就会发生。2002年5月的一周,300多个龙卷风 横扫美国中西部,造成超过十亿美元的财产损失;2003年8月,热浪席卷欧洲,仅 法国就有超过14,000人死于高温;即使太阳也来凑热闹,11月太阳耀斑大爆发,迫 使许多飞机修正航线以避开宇宙辐射。   我们能做什么?如何防范自然界可能发生的灾难?小概率事件促使人们思考这 类问题。   随着越来越多出人意料事件的发生,人们越来越关注一种能够处理小概率事件的 技术。极值理论(EVT)可以预见数年,几十年,甚至几个世纪以后的极端事件。   在全球范围内,政府使用EVT来预测极端事件的可能性,并以此为依据进行准 备;在金融界,EVT被用来评估自然灾难风险,并由此来确保必要时有足够的赔付 资金;同样EVT被用来保护船只航海时可能遇到大风暴的危险;它甚至可以帮助生 物学家确定人类生命的极限。   不论是哪个领域,EVT都使用以往极端事件的数据来计算将来可能发生的事件 ——包括新的、超过过往任何纪录的事件。这听起来像是奇迹,所以有些情况下EVT 还是受到质疑。不过支持者们指出,EVT有着健全的(sound)的数学基础,而不仅仅 是经验公式(rule of thumb)。   EVT的发展最早可以追溯到十八世纪的瑞士数学家Nicolas Bernoulli(尼古拉· 伯努利),但是直到20世纪20年代,预测新纪录的想法才真正吸引了人们的注意。 EVT的中心思想是概率分布,即给出事件发生概率的数学公式。比如说,人的身高 服从高斯分布,所以大部分人的身高都距离平均身高不远。而高斯分布长而窄的两 个“尾巴”表示有些人特别的高,或者特别的矮。   高斯分布是一种非常常见的分布,许多现象都服从高斯分布。所以早期的数学 家使用高斯分布来计算极端事件发生的可能性。但是在1920年代,数学家们感觉到 高斯分布的“尾巴”不能很好的预测小概率事件。1928年,剑桥数学家R.A.Fisher和 同事L.H.C.Tipper发表了他们著名的关于EVT的论文,表明小概率事件服从另一种 概率分布。同高斯分布一样,如果事件越极端,其发生的概率就越低。如果要计算 具体的发生概率,只要使用以往该极端事件的发生情况拟合曲线就行了。比如说, 使用往年某沿海地区海浪最高高度的数据,就可以预测将来该地海浪的最高高度, 包括创纪录的新海浪高度的可能性。   尽管EVT可以应用在很多领域,但是人们始终对其存有怀疑。直到1940年代, 情况才改观,一是因为苏联数学家Boris Gnedenko在数学上严格地证明了EVT所使 用的公式,二是因为德裔美国科学家Emil Gumbel将EVT应用于预测洪水并取得了巨 大的成功。   1953年2月,一次巨大的风暴冲垮了荷兰海堤,冲毁了47,000间建筑,超过 1800人遇难。人们需要防止此类事件的发生。一群专家被召来研究以往的洪水记 录。他们发现,1953年的洪水并不是史上最大的。1570年11月1日,包括荷兰在内 的数个欧洲国家被超过4米高的海浪淹没——至少比1953年的洪水还要高15厘米——估 计有400,000人因此丧命。   专家组面临的问题是,到底防护海堤要造到多高,既不至于过高——造成不必要 的成本支出,又不至于过低——以至于洪水没顶。最后的结论是,5米高的海堤可以 保护荷兰数千年。这个结论有多可靠呢?由鹿特丹伊拉斯谟大学Laurens de Haan 领导的小组使用EVT对专家组的建议进行验算。使用历史记录和EVT分布,他们的计 算显示5米高的海堤可以保护荷兰许多个世纪。   现在EVT被广泛应用于计算堤坝的高度。但是有时候错误也会发生。1996年, 兰开斯特大学的数学家们发现在使用EVT设计英国800公里长的海堤时出现了错误, 导致某些地段的堤坝比设计需要低了整整两米。   不出意外的,最早使用EVT的一个领域就是保险行业。许多年来,精算师们使 用各种各样的经验公式来估计灾难事件发生的可能性,比如“20——80”公式,也就是 百分之20的极端事件会导致百分之80的理赔。1990年代中期,苏黎世联邦理工学院 的金融数学家Paul Embrechts和同事们决定使用EVT来检查这类经验公式的准确 度。他们发现,“20——80”公式在很多领域都是准确的,但是在某些情况下,却完全 不成立。比如说,EVT表明飓风造成的损失符合“0.1——95”公式,也就是说,千分之 一的风暴会导致百分之95的理赔。这类研究对于保险行业起了很大的帮助,保险公 司以及投保客户都受益与足够的理赔准备金。   与此同时,一系列金融危机事件的发生也促进了EVT在定量分析领域的应用。 1995年2月,世纪著名商业银行巴林银行其新加坡分行一名交易员Nick Leeson(尼 克.李森)的交易就成了将近九亿美元的损失。几个月后,日本大和银行发现其一 流氓交易员Toshihide Iguchi(井口俊英)就造成了七亿美元的亏损。正是这类事件 的连续发生促使美联储主席Alan Greenspan(艾伦·格林斯潘)建议在金融风险领域 运用EVT。   如果这一建议得到实施,一个更大的金融灾难就可以被避免。1998年夏,俄罗 斯发生金融风暴。俄政府作出了一个无法想象的决定:拖欠国债的偿还。这一决定 是如此的出人意外,以至于美国长期资本管理公司(Long-Term Capital Management)——一家主要从事定息债务工具套利活动的对冲基金——出现了一千亿美 元的亏损。最终美林、摩根等大银行出资收购接管了LTCM。但是最为惊人的是, LTCM公司准备不足:其预计的最坏情况下损失只有实际损失的60%。   因为这一事件,人们开始研究金融基金经理是如何估计风险的,却发现LTCM一 直使用高斯分布来估算损益。但是早在70年前,数学家就指出,在极端的情况下, 基金的损益遵从另一种概率分布——而且使用高斯分布往往会导致低估风险。如果 LTCM接受格林斯潘的建议,使用EVT方法估算损益,有可能事情不至于发展到这么坏!   现在,越来越多的行业开始意识到EVT的有效应用,包括人类生物学和航海工 程。在鹿特丹伊拉斯谟大学,Laurens de Haan领导的小组还使用EVT来估计人类生 命的极限。分析历史上最长寿的人的记录,他们发现人类寿命的极限是124岁。 (译者注:再次说明某些号称人类寿命可以再翻一倍之类的说法有多荒谬。)到目 前为止,这看起来是真的:目前有确切纪录的最长寿的人是法国人Jeanne Calment(雅娜·卡尔芒),1997年逝世,终年122岁。   1980年,日本巨型散装船Derbyshire(德比郡号)在一次台风中沉没,44名船员 失踪。由此造成了长久的争议,到底该船是因为设计失误而沉没,还是因为船员操 作不当?1997年的调查报告认为是后者。但是三年后,新的调查报告断定船员无 罪:兰开斯特大学的EVT专家Jonathan Tawn教授和Janet Heffernan博士帮助找出 了事故的真正原因:一个异常波浪(freak wave)打穿了船的前舱。该研究还建议船 只大幅度加强前舱的强度,以防止类似事件再次发生。   结果,高深的数学理论EVT再一次帮助人类——这一次是提高海员们的人身安全。 插曲:当事情开起来不像是真的   每隔四年,运动员们就会在奥林匹克赛场上争取打破世界纪录。但是有时候, 世界纪录不仅仅是被打破——而是被彻底的刷新。但问题是,这样的纪录可信吗?极 值理论可以回答这个问题。   以九十年代中国中长跑运动员王军霞为例,在1993年北京全运会上,她只用8 分6秒就跑完了三千米——比原来的世界纪录整整快了17秒。这是一个真实的成绩 吗?药检的结果是阴性,但是至今很多人还是不相信王军霞是清白的。兰开斯特大 学的数学家Michael Robinson和Jonathan Tawn决定使用EVT来分析。使用以往 (1993年之前)的纪录,他们的计算表明,最终的世界纪录——也就是人类能够达到 的最好成绩——为8分3秒。也就是说,尽管王军霞的成绩非常惊人,但是还是比人类 极限要慢上3秒。 (XYS20090913) ◇◇新语丝(www.xys.org)(xys4.dxiong.com)(www.xysforum.org)(xys2.dropin.org)◇◇