主页 > H鲜生活 >解开高斯相关性猜想,退休统计学家汤玛斯罗炎刷牙时的神来一笔 >

解开高斯相关性猜想,退休统计学家汤玛斯罗炎刷牙时的神来一笔

2020-08-05来源:H鲜生活
点赞:328
解开高斯相关性猜想,退休统计学家汤玛斯罗炎刷牙时的神来一笔

2014 年夏天的某一个清晨,阳光如往常一样穿透白色窗帘照了进来,汤玛斯罗炎起身前往浴室盥洗,一边刷着牙一边回想昨晚入睡前那个证明。突然间,一道灵光射进了罗炎的脑袋,困扰数十年的高斯相关性猜想终于攻破了大门!

连结机率、统计与几何的猜想

高斯相关性不等式有许多不同的版本,其中最着名的是 1972 年连结机率、统计以及几何三大领域的版本:

想像一个射飞镖游戏,以正中红心为目标射许多次,飞镖落点会以红心为中心呈现类似钟形的高斯分布,如果以红心为中心点同时画一个圆和一个方形,高斯相关性不等式即是说:飞镖落在圆和方形的交集的机率会大于或者等于落在圆形的机率乘以落在方形的机率。

解开高斯相关性猜想,退休统计学家汤玛斯罗炎刷牙时的神来一笔

P≥ P╳ P

这里不同于下面这种大家比较熟知的独立事件机率,若 A 跟 B 是统计独立的两事件,则我们会有这个等式:

P= P╳ P

事实上,GCI 猜测是针对任意维度 d 都成立,且两个同中心的形状只要是具有对称性的凸集即可。

关于信赖区间

GCI 猜想的原始型态是统计学中关于信赖区间的估算,由美国统计学家奥利佛·丹在 1959 年首次提出。

想像我们要针对一群人,给出一个身高和体重的範围,使身高体重同时落在此範围内的人数佔全部的 90% 以上。 这任务可不太容易,因为人的身高和体重是彼此相关,并非独立的。假设身高和体重分别都呈现高斯分布的情况下,依据 [68-95-99.7 法则] 我们知道

P≥ 95% 。
也就是说,如果身高和体重标準差分别是 7 和 8,我们会知道
P≥ 95%
P≥ 95%

再由高斯相关性不等式可以推得

P≥0.95╳0.95 = 0.9025

维度 d=2 的情况早在 1977 年就被维吉尼亚大学的罗伦·彼特教授证明出来。受访时,罗伦缓缓地闭起眼睛,说起 1973 年某次和同事吃午餐时听到这道「简单」的数学问题时的回忆:

「嘿~ 罗伦,你知道有个有趣的数学问题 GCI 吗? 就是想像一个射飞镖游戏,然后…」

「听起来蛮有意思的,老墨~不过,你说这个还没有人解出来?」语气显得有点疑惑。

「嗯!还没有。」

「不太可能吧! 看起来不太难啊,应该很快就可以知道答案了」我心里当时这幺想。

「于是,我把自己关进一间房间,打算当我再次走出房门时就已经证明 GCI 是正确的或者错了。」

说到这里,罗伦张开眼睛望向窗外不发一语。一转眼已经过了将近四五十年……

汤玛斯·罗炎

故事回到解开谜底的汤玛斯·罗炎身上,今年已经 70 岁的他是德国一位退休统计学家,在这次事件之前可能没甚幺人听过他,这点倒是和前几年美国华裔数学家 张益唐 有点像,某天突然灵光一现洞悉真理的故事在数学界也不算少数,不过这次倒是有几点值得特别一提的趣事。

要解决一道难题不妨先把它变得更难

首先,数学界有件事情是外界的人难以想像的。「经常发生一种情况是,解决一道看起来很困难不会解的问题的方法是把这个问题推广成一个更难的问题,然后解决它。」

听起来有点荒谬,打个比方,就好像是一个屡次练习时连 10K 都跑不完的跑者,居然去挑战极地超马想藉此证明自己可以跑完 10K。罗炎的证明就是走这个套路,把猜想中高斯分布这个条件推广到更複杂更一般的情况。神奇的是,问题居然就这样解了,证明还只用了 3 页!

差点沉没的宝石

第二,这个影响重大的论文罗炎居然把它投稿到一个名不见经传的印度期刊,因此使得他的论文 2014 年发表之后又过了两年,才渐渐引起学术界的注意。一颗璀璨的钻石差点就沉没汪洋大海之中。一个学术上极重要的成果发表两年后才传播开来,在这个通讯发达的年代,几乎是怎幺想都不太可能发生的事情。

不过不太可能发生的事情终究发生了。

峰迴路转

先来谈谈 2014 年发表论文的经过,罗炎不会用数学界编辑论文常用的 LaTeX 软体,论文初稿是用 Word 打的,完成后一份丢上 arXiv,一份寄给一年半以前曾指出他在一篇尝试证明 GCI 的论文中所犯之错误的宾州州立大学丹诺·理查德斯教授,当理查德斯收到信件时,一眼他就知道「Bingo!就是你了!」

事后回想起来,理查德斯有几分懊恼,这个精简的证明居然自己三十几年来都没有想到。这种心情搞数学的人一生中或多或少都会遇上个几次吧。

不过,他也庆幸能在有生之年看到 GCI 的美妙证明问世。理查德斯兴奋之余还不忘将这个重大发现通知几个同事,也热心的帮忙把论文重新用 LaTeX 编辑,让它看起来专业一点,符合顶尖期刊的水平。

可惜的是,投稿出去还是撞墙,原因是过去数十年来声称证明 GCI 猜想的论文每年都有一箩筐,期刊的审稿委员看都看腻了,通常一下子就能指出关键性的错误所在,要是碰上像罗炎这样没没无闻的家伙,通常也不会太认真对待。

罗炎的论文因此被草率忽略了!

罗炎的论文因此被草率忽略了!!

罗炎的论文因此被草率忽略了!!!

虽然有人曾建议罗炎投到最顶尖的期刊,像是统计年鉴,这样子一来消息很快就会传到全世界,不过罗炎考量后还是决定投到很快就可以发表的印度期刊 Far East Journal of Theoretical Statistics,这种期刊的坏处就是即使刊出之后也不太有人知道这件事。一直到 2015 年底 Rafał Latała 和他的学生 Dariusz Matlak 重新写了一个简易 GCI 版本的论文,2017 年 3 月 28 日知名杂誌 Quanta Magazine 刊出一篇专栏报导 ,整个事件才得以散播出来。

最后,罗炎教授受访时表示,他希望这个意外简单的证明能够鼓励年轻的学生,善用自己的创意去寻找新的数学定理,毕竟那并不总是需要具备非常高深的理论基础才办得到。

参考文献
[1.] L. D. Pitt, A Gaussian correlation inequality for symmetric convex sets, Ann. Probab. 5 , 470– 474.
[2.] T. Royen, A simple proof of the Gaussian correlation conjecture extended to multivariate gamma distributions, Far East J. Theor. Stat. 48 , 139–145.
[3.] R. Latala and D. Matlak. Royen’s proof of the Gaussian correlation inequality. ArXiv http://arxiv.org/abs/1512.08776, 2015.
[4.] A Long-Sought Proof, Found and Almost Lost, Quanta Magazine, 2017/03/28.

相关阅读

随便看看