「山羊座の人は12月に死ぬ可能性が高い?」→統計学者の解説にスッキリ納得!

4/18 18:02 配信

ダイヤモンド・オンライン

 世の中の出来事の中には、明らかに関連性があるように見えて、まったくの偶然ということもある。たとえば米国では「ベッドでシーツに絡まって死亡した人の数」と「1人当たりのチーズ消費量」の変化はほぼ一致しているという。こうした統計的な相関関係を見て、因果関係があると思うことから、時には陰謀論や都市伝説が生まれたりもする。統計の正しい見方について、統計学者が解説する。本稿は、ジョージナ・スタージ著・尼丁千津子訳『ヤバい統計 政府、政治家、世論はなぜ数字に騙されるのか』(集英社)を一部抜粋・編集したものです。

(注)各国の通貨は、国際通貨基金(IMF)のデータをもとに、可能な限り、当時の為替レートで円に換算して( )で記している。
● 相関関係、相互関係、因果関係 似て非なるそれぞれの意味

 相関関係は因果関係を意味しない。

 読者のみなさんは、この言葉を言い換えたさまざまな表現を知っているかもしれないし、それらの意味もすでによくわかっているかもしれない。だが、ここでひと息ついて、この言葉を細かく見てみよう。

 「相関関係」とは、2つの物事において、片方が取る値を見ればもう片方の値をだいたい予測できるというように、互いに関連している現象のことだ。相関関係は、相互関係、すなわち2つのあいだになんらかのつながりがあることを意味している。

 相互関係とは、物事のあいだの「関連性」という意味でもある。だが、とても重要なのは、物事が関連しているからといって、必ずしも片方がもう一方の「原因」であるわけではないという点である。もちろん、そうである場合もあるが、相関関係のみではそこに「因果関係」があるかどうかや、その因果の方向性については断言できない。

 明らかに関連性があるように見えても、まったくの偶然ということもある。そういった「疑似相関」の奇抜な例を、ただひたすら紹介するウェブサイトも存在する。たとえば、米国では、「ベッドでシーツに絡まって死亡した人の数」の経時的な変化は、「1人当たりのチーズ消費量」の変化とほぼ完璧に一致しているという。奇妙なことに、確かにどちらも経時的に増加している。

 ただし、そういった偶然の一致は稀だ。2つの現象がほぼ並行して変化しているときは、たいていの場合、両者には実際につながりが存在する。それでも、それはどちらかがそのパターンをつくりだしているという意味では必ずしもない。

● 高級スーパーが出店すると 近所の家の価格が上昇する?

 2022年に発表された研究では、「英国北部地方の人は英国南部地方の人と比べて、難聴になる可能性が1.85倍高い」と判明した。もしかしたら、北部出身の伝説のバンド、オアシスを聴いていたことが原因だろうか。冗談はさておき、この論文の著者たちが指摘しているとおり、「北部地方」と「難聴」のつながりは、「製造業で働く」といった難聴の要因の多くが、南部より北部地方に多く見られるというものだ。地理的な要因自体は単なる関連づけだ。

 2017年、ロイズ銀行はある現象を発見し、それを「ウェイトローズ効果」と名づけた。その現象とは、高級スーパーマーケット「ウェイトローズ」が近所にできると、家の価格が約3万6000ポンド(約520万円)上昇するというものだ。

 「高級スーパーマーケットが自宅のすぐ近くにあったらいいと思うなら、家の購入額は高価格帯になる」と同銀行は説明している。だが、「ウェイトローズの新規開店が住宅価格の上昇をもたらす」という説は、単なる憶測にすぎなかった。

 ウェイトローズ(高級スーパーマーケットだけあって、商品の価格も高価格帯中心だ)側が、すでに富裕層が多い地区を狙って出店したとも考えられるからだ。つまり、逆向きの因果関係もありうるということだ。さらには、通勤に便利という理由で富裕層のあいだで人気になったことが、その地区の住宅価格とウェイトローズの出店場所の両者に影響を及ぼすといった、第3の要因も考えられる。

● 「山羊座は12月に亡くなりやすい」 統計職員も認めざるを得なかった

 以前、ある国会議員から英国下院図書館に、いっぷう変わった問い合わせがあった。「山羊(やぎ)座の人は12月に亡くなる可能性が高いというのは、本当ですか?」。当番の統計職員が星座別の死亡数に関するデータを調べてみると、当の国会議員が思っているとおりとなる可能性が高そうだと認めざるをえなかった。

 その理由についてここであれこれ考察したいのであれば、山羊座の人が不運にもその時期に亡くなる可能性が高い理由を、いくつか挙げるのは決して難しくない。

 たとえば、山羊座は何事に対しても責任感が強いため、絶え間なく続く仕事に加えて家族との約束も果たさなければならないクリスマスも重なる年末に、燃え尽きて亡くなってしまう可能性が高いのかもしれない。あるいは、物事を悲観視しがちな山羊座特有の性格によって、寒くて暗い年末がまた来るのかという思いにつぶされてしまうのかもしれない。

 だが、そういった理由より、「誕生日効果」と呼ばれているものが寄与している可能性のほうが高い。人間の誕生日と死亡する日には相関関係があることが、さまざまな研究で示されている。具体的には、誕生日の前後1週間のあいだに死亡する可能性が高まるという。その理由の1つとされているのは、誕生日を迎えるのが憂鬱になった高齢者や、誕生日までは「なんとかもちこたえた」が、その直後に耐え切れなくなってしまったという人々が、自殺する恐れが高まることだ。

 そのため、12月22日から1月19日生まれの山羊座の人は、12月に亡くなる可能性が最も高いといえるのかもしれない。ただし、同じ理屈を当てはめれば、私たちはみな、自分の星座と結びついている誕生月に亡くなる可能性が高いのだ。

● 人間は無関係なものに関係を見出す それを重要なように見せるのも容易

 そんなわけで、星座と死亡する日にはつながりがあるようだが(というより実際にある)、それらを結びつけているのは「誕生日」という第3の要因だ。それは「交絡因子」や「潜伏変数」と呼ばれている。

 世間での星占いの人気を見ると、実際には無関係なもの同士のあいだにつながりをつくりだすことに、人がいかに長けているかがわかる。タイタニック号が沈没した原因は「水星の逆行」あるいは「稀な惑星直列」だったのだろうか。

 その可能性はほぼないだろう(注:タイタニック号が沈没する原因となった氷山は、過去数世紀で地球から最も近い位置にあった月が起こした通常よりも高い大潮によってできた可能性がある、という科学的な説もある)。それでも、「起きていることには理由、理屈、パターンがある」と信じることによって、人は安心できるのだ(そう信じることが、精神衛生上必要なときさえもある)。

 こうしたことから浮かび上がる問題点は、2つの物事の関連性が単なる偶然にもかかわらず、あたかも重要なものであるかのように見せるのは簡単だということだ。たとえば、「チーズを食べる量」と「シーツで死亡する」例のように。

 大きなデータセットを十分に長いあいだ掘り返せば、統計的に有意な結果を「採掘」できることは、すでに示されている。これは、星座についてもまさに行われてきたことだ。

 研究者たちは1000万人分の巨大な医療データセットを分析して、高度なモデルを構築し、すべての正しい手順を踏んだ結果、「獅子(しし)座の人は消化管出血を起こす可能性が高い(P=0.0447)」「射手(いて)座の人は上腕骨骨折を負う可能性が高い(P=0.0123)」と結論づけた。

 この2つの「P」の値は、それらの結果が統計的に有意であることを示している。この事例の結果については、常識的に考えれば却下できる。一方、もっともらしい説明をされて、結果をつい額面どおりに受け取ってしまいたくなるような事例もある。

ダイヤモンド・オンライン

関連ニュース

最終更新:4/18(木) 18:02

ダイヤモンド・オンライン

最近見た銘柄

ヘッドラインニュース

マーケット指標

株式ランキング