【統計学「平均値」の謎】統計好きでも意外と見落としている「隠れた矛盾」を見抜く方法

4/19 6:02 配信

ダイヤモンド・オンライン

 「すべての科学研究は真実である」と考えるのは、あまりに無邪気だ――。
科学の「再現性の危機」をご存じだろうか。心理学、医学、経済学など幅広いジャンルで、過去の研究の再現に失敗する事例が多数報告されているのだ。
鉄壁の事実を報告したはずの「科学」が、一体なぜミスを犯すのか?
そんな科学の不正・怠慢・バイアス・誇張が生じるしくみを多数の実例とともに解説しているのが、話題の新刊『Science Fictions あなたが知らない科学の真実』だ。
単なる科学批判ではなく、「科学の原則に沿って軌道修正する」ことを提唱する本書。
今回は、本書のメインテーマである「再現性の危機」の実態に関する本書の記述の一部を、抜粋・編集して紹介する。

● 20人のアンケートの平均が「3.08」にはならない場合

 たとえば、20人の参加者が対象を0~10の整数で評価した場合、平均が3.08になることはあり得ない(前回記事)。

 20で割るときに、小数点以下は「.05」刻みにしかならないからだ。3.00や3.10、3.15になることはあるが、3.08はあり得ない。ブラウンとヘザーズは、出版されている心理学の論文から71本を選んでGRIMテストをおこなった。すると、半分の論文が少なくとも1つのあり得ない数値を報告しており、20%に複数のあり得ない数値が含まれていた。

 スタットチェックと同じように、GRIMテストで発見された誤りには無害な理由によるものもあるが、さらに詳しい調査が必要だという警告なのだ。GRIMテストは、この論理をより大規模なサンプルに適用する。

 実はここで3.08という数字を例に挙げたのは、GRIMテストの歴史において、さらには一般的な心理学研究の歴史において、注目に値する数字の1つだからだ。2016年に心理学者のマッティ・ハイノは、史上最も有名な心理学論文の1つにGRIMテストを適用した。レオン・フェスティンガーとジェームズ・カールスミスが1959年に発表した「認知的不協和」に関する論文だ。

● 「楽しい作業だと思い込もうとする」人間心理

 認知的不協和とは、今では広く知られている理論で、人は自分の本当の考えと矛盾する言動を強要されると、心理的に不快感を覚え、それを解消するために自分の考えを変えて言動に合わせようとする。1959年の実験で、参加者はペグボード(パンチングボード)の穴に差したペグを回し続けるなど、退屈で無意味な作業をさせられた。作業が終わると一部の参加者に1ドルの報酬を渡し、次に同じ作業をする参加者に、とても興味深くて楽しい作業だったと伝えさせた。実験後のインタビューでは、1ドルをもらって楽しい作業だと嘘をついた参加者は、報酬をもらわなかった参加者より、はるかに楽しい作業だったと答えた。つまり、彼らは楽しい作業だと思い込むことによって、心理的な不協和を和らげていた。

● 「聡明で印象的な研究」の落とし穴

 ただし、ハイノがGRIMテストを使って指摘したように、この実験では参加者の感覚だけでなく、フェスティンガーとカールスミスの数字も矛盾していた。彼らは20人のサンプルの平均を3・08(0~10の整数で作業のおもしろさを評価)と報告しているが、これは、あり得ない数字だ。ほかにもいくつかの平均の値がGRIMテストに合格しなかった。

 認知的不協和は直感的に理解できる有用な概念であり、フェスティンガーとカールスミスの実験は聡明で印象に残るものだった。しかし、長年にわたり彼らの研究を引用してきた大勢の研究者は、あり得ない数字で埋めつくされていることを知っていても引用しただろうか。この件は科学文献から得られた「古典的な」知見、つまり、最も厳密に検証されたと思いたいものでさえ、まったく信頼できないときもあることをあらためて気づかせる。最も重要な部分であるはずの数字やデータが、注目を集めるストーリーをつくるためのまやかしにすぎないのだ。
 数値の間違いは、はるかにリスクの高い科学分野でも、不安になるほど多く見られる。

 (本稿は、『Science Fictions あなたが知らない科学の真実』の一部を抜粋・編集したものです)

ダイヤモンド・オンライン

関連ニュース

最終更新:4/19(金) 6:02

ダイヤモンド・オンライン

最近見た銘柄

ヘッドラインニュース

マーケット指標

株式ランキング