相関関係と因果関係を混同しないように気をつけよう



世の中には因果関係と相関関係を混同しているように見える事例が多い。

相関関係というのは、「AとBが同時に起こっていること」を意味する。
「風が吹いたら桶屋が儲かった」という事象が起こったならば、「風」と「桶屋」には相関関係がある。

因果関係は「Aという原因によってBという結果が生じた」ことを意味する。
AとBに明確に「原因」と「結果」の関係があるならば、AとBには因果関係があるといえる。
風が吹いたら必ず桶屋の売上が上がるのであれば、「風」と「桶屋の売上」には因果関係がある。

片方につられてもう片方も変化しているように見えるものの、原因と結果の関係にない場合は「擬似相関」といわれる。


『「原因と結果」の経済学』で取り上げられた事例を見てみよう。


都道府県別の体力テストと学力テストの平均値をグラフにして見てみると、

「体力がある子どもは学力が高い」

ように見えた。

体力テストの合計点が高い子どもほど、国語や数学のテストの正答率が高かったのだ。

「体力」と「学力」には相関関係があるように見える。

ここに因果関係はあるだろうか。
もし因果関係があるのならば、「体力をつけさえすれば、全く勉強しなくても学力を上げることができる」ということになる。

しかしこれはあまりにも乱暴な結論だろう。

子どもの体力にも学力にも両方影響している「第3の変数」があるかもしれない。

たとえば、「親の教育熱心さ」

教育熱心な親は、子どもにスポーツを習わせたり、食事に気をつけたり、一緒に外で遊んだりもするだろう。
それと同時に子どもに勉強するように仕向けるだろうから、学力も高くなる傾向がある。

この場合、子どもの学力を上げているのは「体力」ではなく、「親の教育熱心さ」となる。


「体力がある子は学力も高い」

などと誰かが煽って、子どもに体力修行をさせまくったとしても、それだけでは子どもの学力は上がらない。


「読書をしている子どもは勉強ができる」

なども昔から言われているが、読書をしているから子どもの学力が高い(因果関係)のではなく、学力の高い子どもが読書をしているのにすぎない(相関関係)可能性もある。

この場合、第三の要因としては、「子どもに対する親の関心の高さ」が挙げられる。

教育熱心な親が子どもと一緒によく本を読んでいたから、子どもに読書の習慣がついたのかもしれない。
子どもに本をよく買い与える親は、塾や参考書にもお金をかけてくれる傾向があって、それが原因で学力が向上したのかもしれない。


このように2つの出来事の関係が因果関係なのか、相関関係なのかを判断するのは難しい。
因果関係を明らかにするうえで最も確実な方法は「ランダム化比較試験」である。

ランダム化比較試験とは

ランダム化比較試験とは何だろうか?

ここに野球界で名の知れた怪しい博士がいたとしよう。
その名をダイジョーブ博士という(実況パワフルプロ野球より)

彼は自信満々にこう言った。

「ワシの薬を飲んだらお前の打率は1割上がるぞい」

f:id:hideyoshi1537:20191220184647p:plain

何やら胡散臭い臭いがする。

「ぼくのnoteを買えば稼げますよ」などとのたまう情報商材屋と同じくらい胡散臭い。


勇気ある鈴木一郎君が「わかりました。やります」と、ダイジョーブ博士の薬を飲み、その次のシーズンで4割バッターになった。

鈴木君の躍進はダイジョーブ博士のおかげなのだろうか?

答えは「わからない」だ。

もしかしたらバッティングコーチが代わったのがきっかけで彼の中の“イチロー”が覚醒したのかもしれない。

仰木監督が鈴木君の才能を認めてくれたおかげで、出場機会に恵まれたのかもしれない。

鈴木君の活躍が「ダイジョーブ博士の薬による効果なのか(因果関係があるのか)、それとも別の要因によるものなのか(相関関係があるだけなのか)」は、実験してみないと明らかにならないのだ。

では、どうしたらいいか。

まずは大量の野球選手を集めよう。
同じ顔に見えるが、全員別人だ。

f:id:hideyoshi1537:20191220185706p:plain

画像引用元:歴代サクセスキャラクター紹介その1 |ファミ通.com 歴代サクセスキャラクター紹介


次に大量に集めた選手たちをランダムに2つに分ける。

「ダイジョーブ博士の薬を投与する選手たち」

「ダイジョーブ博士の薬を投与しない選手たち」

である。

f:id:hideyoshi1537:20191220190036p:plain

もしダイジョーブ博士の薬を投与した選手たちの方が、投与しなかった選手たちに比べて打率が高くなっていたならば、

「打率の上昇分はダイジョーブ博士の薬の効果だった」

と因果関係を証明することができる。

なお、2つのグループの間で「観察された差が偶然の産物である確率」が5%以下であるときに「統計的に有意である」という(5%は慣習的に用いるものだ)

ランダム化比較試験について興味がある方は『「原因と結果」の経済学』を読んでみてほしい。
この記事よりも100倍わかりやすく、詳しく解説されている。

「原因と結果」の経済学―――データから真実を見抜く思考法

「原因と結果」の経済学―――データから真実を見抜く思考法

  • 作者:中室牧子,津川友介
  • 出版社/メーカー: ダイヤモンド社
  • 発売日: 2017/02/17
  • メディア: 単行本(ソフトカバー)


実はここまでが長い長い前置きだったのだが、この記事の主題は

「ネットでは相関関係と因果関係が混同されてそうな事例がよく見つかるから、立ち止まって考える習慣をつけようね」

というものだ。

特にインフルエンサー的な人や、成功した起業家の発言は因果関係が怪しくても信じられやすい。
影響力のある人の発言をなんでも素直に聞くだけでなく、たまには「本当に因果関係があるのかな?」と考えてみるといい。


インスタグラムを使っているスポーツ選手は成績が良い?

リンク先のインスタグラムの公式ブログでは

今後一層の活躍が期待されるアスリートのうち、78%が週1回以上、Instagramを使っているという結果も出ています。
さらに、その74%が、Instagramが競技パフォーマンスにポジティブな影響を与えていると考えていることがわかっています

と、自信満々で「インスタグラムのポジティブな効果」が語られている。

インスタグラムの利用とスポーツ成績の向上に因果関係はあるのだろうか?

もしかしたら「今後が期待されて、成績が向上している選手」だからこそ、インスタグラムに投稿するモチベーションが高いのかもしれない。

誰だって、何の活躍もしていない惨めな状態でインスタなんてやりたくないだろう。

だから僕はインスタをやめた。

また、「高成長層」のインスタには

  • 投稿に一貫性があり、
  • スポーツに関する自分の考えを投稿しており、
  • 自分の好きな商品を紹介している

などの特徴があるらしいが、これも「結果を出しているからこそ一貫した投稿ができる」だけかもしれないし、結果も出ていない低成長層が「スポーツに関する自分の考え」を投稿しても失笑されるだけだろう。

スポーツの成績とインスタグラムの投稿には相関関係はあるかもしれないが、因果関係があるとは言い切れないのではなかろうか。


oreno-yuigon.hatenablog.com

お金は使えば使うほど増えるのか?

世界の前澤友作はことあるごとに

「お金なんて貯めるな、使え」

と主張している。

友作はたしかに大成功者だ。

1000億円を記帳した友作がお金について語ると何でも正しそうに見える。

しかしながら、友作のような「例外中の例外」の発言を鵜呑みにするのは危険だ。
友作は「例外である自分自身」の成功体験を元に、割と適当に発信しているので、普通の人が真似したら破滅する可能性もある(逆に大成功する可能性もある)

こういうことを書くと、「小せえ男だな」とか「ビビってんじゃねえよ」みたいにディスられがちなのだが、これは器の大きさや臆病さの問題ではない。


世の中にはものすごくお金を稼いでいる人はいる。
お金を稼ぎまくっている人の中には「お金を使いまくった」人もいる。

しかし「お金を使いまくったから、お金を稼げるようになった」みたいに、「散財」と「お金を稼ぐ能力」に因果関係があるとは限らない。

それなのに友作のようなお金持ちの発言を鵜呑みにして、というか免罪符にして、

「俺もお金を使いまくって金持ちになるぜえ」

と欲望のままにお金を使ってしまうと、後になって思ったようにお金も稼げず困窮してしまう人が出てくるのではないか。

「お金を使わず貯蓄していたことが、将来のチャレンジの資本となった」人だっているかもしれない。

剛力を抱き、紗栄子の結婚圧を封じたセイコウ者の友作である。

彼のようなセイコウ者の発言に魅力があるのはたしかだが、何でも鵜呑みにするのは危険だ。

本当に「今お金を使えば、将来お金が増えるのか」は自分の頭で判断しよう。
もちろん、お金を使えば稼ぎまくれる可能性もある。


oreno-yuigon.hatenablog.com

子供を全員東大に入れた親の勉強法は正しいのか?

中室牧子先生の『「学力」の経済学』では、

自分が病気になったときに長生きしているだけの老人に長寿の秘訣を聞きに行く人はいないのに、子供の成績に悩む親が、子供を全員東大に入れた老婆の体験記を買うのは不思議だ。

たった一人の個人の体験記ではなく、個人の体験を大量に観察することによって見出される規則性こそが信頼に値する。

と述べられている。

難関大学や難関資格試験の合格体験記では、どうも武勇伝が称賛されやすい。

「成績最下位から一流大学に合格した私の勉強法」

みたいな個人の体験談を過剰に信じ込み、真似をして、多くの人が失敗する。

自分の子どもを全員東大に入れた母親が受験界のカリスマとして崇め奉られ、「子どもを東大に入れる勉強法」みたいな本を出版するのはよくあるが、その人の勉強法を真似したところで読者の子どもが全員東大に入れるわけではない。

学力は遺伝や環境による影響も大きい。

ある人、ある家庭、ある状況でうまくいった勉強法が、「万人に効果があるか」はきちんと実験しないと証明できないのである。

ランダム化比較試験の限界

ここまで「実験しないと効果は証明できない」と散々述べてきたが、ランダム化比較試験は費用がかかる。

人を集め、ランダムに振り分け、その施策の効果を比較しなければならない。
ウェブサイトのA/Bテストなどを除き、ランダム化比較試験を個人で実施するのは難しいし、全ての「体験談」にエビデンスを要求するのは酷だろう。

意思決定の速さが勝敗を決する場合もあるわけで、いちいち実験の結果を待ってられない人も多い。

そのような事情も踏まえ我々一般人は、

  • 相関関係があっても因果関係があるとは限らないこと
  • 因果関係を証明するためには実験が必要なこと
  • エビデンスにはレベルがあること
  • 個人の体験談や専門家の意見はエビデンスとしては最もレベルが低いこと

を理解しておき、怪しい話に安易に飛びつくことなく、それぞれの情報の信頼性を判断する姿勢を持つよう習慣づけておくのが良いだろう。

無論、できる限りレベルの高いエビデンスを集める努力も忘れてはならない。

「学力」の経済学

「学力」の経済学

  • 作者:中室 牧子
  • 出版社/メーカー: ディスカヴァー・トゥエンティワン
  • 発売日: 2015/06/18
  • メディア: 単行本(ソフトカバー)