相関関係と因果関係

 よく云うんだけれども、「因果関係」と「相関関係」は違うよ、ってことです。

 

 まあ、有名な「ニコラスケイジの映画出演本数とプールの溺死者数」もあるけれども、やっぱりこれはよく勘違いされやすい。

全くの偶然による相関関係の図表がなんか笑える「ニコラス・ケイジが映画に出るとプールで人が死ぬ?」 - Togetter

 

 南の島の長寿村。その村では度数の高い焼酎がよく飲まれている。都市部と比べて1.5倍である。ここから「焼酎を飲むと長生きになる」という結論を導き出す、って例をよく挙げる。

 ま、そんなわけはないのであって。確かに「焼酎の消費量」と「年齢」に相関関係はあるかもしれない。でも、「焼酎を飲んだら」「寿命が延びる」という因果関係はまったくない。別の要因が隠されているかもしれない。「焼酎を飲む」のが、そのコミュニティ内での人的つながりを強くする効果を持つかもしれず、その「人との支え合い」が「寿命が延びる」という効果を持っているのかもしれない。あるいは、「あくせく仕事をしない」とかかもしれない。しかし、まあわかんない。

 

 でも、そういうトリックで効果を謳うものは少なくない。「キャリア支援の授業を取っている学生の就職率は**%で、取らない学生に比べて1.5倍ある。ここから、そういう授業が学生の就職率にいい影響があると分かった」とか、平気で云う人がいる。これも、ただの相関関係を因果関係に結びつけているいい例です。分かってて云ってるならいいけど、そのトリックにだまされる人が少なくないからやんなっちゃう。

 これは簡単なトリックであって、キャリア支援の授業を受けるような学生は、そもそも就職に関心が高い学生であって、それを取らない学生と比べてそもそもの動機づけが違う。「就職に関心のある学生の就職率が高い」というだけであって、その授業の効果があったかどうかは分からない。マイナスの影響を与えていることはないだろうけど、それが「就職率」にまで影響しているかどうかは分からんよなあ。

 プログラムの効果の有無は、厳密にやるならどうなるかな……。AというプログラムとBというプログラムを用意して、Bはプラセボ的なプログラムを行う、ってのもあるけどそれは流石にBに割り当てられた学生からクレーム続出だな。まあ、施行前と施行後で何かテストを行うことでプログラムの効果を判定するのが一番か。でも、それが「就職につながる」かどうかは実際問題、分かんないよねえ(「漢字テストの成績がいい」のと「就職できる」はまた別個だから)。すべての科目の成績をもとに、「就職できた/できなかった」の二群で判別分析かけると云う手もあるかな(ノイズが多すぎか?)。

 あ。「全員その授業を受けさせる」ことにして、それが就職率にどう影響を与えたかを見ればいいのか。

 

 たぶん、そんなに率変わらないと思うけどね。