レビュー
概要
『データ分析の力 因果関係に迫る思考法』は、データを読むときに最も重要なのに、現場ではしばしば飛ばされる「相関と因果の違い」を、一般読者にも追える形で整理した本です。著者の伊藤公一朗は、政策評価と因果推論で知られる研究者です。本書では学術的な厳密さを保ちつつ、数式を前面に出しすぎない説明を選んでいます。単に統計のテクニックを紹介する本ではありません。売上が伸びた、満足度が上がった、制度変更の後に数値が改善した。そうした変化を見たときに、「本当に施策の効果なのか」を考える姿勢そのものを鍛える本です。
本書が強いのは、データ分析を集計や可視化で終わらせず、意思決定の道具として扱っている点です。観察データには交絡や逆因果の問題が入り込みやすく、前後比較だけでは結論を誤ることがある。そこで著者は、ランダム化比較試験、自然実験、差の差分析、回帰不連続デザインといった考え方を、政策やビジネスの文脈に戻しながら解説します。専門用語は出てきますが、読後に残るのは数式よりも「どう比べれば因果に近づけるか」という発想です。データを見ているつもりで、実は物語を見ていただけだったと気づかされる本でもあります。
読みどころ
本書の第一の読みどころは、相関関係がどれほど簡単に因果関係の顔をしてしまうかを、具体例で何度も見せてくるところです。アイスクリームの売上と水難事故のような有名な話だけでなく、日常の会議でそのまま起きるような誤読が次々に出てきます。ある施策の導入後に数値が上がったからといって、その施策が原因とは限りません。季節要因、景気、対象者の違い、そもそも改善傾向にあった可能性など、別の説明がいくらでもありえます。本書はその「別の説明」を探す癖をつけてくれます。
第二の読みどころは、因果推論の手法を「難しい分析」ではなく「比べ方の工夫」として説明している点です。ランダム化比較試験が強いのは、処置群と対照群の違いを偶然に任せることで、恣意的な偏りを減らせるからです。自然実験や差の差分析が有効なのは、完全な実験ができない現実の中でも、比較可能な条件をできるだけ作ろうとするからです。回帰不連続デザインも、ある境目の前後で似た人たちを比べる発想として捉えると理解しやすいです。本書はそのロジックを順番に積み上げるので、手法名だけ知って終わる感じになりません。
第三の読みどころは、因果推論を研究者だけの道具にしていないところです。政策評価の話はもちろん出てきますが、読んでいると人事施策、価格改定、広告配信、教育プログラム、医療制度の改善など、かなり広い場面に応用できることが見えてきます。新しい施策を打ったあとに、前後差だけで成功と判断してよいのか。効果が出なかったとき、本当に施策が無意味だったのか。こうした問いに対し、本書は「比較の設計を見直せ」と返してきます。たとえば、制度変更の前後を見るだけでは景気変動や対象者の違いが混ざりますが、差の差分析や自然実験の発想を入れると、どこまでを施策の効果として読めるかが変わってきます。データ分析を報告書の飾りではなく、判断の精度を上げる作業として捉え直せるのが大きいです。
類書との比較
同じく因果を扱う本としては『「原因と結果」の経済学』がよく読まれています。あちらは日常的な主張を題材にしながら、因果を見抜く感覚を育てる本です。それに対して本書は、もう少し分析の手前と奥の両方に踏み込みます。つまり、なぜ前後比較では足りないのかという話だけでなく、ではどのような比較の設計が可能なのかまで踏み込むため、実務や研究へ接続しやすいです。
一方で、因果推論の専門書ほど数式中心ではありません。計量経済学や統計学の教科書は、手法の理論的前提を厳密に学ぶには必要ですが、初学者にはとっつきにくいです。本書はその入口としてとても優秀です。理論の厳密さを完全に捨てず、それでも一般読者が読み切れる水準に抑えているからです。ビジネス書の読みやすさと学術書の筋の良さの間に、かなりうまく立っている本だと思います。
こんな人におすすめ
会議で「その数字は本当に施策の効果なのか」と感じたことがある人にはかなり向いています。マーケティング、経営企画、人事、行政、教育、医療など、効果検証が必要な仕事をしている人なら、読む価値は高いです。統計の高度な計算を今すぐしたい人向けではありませんが、分析を外注するときにも、レポートを読む側としても、この本の視点は強く効きます。
また、データサイエンスを学び始めた人にも勧めやすいです。予測モデルや可視化の前に、そもそも何を知りたいのかを整理する必要があるからです。相関と因果を区別できないまま分析を進めると、精密に間違えることになります。本書はその入口で踏みとどまらせてくれます。
感想
この本を読んで強く残るのは、データ分析の価値は「数字を集めること」ではなく、「比較の設計を考えること」にあるという感覚です。数値が並んでいると、それだけで客観的に見えてしまいます。しかし実際には、何と何を比べたのか、比べ方にどんな偏りがあるのかで、結論は大きく変わります。本書はその怖さを煽るのではなく、冷静に言語化してくれます。
特に良いのは、因果推論を魔法の技法として扱わないことです。どの方法にも前提があり、現実のデータには限界がある。それでも、前後比較よりよい比較を設計できるし、設計が変われば判断の質も上がる。そういう誠実な態度が本全体に通っています。データを読む力をつけたい人にとって、派手ではないが長く効く一冊です。数字を並べる人から、数字で問いを立てる人へ進むための本だと感じました。