不透明な時代な見抜く「統計思考力」

作者:神永正博
出版社:ディスカヴァー・トゥウェンティワン
発売日:2009/4/15
評価:★★★☆☆

不透明な時代を見抜く「統計思考力」

不透明な時代を見抜く「統計思考力」

http://blog.livedoor.jp/dankogai/archives/51219159.html
この記事を読んだ次の日に本屋に行ったら目に入ったので買ってみた。
僕は今まで統計について詳しく学んだことはなかったのだが、なるほど、統計って面白い。
「最近の若者は本を読まなくなった」
「古泉改革で格差が拡大した」
「同じ種類の犯罪は流行する」
あたかも当然の事と扱われているこのような通説は、マスコミを初めとするメディアが、信憑性をもたせるために巧みに統計を利用して作り上げた幻想に過ぎないのかもしれない。
正直言って、生のデータに触れるということがこんなに面白いことだとは思っていなかった。
統計に興味があるけど何を読んだらいいのかわからないという人や、上に挙げたような通説に疑念を抱いている人は、是非読んでみて欲しい。
統計の見方を変えて数字に裏に隠された真実を見つけた時の気分は、非常に爽快だ。

データを見るときの注意点

1、データを先に見る
2、誰かが解釈する前のデータを見る
3、自分の仮説に反するデータも集める


1に関しては、自分の主張を発表する時や、マスコミや記者の意見を聞く時に、まずデータから見るべきだ、という解釈で良いと思う。
2に関しては説明は不要だ。言葉の通りだろう。


問題は3つ目だ。自分の意見に反するデータを集めるという行為には注意が必要だと思う。
なぜなら、僕は何の根拠も無いトンデモ理論を展開するのが大好きだからだ。
確かに自分の仮説・主張が本当に正しいのかどうかを統計を利用して客観的に分析することは必要だと思う。会社でプレゼンを行う必要がある時などはそういった下調べが重要だろう。
しかし、最初にデータ集めを行ってしまうと、どうしても常識的な思考の下地が出来上がってしまう。
そうなってしまうと、中々トンデモ理論は生まれにくい。
統計や数字のデータが何も無いところから生まれるアイデアというのは、面白いのだ。
ケース・バイ・ケースと言ってしまえばそれまでだが、面白いアイデアが欲しい時は、敢えて統計を無視して進めることも必要だと思う。

若者の読書離れは本当か。


僕はまだ20代なので、昔10代20代だった人が当時どれだけ本を読んでいたのかは知らない(それこそ統計で引っ張って調べろてみろよという話だが)。
しかし同年代の人達を見ていると、書籍ビジネスの将来を心配してしまうこともある。
そして僕のその心配を裏付けてくれるかのように、マスコミではよく「最近の若者は本を読まなくなった」と言われている。
では本当に今の若者は本を読まなくなったのだろうか。


驚くことに、現代の小中高生の平均読書冊数は、年々増加しているのだ。
小学生に関しては、1978年からほぼ右肩上がりで読書冊数が増加している。比率にしておよそ2.5倍だ。
中学生に関しても、1999年から今に至るまで、2倍以上の上昇率で読書冊数が増えている。
高校生は小学生・中学生ほどではないにしろ、平均読書冊数が現象しているということはなく、横這いか増加の傾向にある。
またこれは若者に限ったことではないが、公共図書館数と図書貸出数は1986年からずっと連続して上昇している。
インターネットの普及は若者の読書にマイナスの影響を与えたと言われているが、そんなことはなかったのだ。


これは完全に僕の持論だが、インターネットは本を読まない人と読書の橋渡しをしてくれたのではないかと思う。
今は何か体系的な知識を得ようとすると、まずウィキペディアで調べるという人が多いと思う。
しかしウィキペディアには上手い具合に表面的な情報しか掲載されていない。
その場合、さらに詳しい情報を得ようすると、本を読むしかなくなるのだ。
インターネットの利便性と、そこにある情報の不完全さとが相まって、日本人を読書に駆り立てるの。無いか。

平均であって平均でない

多くの人は、平均値のまわりに一番大きな山がくると想像しがちですが、そんな事は全くありません。わたしたちは無意識に左右対称な分布を想像しますが、実際にはそうでないことが多いのです。


日本人の平均所得で考えてみるとわかりやすい。
日本人の所得分布図によると、平均所得金額は580万4千円であり、中央値は462万円である。
中央値というのは、所得が低い人から順に並べたとき、ちょうど真ん中になる人の所得である。
つまり、中央値である462万円以下の世帯が50%、462万円以上の世帯が50%となる。
なぜこんなことが起こるのだろうか。
2004年の高額納税者番付によると、そのトップは投資会社社員で、納税額だけで36万9238万円もあるのだ。
つまり、こういうすさまじい高額所得者が数名いるだけで、全体の平均が急上昇することになる。
だから、平均値よりも中央値の方が実感に近いのだ。
平均というと「みんなそうなんだ」と思ってしまいがちだが、実はそこにも見えていない部分があったのだ。


研修中に会社のデータを見る機会が何度かあった。
ああいったものは往々にして不都合なデータは見せないようにしているものだとは思っていたが、提示されたデータ自体にも異なる切り口があるのかもしれない。
来週は商品知識の講座の研修があるから、数字に注意していると新たな発見がありそう。

最大の勢力は、中国?インド?


最後に中国とインドの人口と経済の動向について触れた部分を取り上げたいと思う。
中国とインドの人口推計をご存知だろうか。
2000年には中国がインドを上回っているのだが、2025年にインドが中国に追いつき、2040年頃には中国の人口が減少し始めると予測されている。
では前半戦は中国、後半戦はインドが経済成長するという図式を描けばいいのだろうか。
ポイントは、中国の一人っ子政策と、生産年齢人口だ。


経済成長というのは労働力に拠るところが大きい。
労働力というのはつまり生産年齢人口の過多で決定される。
その視点でこの二つの国を比べてみると、人口構成のバランスが悪い中国に比べてインドは生産年齢人口が多い状態が続く期間が約15年ほど長いのだ。
つまり、両国とも同じような人口を維持する期間があるのだが、その中身は全く異なっていると言ってもよい。


これも統計の裏に隠れた真実である。
人口の数だけにフォーカスすると見えないが、労働力という観点で見てみると、どちらの国が最大の勢力になるのかが見えてくる。

生のデータは面白い

最初に書いたように、僕は統計についてあまりよく知らない。
しかし本書を読んで、統計は面白いと声を大にして言えるようになった。

他の人が気付いていない問題を見つけ出し、自分で考えて結論を出すことです。
誰かが書いたデータの解釈を読まされている状態から、
自分でデータを読むようになれば、見える世界が変わってきます。


まさにその通りだ。
「生のデータ」をいかに調理するかが重要なのだな。