インデックス投資家は、ある銘柄が上がるのか下がるのかには無関心ですが、どんなポートフォリオを組んだときに、想定するリターンがどんな分布になっているのかはとても気にします。そして、基本的にその基礎にあるのは正規分布です。
正規分布といえば、平均値(μ)と標準偏差(σ)の2つで、形状や特性が分かるという、とっても便利な分布なわけですが、実は以前から腑に落ちないことがありました。標準偏差とはいったい何を意味しているのでしょうか?
『経済数学の直感的方法』を読んで、長年のこの疑問が氷解しました。いやはや、すごい本です。
標準偏差の計算法はどこにでもあるが
標準偏差については、概念的な解説と計算方法はいろいろなところに載っています。
標準偏差(ひょうじゅんへんさ、(英: standard deviation、SD)は、分散の正の平方根である。データや確率変数の散らばり具合(ばらつき)を表す指標の一つである。
「データのばらつきを表す指標」だというのはその通り。「分散の正の平方根」という説明もありますが、分散も「確率変数の分布が期待値からどれだけ散らばっているかを示す非負の値である」と説明されています。つまり、表現が違うだけで、同じ「ばらつきを示す指標」だということです。
計算方法もいろいろなところにあります。データから平均値を引いて、偏差を求めます。これがまず、平均からの散らばり度合いですね。単純にデータのばらつきを表す指標ならば、この偏差をデータの個数で割って、つまり偏差の平均を出して、それを使っても良さそうです。
しかし実際の標準偏差の計算では、偏差をいったん2乗して、それをデータの個数で割って平均を出します。これが分散です。この分散の平方根を取ったのが標準偏差なわけです。
ではなぜ2乗するのか。実はこれはかなり奥が深くて、導出が非常に難しい。たぶん、詳しい人でも、正規分布曲線、f(x) = e ^ -x2 から導く……という以上の感覚的な説明は難しいのでしょう。でも、本書では、正規分布ではなく三角分布という仮想世界での計算を元に、なぜ2乗するかをイメージできるように解説しています。これはすごい。
標準偏差とはいったい何を意味するのか?
では、いったい標準偏差とは何を意味するのでしょうか? 正規分布は平均と標準偏差が決まれば、形が決定される非常に便利な分布です。でも、標準偏差が「データのばらつきを表す」のであれば、別にもっと大きな値でも良いはずだし、もっと小さい値でもいいはず。なぜ上記の計算で導かれる必要があるのでしょうか。
なぜここがσなのか? ということです。単にばらつきを表すのなら、もっと大きいところを基準にしてもいいし、もっと小さいところを基準にしてもいいはず。
正規分布は、正確には右にも左にも永遠に薄く長く続いており、0になることがありません。そのため、山の裾野の端っこを、ばらつきを表す指標に使えないわけです。ではどうするか。どこに明確に確定できる点があるのか。
理系の学生にこれを見せると、何だか当たり前のように「曲線の真ん中あたりにちゃんと2個、特殊な点が存在するではないか」と指摘するはずである。つまり微積分に日常的に接している人間に言わせると、この曲線は左右に1個ずつ「変曲点」を持っており、そのためその2点を「特殊な点」として見なしてはどうか、というわけである。
本書からの引用図です。なるほど、山の裾野から上がる部分は皿型の曲線、そして山の上側は山形の曲線です。つまり、どこかで曲率が変化するポイントがあるはずです。ここが特殊な点、そして、この点の幅こそが、2σ、つまり標準偏差だというわけです。
本書は初めて明確な答えを示してくれました。正規分布の幅を示すには、どの分布でも同じに扱える基準点が必要です。それが、この変曲点、そして変曲点の幅を計算するための方法が、先の標準偏差の計算式だったというわけです。素朴な疑問が初めて腑に落ちました。
歴史解説でもなく式変形でもなく、ブラック・ショールズ式を直感的に理解する
本書は「経済数学」と名乗っていますが、実は確率統計、しかも金融系に特化した内容です。目次からさらうと、こんな感じです。
- 初級編 正規分布
- 中級編 最小2乗法の本質
- 中級編 中心極限定理の不思議
- 中級編 ブラウン運動とブラック・ショールズ理論
- 中級編 教養としてのブラック・ショールズ理論
- 上級編 伊藤のレンマと確率微分方程式
- 上級編 実際のブラック・ショールズ理論
- 補編 測度とルベーグ積分
もちろん、数式はまったく出てこないわけではありませんが、中学レベルで読んでいけます。そして白眉なのは、文系読者と理系読者の双方を念頭においた書き方をしているということです。そのため、数式変形で計算方法を導出していく話はほとんどなく、「この式は本質的には何を意味しているのか」「この式からどんな洞察ができるのか」にかなりのページ数を割いています。
それでも、目次を見れば分かる通り、かなり高度なところまで解説しており、類書とは全く違うということが分かると思います。ちなみに上級編はさすがに文系にはけっこう難しい。。テイラー展開とか出てきます。ここまでやって、ブルーバックスで296ページ、Kindle版なら893円。密度の濃い本です。
確率統計は学びたいけど、検定とかじゃなくて金融系でよく出てくる分布を知りたいんだよ……という文系の人*1にはうってつけの1冊だと思います。
*1:ぼくがまさにそうだったわけですが、レアかなぁ?