東京オリンピック陸上100m 日本選手は9.9秒を切れるか?
秋雨前線が日本列島にかかる時期になりました。
小ぬか雨、霧雨、しとしと雨、土砂降り、ゲリラ豪雨
・・・ 様々な雨の降り方がありますが、
雨粒を科学的に調べると、
その大きさの平均値は約1mm、
大きさのばらつきは「正規分布」に近い形となるそうです。
正規分布は、データのばらつき方を表す統計指標の一つで、釣り鐘型をしています。
富士山のように美しくすそ野を引いていますが、少し異なるのは、頂上がすっぱり切れて平坦ではなく、
緩やかにこんもり山形になっていること。
例えば、先ほどの雨粒を例にとると平均的な1mmの雨粒の数が最も多く、
大きさが1mmから小さくなればなるほど、また1mmよりも大きくなればなるほど、
その数が裾野に向かって少なくなる、と考えると分かりやすいでしょう。
世の中には、この正規分布を使って統計的に分析できる現象がたくさんあります。
前述の雨粒の大きさや、梅雨明けの日、ある学年の生徒の身長、畑で収穫したトマトの重さ、
工場で作るねじ(製品)の重さ、一ヶ月当たりの電話料金など
多数の偶然が重なってばらつきが生じる現象を分析するのに適しています。
さらに、正規分布は特定の数式で表すことができ、
既存のデータに基づいて、調べたい現象の発生確率を求めることもできるので、
品質管理(良品・不良品)や成績管理にもよく使われています。
例えば、過去20回のゴルフスコアから、
「95%の確率で113±8打になる」「100打を切る確率は1%以下」といった分析が可能です。
テストの偏差値も正規分布を活用した分析手法で、例えば偏差値70(!!)の方は、
全体の上位2.5%の成績、ということも分かります。
このように、ばらつきや正規分布の考え方を使うことで、
手持ちのデータから新たな定量情報を引き出し、
ロジカルに、より確度の高い意思決定に活用することが期待されます。
母集団推定や検定といった、発展的・実践的な統計分析の基本となる考え方、ということもあり、
ビジネスパーソンとしてはぜひ身につけておきたい考え方です。
さて、来年2020年には、いよいよ東京オリンピック・パラリンピックが開催されます。
過去の記録を集め、前記の考え方を活用すれば、
「陸上男子100mでX選手が9.9秒を切る確率」を求めることも可能でしょう。
レースごとに条件が異なる中で、偶然を排して記録更新を狙う選手には大変失礼かもしれませんが、
データは嘘をつかないのも、真実なのです。
正規分布に基づく予測が当てはまるかどうか、ご自身でぜひ検証してみてください。
筆者:河野 貴史
- 2019/09/13
- スタッフブログ
- 投稿者:アソシエイツ室 鈴木