〜なぜなになレイコ〜統計編
おーいみんな〜あつまれ~
なぜなになレイコの時間だよ〜
今日は統計がどうこう言ってるセリフ周りを解説するよ!やわらか翻訳と解説をするから、好きに読んでね!
■劇中のセリフ
夏目玲子:「ふふん。君は実に一般的だね。きっと君はガウス分布を取るアンケート結果の中でも平均値や中央値や最頻値を取るのだろうね」
有栖川倫太郎:「どうせ僕はなんの変哲もないアベレージマンですよ」
夏目玲子:「悪口を言ったつもりはないよ。褒めたつもりもないがね。平均であるということは、多くの共感を理解できるということさ。特別なことが良いわけじゃない。外れ値は往々にして統計、検定の邪魔になる」
何だか小難しいね!でも言ってることは単純だよ!
︎■やわらか翻訳『倫太郎くぅん〜君ってやつはほんとに、よく聞くようなありがちで普通のことを言うねぇ〜〜』『どうせ僕は普通人間ですよーだ』『まぁまぁ、普通人間は色んな人の気持ちがわかるってことだからいいじゃあないか〜逆に特殊な人間は物事を考える時には邪魔になることもあるからねぇ〜』
って意味だよ!
︎■解説
ガウス分布は普通に調べると統計学の数式とか出てきて困っちゃうね!ざっくり説明なので語弊があったらごめんなさいね!
統計をとるようなデータを整理してグラフにすると、真ん中が一番多くて、離れていくほど少なくなる結果、分布のことだよ!
たとえば、学年のテスト結果をグラフ化しよう!とするとき、50点の人が1番多くて、そこから離れていくほど人が少なくなっていって、0点と100点の人が1番少ない、みたいなグラフは想像しやすいかな?こんな感じになるよ!
横軸が点数、縦軸が人数なので、真ん中の50点に近い点数とった人が多くて、0点や100点の人の方が極端に少なくなるので、こういうグラフになるんだね。
この、ガウス分布のど真ん中!一番平均で一番中央で一番頻度が多いとこみたいな、普通どストライクみたいなやつだね!って玲子は言ってるんだ!
ちなみにこの平均値、中央値、最頻値は別々の意味だけど、これがピッタリど真ん中に揃うのがガウス分布だよ!
ちなみに、揃わない場合、つまりガウス分布じゃない場合は下みたいな例だよ!とある6人グループのテスト結果が20 25 27 30 30 100 だったとしよう!
平均はよく知ってると思うけど、合計を人数で割れば出てくるから、(20+25+27+30+30+100)÷6 = 38.667だね!
中央値は、その名の通り真ん中の値だよ20 25 27 30 30 100 の真ん中で、27と30の間だから、28.5になるよ!27 28 28.5 29 30って書くと分かりやすいかな?
最頻値は1番でてきた頻度が多い数だよ!今回では30点だけ2人いるから、30が最頻値になるね!
つまり、平均も中央も最頻も違う数字になるんだ!
さて、では外れ値が邪魔になるってどういうこと?という話をするよ!
引き続き、6人のテスト結果が20 25 27 30 30 100 の例で考えるよ!
よく見てみると、ほとんどの人が20〜30点なのに、1人だけ100点満点のヤベー奴がいるね!こいつが外れ値と呼ばれる、ちょっと特殊な例だよ!
さっき、平均点は大体38点だと計算したけど。普通に考えたら100点取ってるやつがおかしいだけで、平均点は30点より下になりそうだよね?100点とってるヤベー奴が1人いるせいで、概ね平均だろうと思われる数字とはズレちゃってる、これが玲子の言う、外れ値が検定の邪魔になるって話だよ!
こちとら統計、つまりは大多数の傾向とかを考えたいのに、こんな変わってるやつ1人のせいで平均点は現実とは離れちゃったよね?こういうことがあるから、ニュースなんかで『平均』を出してる事があれば気をつけようね!メディアは平気で視聴者を騙すこともあるよ!
今日のなぜなになレイコはここまで〜!
まったね〜!
0コメント