- 【問題】
次のデータは、前ページ例8と同じ漢字テストをB組の $10$ 人に行った結果である。
このデータの分散、標準偏差を求めよ。また、データの散らばりの度合いが大きいのはA組、B組のどちらと考えられるか。得られた分散、標準偏差によって比較せよ。
$$ 6, \quad 10, \quad 7, \quad 7, \quad 5, \quad 4, \quad 9, \quad 10, \quad 5, \quad 7 \quad (\text{点}) $$
まずは、自分の力で解けるかチャレンジしてみましょう。分散と標準偏差の計算、そして2つのグループの散らばりの比較が問われています。
いまから解説します。自分の力で一度解きましたか?
【分散と標準偏差】B組の計算とA組との散らばり比較
導入
分散と標準偏差は、データの「散らばり具合」を数値で表す指標です。同じテストをA組とB組が受けているとき、どちらの方が点数のばらつきが大きいかを、分散や標準偏差の値で比較できます。値が大きいほど、散らばりが大きいと考えます。
使う武器(公式・定理)
- 平均値 $\bar{x} = \frac{1}{n} \sum x_i$(合計 ÷ 個数)。単位はデータと同じ(本問では点)。
- 分散 $s^2 = \frac{1}{n} \sum \left( x_i – \bar{x} \right)^2$(偏差の2乗の平均)。 単位はデータの2乗 (本問では点$^2$)。
- 標準偏差 $s = \sqrt{s^2}$(分散の平方根)。 単位は平均値と同じ (本問では点)。平均値と標準偏差は同じ次元・同じ単位をもつ。
- 比較の考え方:分散・標準偏差が大きい方が、データの散らばりが大きい。
既習の方は、この部分は読み飛ばして構いません。
思考のプロセス(Step by Step)
以下の Step 1〜4 の順で計算する。単位はデータと同じ「点」、分散は点$^2$、標準偏差は平均値と同じ点である。
Step 1 平均値を求める
$$ \bar{x} = \frac{\text{データの合計}}{\text{個数}} \quad \text{(単位はデータと同じ)} $$
B組の得点の合計は $6 + 10 + 7 + 7 + 5 + 4 + 9 + 10 + 5 + 7 = 70$、個数は $10$ 人である。
$$ \bar{x} = \frac{70}{10} = 7 \text{(点)} $$
Step 2 偏差と偏差の2乗の表を作る
| 値(点) | $6$ | $10$ | $7$ | $7$ | $5$ | $4$ | $9$ | $10$ | $5$ | $7$ |
|---|---|---|---|---|---|---|---|---|---|---|
| 偏差(点) | $-1$ | $3$ | $0$ | $0$ | $-2$ | $-3$ | $2$ | $3$ | $-2$ | $0$ |
| 偏差の2乗 | $1$ | $9$ | $0$ | $0$ | $4$ | $9$ | $4$ | $9$ | $4$ | $0$ |
偏差は「その値 − 平均」。偏差の単位はデータと同じ(点)。偏差の2乗の単位はデータの2乗(点$^2$)。
Step 3 偏差の2乗の平均値(分散)を求める
$$ s^2 = \frac{\text{偏差の2乗の合計}}{\text{個数}} $$
$$ s^2 = \frac{1 + 9 + 0 + 0 + 4 + 9 + 4 + 9 + 4 + 0}{10} = \frac{40}{10} = 4 \text{(点}^2\text{)} $$
分散の単位はデータの2乗(点$^2$)である。
Step 4 偏差の2乗の平均値の平方根(標準偏差)を求める
$$ s = \sqrt{s^2} \quad \text{(単位はデータと同じ。偏差と平均値と同じ次元)} $$
$$ s = \sqrt{4} = 2 \text{(点)} $$
平均値と標準偏差は、単位が同じ (いずれも点)である。
Step 5:A組との比較について
A組のデータとその分散・標準偏差は、前ページ例8にあります。
B組の分散・標準偏差を求めたら、例8で求めたA組の分散・標準偏差と数値を比較します。 分散または標準偏差の値が大きい方が、データの散らばりが大きい と考えられます。
例8の結果を確認し、B組の分散 $4$、標準偏差 $2$ と比べて、どちらが大きいかを判断してください。
解答
- B組の分散:$s^2 = 4$(点$^2$。単位はデータの2乗)
- B組の標準偏差:$s = 2$(点。単位は平均値と同じ)
- 散らばりの比較:前ページ例8のA組の分散・標準偏差と比較し、値が大きい方が散らばりが大きい。
【まとめ】分散と標準偏差の計算・比較のポイント
- 平均を求めてから、各データの偏差(値 − 平均)を計算する。
- 分散は偏差の2乗の平均。 分散の単位はデータの2乗 (点$^2$、cm$^2$など)。
- 標準偏差は分散の平方根。 標準偏差の単位は平均値と同じ (点、cmなど)。平均値と標準偏差は同じ次元・同じ単位をもつ。
- 2つのグループの散らばりを比べるときは、分散または標準偏差の大きさで判断する。値が大きいほど散らばりが大きい。
【解き直しのすすめ】分散・標準偏差の定着チェック
「わかったつもり」と「本当に解ける」の間には、大きな差があります。解説を読んだだけでは、本番で同じ問題が出たときに自力で解けないことが多いです。
明日、何も見ずにこの問題が解けるかテストしてみてください。平均 → 偏差 → 分散 → 標準偏差の流れを、自分の手で再現できるか。それが本当の実力です。
【最強の暗記法:絞り込みリコールシート】
□ 問題:分散の定義式は?
□ 答:分散 $s^2$ は、偏差の2乗の平均。$s^2 = \frac{1}{n} \sum (x_i – \bar{x})^2$
□ 問題:標準偏差と分散の関係は?
□ 答:標準偏差 $s$ は分散 $s^2$ の平方根。$s = \sqrt{s^2}$
□ 問題:偏差とは何か?
□ 答:各データの値から平均値を引いたもの。$x_i – \bar{x}$
□ 問題:なぜ分散は「偏差の平均」ではなく「偏差の2乗の平均」なのか?
□ 答:偏差の合計は常に $0$ なので、そのまま平均すると散らばりを表せない。2乗すると正の値になり、散らばりが大きいほど分散は大きくなる。
□ 問題:2つのグループの散らばりを比較するとき、何を見るか?
□ 答:分散または標準偏差の値が大きい方を、散らばりが大きいと判断する。
□ 問題:度数分布表から分散を求める場合、階級値はどう使うか?
□ 答:各階級の階級値を使って、階級値の分散を計算する。階級値×度数の加重平均で平均を求め、同様に2乗の平均も求める。
□ 問題:変量 $y = ax + b$ のとき、分散はどうなるか?
□ 答:$s_y^2 = a^2 s_x^2$。定数 $b$ は分散に影響しない。
□ 問題:データの値がすべて同じとき、分散と標準偏差はいくらか?
□ 答:どちらも $0$。散らばりがないため。
□ 問題:分散の別公式「(2乗の平均) − (平均の2乗)」は、どのような場面で便利か?
□ 答:偏差を1つずつ計算しなくても、平均と2乗の平均から分散を求められる。計算が楽になることが多い。
□ 問題:標準偏差の単位は、元のデータの単位とどう関係するか?
□ 答:標準偏差は分散の平方根なので、元のデータと同じ単位になる。分散は2乗した値の平均なので、単位が変わる(例:cm → cm$^2$)。
【友達に教えてあげよう】
分散と標準偏差の計算でつまずいている友達、周りにいませんか? この解説を読んだあなたは、平均から偏差、分散、標準偏差へとつながる流れを理解できています。
実は、一番力がつく勉強法は「人に教えること」です。友達に解き方を自分の言葉で説明してみてください。説明できたら、その単元は本物の理解になっています。
もし周りに同じ問題で悩んでいる友達がいたら、このページの URL を送ってあげてください。あなたの一言が、友達の「わからない」を「わかった!」に変えるかもしれません。