四分位範囲と箱ひげ図

出典: フリー教科書『ウィキブックス(Wikibooks)』
ナビゲーションに移動 検索に移動

四分位数[編集]

データを大きさの順に並べた時、25%、50%、75%に当たる数値をその資料の四分位数と言う。特に下位から25%に当たる数値を第1四分位数、 下位から75%に当たる数値を第3四分位数と言われる。下位から50%に当たる数値は第2四分位数と言うこともできるが、中央値と同義である。

資料1の四分位数を求めてみよう。まずは資料を昇順に並びかえる。

  • 資料3
順位 10 9 8 7 6 5 4 3 2 1
体重(kg) 53.6 55.8 56.1 57.9 60.3 62.7 63.1 65.4 67.1 70.0

まずは中央値を求めてみる。中央値のセクションでも述べた通り、この資料の中央値は5番目と6番目の平均である61.5kgである。

第1四分位数はこの資料では順位が6番目~10番目の中央値とも読み取ることができる。言い換えると8番目の値となるので56.1kgとなる。

第3四分位数も同様に順位が1番目~5番目の中央値とできるので求める数値は3番目の値の65.4kgである。

四分位偏差[編集]

第3四分値と第1四分値の差の半分のことをその資料の四分位偏差と言う。

資料1の四分位偏差はとなる。


箱ひげ図[編集]

資料のばらつき具合をグラフにまとめて見やすくしたものを箱ひげ図と言う。

箱ひげ図の見方を以下で示す。なお、以下の図は資料3を参照して作成しているが、0.5kg未満の数値を切り捨てしてあるので正しく作成した図と等しくならないことには注意。

                      C
            +----------+------+       
       |----|         +|      |---------|
            +----------+------+    
       A    B          D      E         F          
+---+---+---+---+---+---+---+---+---+---+   (横軸1メモリは0.5kg)
50  52  54  56  58  60  62  64  66  68  70
  • Aは最小値(53.6→53.5)
  • Bは第1四分位数(56.1→56.0)
  • Cは平均値(61.2→61.0)
  • Dは中央値(61.5)
  • Eは第3四分位数(65.4→65.0)
  • Fは最大値(70.0)

偏差[編集]

変数xのとる値が

のn個あるとき、各値と平均値との差

を、それぞれ平均値からの偏差(へんさ)という。

資料1で、平均値からの偏差は次のようになる。

  • 資料4
出席番号 1 2 3 4 5 6 7 8 9 10
体重 60.3 57.9 65.4 56.1 53.6 62.7 70.0 55.8 67.1 63.1
偏差 -0.9 -3.3 4.2 -5.1 -7.6 1.5 8.8 -5.4 5.9 1.9

さて、今知りたいのは資料全体の偏り具合の傾向であった。それを調べるために、試しに偏差の平均値を計算してみよう。

このように、偏差の平均値は常に0になる。