中学校数学 1年生-数量/資料の散らばりと代表値

出典: フリー教科書『ウィキブックス(Wikibooks)』

目次

[編集] 資料の測定

世の中には様々な統計資料がある。ここではどのようにまとめられているかを見て行こう。

[編集] 数値の読み取り

基本的に測定器具の最小メモリの10分の1の位まで読み取ることとなっている。例えば最小メモリが1℃の温度計で25℃と26℃の間にある時「25.2℃」・「25.8℃」などと読み取る。

[編集] 有効数字

[編集] 有効数字とは

例えば長さにおいて

  • 光が1年間に進む距離は9 460 000 000 000 000m(9兆4600億km)である。
  • 水素原子の半径は0. 000 000 000 25m(25mmの1億分の1)である。

このように数値を書くと「0」が多くややこしい。

そこで10の整数乗を使ってこれらの数値を簡単に表すことを考えてみよう。

例えば光が1年間に進む距離の場合946×1013mに、水素原子の半径は25×10-11mとなる。(10-11とは1/1011と言う意味。詳しくは高等学校数学の範囲である。)

この時、1013の左にある「946」・10-11の左にある「25」をそれぞれ有効数字と言う。

一般的に10の整数乗に掛けられる数字は1以上10未満の数である。これを用いると946×1013は9.46×1015となり、25×10-11は2.5×10-10と書き換えられる。

[編集] 有効数字の桁数

有効数字の桁数は0以外の数字が初めて出てきた位以下の数字の数により決まる。

例えば以下の通りに桁数は決まる。

  • 20.5は「2」「0」「5」の3つの数字があるので有効桁数は3
  • 12345は「1」「2」「3」「4」「5」の5つの数字があるので有効桁数は5
  • 0.069の「0」以外の先頭の数字は「6」である。「6」がある位以下には「6」「9」の2つの数字があるので有効桁数は2
  • 3.000は「3」「0」「0」「0」の4つの数字があるので有効桁数は4

有効数字の桁数により同じ数が書かれていても意味は異なる。例えば「100」と「100.00」の2つがあるとして前者の場合は「99.5以上100.5未満」である範囲を表すが、後者の場合は「99.995以上100.005未満」の範囲を表す。

また10mは1000cmであるが「1000cm」のように書くと有効数字の桁数がいくらなのかは判断しにくい。有効数字の桁数をはっきりさせたい場合は例えば左の例を有効数字2桁とするならば1.0×103cmとすることが必要となる。

[編集] 有効数字を踏まえた計算

有効数字の概念を踏まえた計算を行ってみよう。表記されている1桁下で四捨五入が行われていることが重要となる。

[編集] 加減

まずは以下の問題を見て欲しい。

  • 21.5+1.00005を計算しなさい。

何も考えずに計算を行うと22.00005となるが、「21.5」は「21.45以上21.55未満」を取りうるため「1.00005」の「.00005」の部分は信頼できる数値ではない。加減の場合は下1桁の位が大きいほうに合わせて計算を行う。よってこの場合「1.00005」は「1.0」として計算し求める数値は22.5となる。


[編集] 乗除

では次に以下の問題を見てみよう。

  • 21.3×1.67を計算しなさい。

何も考えずに計算を行うと35.571となる。乗除の場合は有効数字の桁数の少ないほうより1桁多く計算しその一番小さい位を四捨五入する。よってこの場合両方とも有効数字は3桁なので有効数字4桁の数値である35.57まで出しその後4桁目を四捨五入して求める数値は35.6となる。


[編集] 誤差

次の問題を考えてみよう。

  • 縦25.2cm×横17.5cmの長方形の面積を答えなさい。

「25.2」と「17.5」の有効数字は3桁である。したがって小数第2位で四捨五入されているため実際の値は「25.15以上25.25未満」・「17.45以上17.55未満」の範囲となる。

すると「25.15×17.45=438.8675」以上「25.25×17.55=443.1375」未満である数値に真の面積の値があることが分かる。実際に算出した数値と真の数値とのズレを誤差と言う。誤差は大きく以下のようにして生まれる。

  • 測定する器具の精度による誤差(最小メモリが1mmである定規は0.1mm単位以下は精密に測れない)
  • 読み取り時に起こる誤差(同じものを同じ器具で測定しても違う人が数値を読めば読み取られた数値がそれぞれ異なることもあり得る)

[編集] 資料の活用

ここでは測定された数値がどのように使われているかを見ていこう。

[編集] 資料の分布

以下の資料1は10人の体重を測定した順番に並べてある。

  • 資料1
計測順 1 2 3 4 5 6 7 8 9 10
体重(kg) 60.3 57.9 65.4 56.1 53.6 62.7 70.0 55.8 67.1 63.1

上の資料1は個々の生徒の体重は読み取りやすいが全体の傾向は読み取りにくい。

以下の資料2は上の資料1から読み取った値を基準を62.5kgとし、その前後±1.5kgの3.0kg毎に区切りその区間に当たるする人数を記録している。

  • 資料2
階級 52.0以上~55.0未満 55.0~58.0 58.0~61.0 61.0~64.0 64.0~67.0 67.0~70.0 70.0~73.0
階級値 53.5 56.5 59.5 62.5 65.5 68.5 71.5
度数 1 3 1 2 1 1 1

このように値をいくつかの区間に区切り全体の傾向を読み取りやすくする時、その区間(ここでは体重)を階級、またその幅を階級の区間と言う。また、階級の区間の中央にくる値をその区間の階級値と言う。各階級に該当する資料の個数(ここでは人数)を度数、各階級に度数を組み込んだ上のような表を度数分布表と言う。

[編集] 資料とグラフ

上の表を更に整理して柱状のグラフに表したものをヒストグラムと言う。各長方形の高さは各階級の度数に比例する。

ヒストグラム.JPG
度数折れ線.JPG

ヒストグラムで、おのおのの長方形の上の辺の中点を結ぶ。ただし、その左はしは1つ手前の階級の度数を0とし、右はしは1つ先の度数を0として作る。このような折れ線を度数折れ線またはを度数多角形と言う。

ヒストグラムの全面積と、度数折れ線と横軸で囲まれた面積は等しい。

[編集] 累積度数

それぞれの階級以下、または階級以上の度数を全て加えた和を累積度数といい、それを表にまとめたものを累積度数分布表と言う。

資料2を例に取ると、

  • 資料3
階級 55.0未満 58.0 61.0 64.0 67.0 70.0 73.0
累積度数 1 4 5 7 8 9 10

となる。

[編集] 相対度数

それぞれの階級の度数を資料の個数で割った値をその階級の相対度数といい、それを表にまとめたものを相対度数分布表と言う。相対度数分布表では各階級の相対度数の総和は1となる。

資料2を例に取ると、

  • 資料4
階級 52.0以上~55.0未満 55.0~58.0 58.0~61.0 61.0~64.0 64.0~67.0 67.0~70.0 70.0~73.0 合計
度数 1 3 1 2 1 1 1 10
相対度数 0.1 0.3 0.1 0.2 0.1 0.1 0.1 1.0

[編集] 資料の代表値

資料の分布についてはヒストグラムなどからも得ることができるが全体の特徴を1つの数字に表すことにより分かりやすくすることができる。このような値を資料の代表値と言う。

[編集] 平均値

変量が取るいくつかの値がある1組の資料でその数値の合計を資料の個数で割ったものを変量の平均値と言う。

資料の平均値

n個の資料x_1 , x_2 , \cdots , x_nの平均値\overline{x}(エックスバーと読む)は

\overline{x} =  \frac{x_1 + x_2 + \cdots + x_n} n

例えば、資料1の平均値は


\frac{60.3+57.9+65.4+56.1+53.6+62.7+70.0+55.8+67.1+63.1} {10} = 61.2 (kg)

が平均値となる。


度数分布表からも、平均値の近似値を求めることができる。このときは、各階級に属する資料の値は、その階級値に等しいものと考えて計算する。

資料xの度数分布表で、階級値をx_1 , x_2 , \cdots , x_rとし、それに対応する度数をf_1 , f_2 , \cdots , f_rとする。

このとき、総和は


x_1 f_1 + x_2 f_2 +  \cdots + x_r f_r

で、総度数nは


n=f_1 + f_2 + \cdots + f_r

であるから、資料xの平均値\overline{x}は次のようになる。

度数分布表からの平均値

階級値をx_1 , x_2 , \cdots , x_rとし、それに対応する度数をf_1 , f_2 , \cdots , f_rとする。平均値\overline{x}

\overline{x} =  \frac{x_1 f_1 + x_2 f_2 +  \cdots + x_r f_r} n

例えば、資料2の平均値は


\frac{53.5 \times 1 + 56.5 \times 3 + 59.5 \times 1 + 62.5 \times 2 + 65.5 \times 1 + 68.5 \times 1 + 71.5 \times 1} {10} = 61.3 (kg)

と計算できる。確かに真の平均値と近い値が計算できている。

[編集] 中央値

資料を大きさの順に並べた時、中央の順位にくる数値をその資料の中央値と言う。資料が偶数個の場合(例の場合は5番目と6番目にあたる)は中央に2つの値が並ぶので、その場合は2つの数値の平均値を中央値とする。

例えば、資料1の中央値は \frac { 60.3 + 62.7 } {2} = 61.5(kg)が中央値となる。

[編集] 最頻値

度数分布表において度数が最大である階級値をその資料の最頻値と言う。

例えば、資料2の最頻値は56.5(kg)である。

[編集] 範囲

資料に含まれている最大の値から最小の値をひいた差を分布の範囲と言う。

例えば、資料1の範囲は70.0 - 53.6 = 16.4(kg)である。

ヘルプ