統計学基礎/単回帰分析

出典: フリー教科書『ウィキブックス(Wikibooks)』
ナビゲーションに移動 検索に移動

 単回帰分析のアルゴリズム定義 [編集]

Ⅰ.目的

データ解析関連の各種サイトや書籍で、統計解析のコンセプトを学ぶ機会があると思うが、学習後
後日、その内容のエッセンスともいうべき定義式に戻って確認する時の参照用として作成した。
この情報は、昨今はやりの「分かる・できる!」シリーズのセミナーや教科書のため、難解な数式を避けて
解説された著作物の詳細な部分を補う意味でも活用することができる。

Ⅱ.対象となる読者

上記の目的に沿ってデータ解析手法のコンセプトを理解し、もしくは解説された情報を入手をされた
サイト訪問者すべてが対象。


Ⅲ.アルゴリズム定義式

1.モデル
現在考えられる中で、最も分かり易く、かつ、一般的な因果関係モデル。
モデル作成のための入力データには、従属変数(被説明変数)と独立変数(説明変数)が必要。
結果として得られるモデル式は、従属変数を Y、独立変数を X とすると
 Y = a * X + b
で表され、これは独立変数を原因とし、従属変数を結果とする因果関係モデルが構築されることを意味する。
ここで、X、Yはそれぞれ入力データとなる実績値のベクトルを表す。
また、aとbは、実績値を使用し、計算によって求められた回帰係数であり、この時の計算はYの理論値と
実績値との乖離(=残差)が最小となるように決定される。
2.回帰係数(=回帰パラメータ)
回帰係数の計算アルゴリズムは、以下の通り。 
a = Σ(Xi-Xの平均)(Yi-Yの平均)/[Σ(Xi-Xの平均)の二乗]
b = Yの平均 - a * Xの平均
3.モデル評価指標
モデルそのものを評価する指標は、以下の通り。
決定係数  :[Σ(Yの予測値i-Yの平均)の二乗]/:[Σ(Yi-Yの平均)の二乗]
重相関係数 : 決定係数の平方根