回帰直線を最小二乗法で求めてみたけど、たった三点でも結構な計算量。本当に統計検定3級に出題されるの?

回帰直線を最小二乗法で求めてみたけど、たった三点でも結構な計算量。本当に統計検定3級に出題されるの?

参考URL
https://manabitimes.jp/math/942

既存のデータから、法則性(1次関数の直線)を求める。
データの形は、y = ax + b

以下の3点(2,3),(4,7),(9,11)から、もっともらしい直線(y = ax + b)を求める

最小二乗法の公式
傾きa = 共分散(x,y)/xの分散
切片b = yの平均 – (xの平均 × 傾きa)

とりあえず、計算してみよう。

xの平均 = (2+4+9)/3 = 5
yの平均 = (3+7+11)/3 = 7

xの分散 = ((5-2)^2 + (5-4)^2 + (5-9)^2 )/3 = 26/3
※分散は、各値を平均値から引いた値(偏差)の平均値

xとyの共分散 = ((3*4)+(1*0)+(4*4))/3 = 28/3
※共分散は、xの偏差×yの偏差の平均値

傾きa = (28/3)/(26/3) = 28/26 = 14/13
切片b = 7 – ((14/13)*5) = (91/13) – (70/13) = 21/13

y = 14/13x + 21/13
回帰直線が求まったけど、あまりピンとこない…。
y = 1.076x + 1.615
小数の方が見慣れているな。だいたいy=x+1.6って考えるとイメージしやすい。

計算そのものは、四則演算と二乗だけだけど、公式を覚える&計算量が多い!

傾きa = 共分散(x,y)/xの分散って、相関変数じゃね?と思ったけど、よく見たら違った。