最小二乘线性回归计算器
最小二乘回归是一种查找最适合数据的直线的方法,称为“最佳拟合线”。以 (x, y) 对的形式输入数据,然后找到最符合数据的直线方程。
最佳拟合线
想象一下,您有一些点,并且想要一条最适合它们的线,如下所示:
我们可以“用肉眼”观察线条:尝试使线尽可能靠近所有点,并且线上方和下方的点数量相似。
但为了获得更高的准确性,让我们看看如何使用最小二乘回归来计算直线。
直线计算
我们的目标是计算直线方程中的值 m(斜率) 和b(y 截距):
y = mx + b
步骤
要找到N个点的最佳拟合线,请执行以下操作:
第 1 步:对于每个 (x,y) 点计算 x2和 xy
第 2 步:将所有 x、y、x 2 和 xy 相加,得到 Σx、Σy、Σx2和 Σxy(Σ 表示“求和”))
第 3 步:计算斜率m:
m = N Σ(xy) − Σx ΣyN Σ(x 2) − (Σx)2
(N 是点数。
第 4 步:计算截距b:
b = Σy − m ΣxN
步骤 5:组装直线方程
y = mx + b
它是如何工作的?
它的工作原理是使误差的平方总和尽可能小(这就是为什么它被称为“最小二乘法”):
直线最小化平方误差的总和
因此,当我们对这些错误中的每一个进行平方并将它们全部相加时,总数会尽可能小。
您可以想象(但不准确)每个数据点通过弹簧连接到直条:
最小二乘对异常值很敏感。一个奇怪的值会将线拉向它。