最小二乘线性回归计算器

最小二乘回归是一种查找最适合数据的直线的方法,称为“最佳拟合线”。以 (x, y) 对的形式输入数据,然后找到最符合数据的直线方程。



最佳拟合线

想象一下,您有一些点,并且想要一条最适合它们的线,如下所示:

scatter plot ice cream vs temp with line

我们可以“用肉眼”观察线条:尝试使线尽可能靠近所有点,并且线上方和下方的点数量相似。

但为了获得更高的准确性,让我们看看如何使用最小二乘回归来计算直线。

直线计算

我们的目标是计算直线方程中的值 m(斜率) 和b(y 截距):

y = mx + b

步骤

要找到N个点的最佳拟合线,请执行以下操作:

第 1 步:对于每个 (x,y) 点计算 x2和 xy

第 2 步:将所有 x、y、x 2 和 xy 相加,得到 Σx、Σy、Σx2和 Σxy(Σ 表示“求和”))

第 3 步:计算斜率m:

m = N Σ(xy) − Σx ΣyN Σ(x 2) − (Σx)2

(N 是点数。

第 4 步:计算截距b:

b = Σy − m ΣxN

步骤 5:组装直线方程

y = mx + b

 

它是如何工作的?

它的工作原理是使误差的平方总和尽可能小(这就是为什么它被称为“最小二乘法”):

least squares example graph
直线最小化平方误差的总和

因此,当我们对这些错误中的每一个进行平方并将它们全部相加时,总数会尽可能小。

您可以想象(但不准确)每个数据点通过弹簧连接到直条:

least squares example graph

最小二乘对异常值很敏感。一个奇怪的值会将线拉向它。