建设银行茂名网站,灰色推广,it运维工程师月薪,前端开发工程师培训哪里有基本概念
线性回归时机器学习中监督学习下的一种算法。回归问题主要关注是因变量#xff08;需要预测的值#xff0c;可以是一个也可以是多个#xff09;和一个或多个值型的自变量#xff08;预测变量#xff09;之间的关系。 需要预测的值#xff1a;即目标变量#x…基本概念
线性回归时机器学习中监督学习下的一种算法。回归问题主要关注是因变量需要预测的值可以是一个也可以是多个和一个或多个值型的自变量预测变量之间的关系。 需要预测的值即目标变量target,y,连续值预测变量 影响目标变量的因素X1……Xn,可以是连续值也可以是离散值。 因变量和自变量之间的关系即模型model是我们要求解的。 1.1 连续值
数值型数据中能无限细分的叫做连续型 例如身高长度 1.2 离散型数据
不能无限细分的就叫离散型 比如序号1201和2之间没有别的序号又比如等级数据一级二级三级是人为界定或者我国的各省的名称不是测量获得的。 1.3 简单的线性回归
前面提到过的算法说白的了就是公式简单的线性回归属于一个算法他所对应的公式 y w x b y wx b ywxb 这个公式中y是目标变量即未来要预测的值X是影响y的因素w,b 是公式上的参数即要求的模型。其实b 就是截距w就是斜率所以和明显如果模型求出来了未来影响y值的未知数据就是一个X值也可以一说影响y值的因素只有哦一个所以这就叫简单的线性回归的原因。 同时我们可以发现从x到y的计算x只是一次方所以这些算法叫线性回归是我原因 其实大家在上小学的时候就已经会解一元一次方方程了为什么那个时候哦不叫人工智能算法呢因为人工智能算法要求的是最优解 1.4 最优解
Actual value: 真实值一般使用y表示 Predicted value: 预测值是把已知的x带入到公式里面和猜出来的参数w,b计算得到的一般使用表示 Error:误差预测值和真实值的差距一般使用表示 最优解尽可能找到一个模型整体的误差最小整体误差通常叫做损失Loss. Loss:整体的误差loss通过损失函数 loss function计算得到的 1.5 多元线性回归
但是在现实生活中往往影响y的因素不止一个这时x就从一个变成n个了 x1……xn 同时简单线性回归的公式就不在适用了。多元线性回归如下 2. 正规方程
2.1 最小二乘法
最小二乘法Least Squares Method是一种常见的数字优化技术用于拟合一组数据点的最佳线性回归方程。它的目标是找到一条直线使得该直线和数据点之间的误差平方和最小。
具体而言最小二乘法的目标是最小化每个数据点与拟合直线之间垂直距离的平方和即最小化所有数据点到拟合直线的残差平方和。残差是指每个数据点的实际值和集合直线在该点处的预测值之间的差异。
最小的二乘法可用于回归分析即对一组数据拟合并预测未来数据点的值。此外他可以用于求解线性方程组如先行回归模型的系数或参数估计等。
最小二乘法可以将误差转化为有确定的代数方程组其方程式数目正好等于未知数的个数从而可求解出这些未知参数。这个有确定解的代数方程组称为最小二乘法估计的正规方程。公式如下 2.2、多元一次方程举例
1、二元一次方程 { x y 14 2 x − y 10 \begin{cases} x y14\\ 2x - y 10\\ \end{cases} {xy142x−y10
2、三元一次方程 { x − y z 100 2 x y − z 80 3 x − 2 y 6 z 256 \begin{cases} x - y z 100\\ 2x y -z 80\\ 3x - 2y 6z 256\\ \end{cases} ⎩ ⎨ ⎧x−yz1002xy−z803x−2y6z256
3、八元一次方程 { 14 x 2 8 x 3 5 x 5 − 2 x 6 9 x 7 − 3 x 8 339 − 4 x 1 10 x 2 6 x 3 4 x 4 − 14 x 5 − 2 x 6 − 14 x 7 8 x 8 − 114 − 1 x 1 − 6 x 2 5 x 3 − 12 x 4 3 x 5 − 3 x 6 2 x 7 − 2 x 8 30 5 x 1 − 2 x 2 3 x 3 10 x 4 5 x 5 11 x 6 4 x 7 − 8 x 8 126 − 15 x 1 − 15 x 2 − 8 x 3 − 15 x 4 7 x 5 − 4 x 6 − 12 x 7 2 x 8 − 395 11 x 1 − 10 x 2 − 2 x 3 4 x 4 3 x 5 − 9 x 6 − 6 x 7 7 x 8 − 87 − 14 x 1 4 x 3 − 3 x 4 5 x 5 10 x 6 13 x 7 7 x 8 422 − 3 x 1 − 7 x 2 − 2 x 3 − 8 x 4 − 6 x 6 − 5 x 7 − 9 x 8 − 309 \left\{\begin{aligned} \ 14x_2 8x_3 5x_5 -2x_6 9x_7 -3x_8 339\\-4x_1 10x_2 6x_3 4x_4 -14x_5 -2x_6 -14x_7 8x_8 -114\\-1x_1 -6x_2 5x_3 -12x_4 3x_5 -3x_6 2x_7 -2x_8 30\\5x_1 -2x_2 3x_3 10x_4 5x_5 11x_6 4x_7 -8x_8 126\\-15x_1 -15x_2 -8x_3 -15x_4 7x_5 -4x_6 -12x_7 2x_8 -395\\11x_1 -10x_2 -2x_3 4x_4 3x_5 -9x_6 -6x_7 7x_8 -87\\-14x_1 4x_3 -3x_4 5x_5 10x_6 13x_7 7x_8 422\\-3x_1 -7x_2 -2x_3 -8x_4 -6x_6 -5x_7 -9x_8 -309 \end{aligned}\right. ⎩ ⎨ ⎧ 14x28x35x5−2x69x7−3x8339−4x110x26x34x4−14x5−2x6−14x78x8−114−1x1−6x25x3−12x43x5−3x62x7−2x8305x1−2x23x310x45x511x64x7−8x8126−15x1−15x2−8x3−15x47x5−4x6−12x72x8−39511x1−10x2−2x34x43x5−9x6−6x77x8−87−14x14x3−3x45x510x613x77x8422−3x1−7x2−2x3−8x4−6x6−5x7−9x8−309
# 上面八元一次方程对应的X数据
X np.array([[ 0 ,14 , 8 , 0 , 5, -2, 9, -3],[ -4 , 10 , 6 , 4 ,-14 , -2 ,-14 , 8],[ -1 , -6 , 5 ,-12 , 3 , -3 , 2 , -2],[ 5 , -2 , 3 , 10 , 5 , 11 , 4 ,-8],[-15 ,-15 ,-8 ,-15 , 7 , -4, -12 , 2],[ 11 ,-10 , -2 , 4 , 3 , -9 , -6 , 7],[-14 , 0 , 4 , -3 , 5 , 10 , 13 , 7],[ -3 , -7 , -2 , -8 , 0 , -6 , -5 , -9]])
# 对应的y
y np.array([ 339 ,-114 , 30 , 126, -395 , -87 , 422, -309])
display(X,y)2.3、矩阵转置公式与求导公式
转置公式如下 ( m A ) T m A T (mA)^T mA^T (mA)TmAT其中m是常数 ( A B ) T A T B T (A B)^T A^T B^T (AB)TATBT ( A B ) T B T A T (AB)^T B^TA^T (AB)TBTAT ( A T ) T A (A^T)^T A (AT)TA
假设我们有一个矩阵 A A A它是一个 3 × 2 3 \times 2 3×2 的矩阵其中包含了 6 6 6 个元素。我们可以将其表示为 A ( 1 2 3 4 5 6 ) A \begin{pmatrix} 1 2 \\ 3 4 \\ 5 6 \\ \end{pmatrix} A 135246
现在如果我们想要转置矩阵 A A A我们可以将 A A A 中的行和列互换。这样就得到了一个新的矩阵 A T A^T AT它的行数和 A A A 的列数相等列数和 A A A 的行数相等。在这种情况下 A T A^T AT 是一个 2 × 3 2 \times 3 2×3 的矩阵。我们可以使用下面的公式来计算 A T A^T AT A i , j T A j , i A^T_{i,j} A_{j,i} Ai,jTAj,i
也就是说新矩阵中的第 i i i 行和第 j j j 列的元素等于原矩阵中的第 j j j 行和第 i i i 列的元素。
下面是具体的演示 A T ( 1 3 5 2 4 6 ) A^T \begin{pmatrix} 1 3 5 \\ 2 4 6 \\ \end{pmatrix} AT(123456)
在上面的例子中我们首先写出了矩阵 A A A然后使用公式 A i , j T A j , i A^T_{i,j} A_{j,i} Ai,jTAj,i 将其转置为矩阵 A T A^T AT。转置矩阵的行和列与原矩阵相反其中原矩阵的第 i i i 行变为了新矩阵的第 i i i 列原矩阵的第 j j j 列变为了新矩阵的第 j j j 行。
求导公式如下
$ ∂ X T ∂ X I \frac{\partial X^T}{\partial X} I ∂X∂XTI 求解出来是单位矩阵 ∂ X T A ∂ X A \frac{\partial X^TA}{\partial X} A ∂X∂XTAA$ ∂ A X T ∂ X A \frac{\partial AX^T}{\partial X} A ∂X∂AXTA ∂ A X ∂ X A T \frac{\partial AX}{\partial X} A^T ∂X∂AXAT ∂ X A ∂ X A T \frac{\partial XA}{\partial X} A^T ∂X∂XAAT ∂ X T A X ∂ X ( A A T ) X ; \frac{\partial X^TAX}{\partial X} (A A^T)X; ∂X∂XTAX(AAT)X; A不是对称矩阵 ∂ X T A X ∂ X 2 A X ; \frac{\partial X^TAX}{\partial X} 2AX; ∂X∂XTAX2AX; A是对称矩阵
2.4、推导正规方程 θ \theta θ 的解
矩阵乘法公式展开 J ( θ ) 1 2 ( X θ − y ) T ( X θ − y ) J(\theta) \frac{1}{2}(X\theta - y)^T(X\theta - y) J(θ)21(Xθ−y)T(Xθ−y) J ( θ ) 1 2 ( θ T X T − y T ) ( X θ − y ) J(\theta) \frac{1}{2}(\theta^TX^T - y^T)(X\theta - y) J(θ)21(θTXT−yT)(Xθ−y) J ( θ ) 1 2 ( θ T X T X θ − θ T X T y − y T X θ y T y ) J(\theta) \frac{1}{2}(\theta^TX^TX\theta - \theta^TX^Ty -y^TX\theta y^Ty) J(θ)21(θTXTXθ−θTXTy−yTXθyTy)
进行求导注意X、y是已知量 θ \theta θ 是未知数 J ′ ( θ ) 1 2 ( θ T X T X θ − θ T X T y − y T X θ y T y ) ′ J(\theta) \frac{1}{2}(\theta^TX^TX\theta - \theta^TX^Ty -y^TX\theta y^Ty) J′(θ)21(θTXTXθ−θTXTy−yTXθyTy)′ y T y y^Ty yTy 是常量 J ′ ( θ ) 1 2 ( ( θ T X T X θ ) ′ − ( θ T X T y ) ′ − ( y T X θ ) ′ ) J(\theta) \frac{1}{2}((\theta^TX^TX\theta) - (\theta^TX^Ty) -(y^TX\theta)) J′(θ)21((θTXTXθ)′−(θTXTy)′−(yTXθ)′)
根据2.3、矩阵转置公式与求导公式可知 J ′ ( θ ) 1 2 ( ( θ T X T X θ ) ′ − X T y − ( y T X ) T ) J(\theta) \frac{1}{2}((\theta^TX^TX\theta) - X^Ty -(y^TX)^T) J′(θ)21((θTXTXθ)′−XTy−(yTX)T) J ′ ( θ ) 1 2 ( X T X θ ( θ T X T X ) T − X T y − ( y T X ) T ) J(\theta) \frac{1}{2}(X^TX\theta (\theta^TX^TX)^T- X^Ty -(y^TX)^T) J′(θ)21(XTXθ(θTXTX)T−XTy−(yTX)T) J ′ ( θ ) 1 2 ( X T X θ X T X θ − X T y − X T y ) J(\theta) \frac{1}{2}(X^TX\theta X^TX\theta- X^Ty -X^Ty) J′(θ)21(XTXθXTXθ−XTy−XTy)
根据上面求导公式进行运算 J ′ ( θ ) 1 2 ( X T X θ ( θ T X T X ) T − X T y − ( y T X ) T ) J(\theta) \frac{1}{2}(X^TX\theta (\theta^TX^TX)^T-X^Ty - (y^TX)^T) J′(θ)21(XTXθ(θTXTX)T−XTy−(yTX)T) J ′ ( θ ) 1 2 ( X T X θ X T X θ − X T y − X T y ) J(\theta) \frac{1}{2}(X^TX\theta X^TX\theta -X^Ty - X^Ty) J′(θ)21(XTXθXTXθ−XTy−XTy) J ′ ( θ ) 1 2 ( 2 X T X θ − 2 X T y ) J(\theta) \frac{1}{2}(2X^TX\theta -2X^Ty) J′(θ)21(2XTXθ−2XTy) J ′ ( θ ) X T X θ − X T y J(\theta) X^TX\theta -X^Ty J′(θ)XTXθ−XTy J ′ ( θ ) X T ( X θ − y ) J(\theta) X^T(X\theta -y) J′(θ)XT(Xθ−y) 矩阵运算分配律
令导数 J ′ ( θ ) 0 J(\theta) 0 J′(θ)0 0 X T X θ − X T y 0 X^TX\theta -X^Ty 0XTXθ−XTy X T X θ X T y X^TX\theta X^Ty XTXθXTy
矩阵没有除法使用逆矩阵进行转化 ( X T X ) − 1 X T X θ ( X T X ) − 1 X T y (X^TX)^{-1}X^TX\theta (X^TX)^{-1}X^Ty (XTX)−1XTXθ(XTX)−1XTy I θ ( X T X ) − 1 X T y I\theta (X^TX)^{-1}X^Ty Iθ(XTX)−1XTy θ ( X T X ) − 1 X T y \theta (X^TX)^{-1}X^Ty θ(XTX)−1XTy
到此为止公式推导出来了~