网站开发的原理,做期货要关注哪些网站,柳江网站虚拟主机公司,多php网站空间一元线性回归
变量间的关系 变量与变量之间的关系分为确定性关系和相关性关系。 确定性关系是指当自变量给定一个值的时候#xff0c;就能计算出应变量的值。例如物体下落高度h与下落时间t的关系#xff1a;h12gt2。 相关性关系是指变量之间的关系不确定#xff0c;表…一元线性回归
变量间的关系 变量与变量之间的关系分为确定性关系和相关性关系。 确定性关系是指当自变量给定一个值的时候就能计算出应变量的值。例如物体下落高度h与下落时间t的关系h12gt2h=\dfrac{1}{2}gt^2。 相关性关系是指变量之间的关系不确定表现为具有随机性的一种“趋势”。对自变量X的同一个值取得的因变量Y的值可能不同而且是随机的。但对应X在一定范围内的不同值可以观测到Y随X的变化呈现出一定的趋势。E(Y)μ(x)E(Y)=\mu(x)这句话说得真是妙。以前因果关系这样的逻辑深深地刻在脑海里总觉得所有事情都是由AB。这种即随机又趋势的这种关系从未曾理解过 相关性关系的例子生活中是有很多的。身高和体重没有确定的函数关系但从统计意义上讲身高高的体重大。
概念与模型 一元线性回归研究一个变量对另外一个变量的影响。 解释变量x 响应变量Y Y的变化除了X的影响外还有其他随机因素的影响记为ε\varepsilon 对从总体(x,Y)中抽取的一个样本(x1,Y1),(x2,Y2),....(xn,Yn)(x_1,Y_1),(x_2,Y_2),....(x_n,Y_n)。字母大小写区别了是解释变量还是响应变量。 Yiβ0β1xiεiY_i=\beta_0+\beta_1x_i+\varepsilon_i,i1,2..n εi\varepsilon_i~N(0,σ2)N(0,\sigma^2)且相互独立 β0,β1\beta_0,\beta_1是回归系数未知σ2\sigma^2未知 y关于x的一元线性回归y^β^0β^1xi\hat y=\hat \beta_0+\hat\beta_1x_i 样本值(x1,y1),(x2,y2)...(xn,yn)(x_1,y_1),(x_2,y_2)...(x_n,y_n)
回归系数估计 β0,β1\beta_0,\beta_1的估计采用最小二乘法。 Q(β0,β1)∑ni1(yi−(β0βixi))2Q(\beta_0,\beta_1)=\sum_{i=1}^{n}(y_i-(\beta_0+\beta_ix_i))^2能够使得Q(β0,β1)Q(\beta_0,\beta_1)最小的β0,β1\beta_0,\beta_1的值就是估计的β^0,β^1\hat\beta_0,\hat\beta_1。 求导导数为0得到β^0,β^1\hat\beta_0,\hat\beta_1。整理方程组得到 β^0y¯−x¯β^1\hat\beta_0=\overline y -\overline x \hat\beta_1 β^1sxy/sxx\hat\beta_1=s_{xy}/s_{xx} 其中x¯1n∑ni1xi\overline x=\dfrac{1}{n}\sum_{i=1}^{n}x_iy¯1n∑ni1yi\overline y=\dfrac{1}{n}\sum_{i=1}^{n}y_isxx∑ni1(xi−x¯)2s_{xx}=\sum_{i=1}^{n}(x_i-\overline x)^2sxy∑ni1(xi−x¯)(yi−y¯)s_{xy}=\sum_{i=1}^{n}(x_i-\overline x)(y_i-\overline y)syy∑ni1(yi−y¯)2s_{yy}=\sum_{i=1}^{n}(y_i-\overline y)^2 说明最小二乘法事先并不需要知道Y与x之间一定有线性关系。可以通过专业知识或者根据实际观测的数据用假设检验方法来判断。
σ2\sigma^2估计 eiyi−y^ie_i=y_i-\hat y_ieie_i是εi\varepsilon_i的估计。 σ2D(εi)E(εi)2\sigma^2=D(\varepsilon_i)=E(\varepsilon_i)^2 用残差平方和∑ni1(yi−y^i)2\sum_{i=1}^{n}(y_i-\hat y_i)^2估计σ2\sigma^2 可以证明E(∑ni1(yi−y^i)2)(n−2)σ2E(\sum_{i=1}^{n}(y_i-\hat y_i)^2)=(n-2)\sigma^2因此S21n−2∑ni1(yi−y^i)2S^2=\dfrac{1}{n-2}\sum_{i=1}^{n}(y_i-\hat y_i)^2是σ2\sigma^2的无偏估计。
线性假设的显著性检验
H0H_0假设 H0:β10H_0:\beta_1=0 H1:β1≠0H_1:\beta_1 \ne 0 如果接受H0H_0x与Y没有线性关系回归方程无意义如果拒绝H0H_0说明回归效果显著。 x与Y没有回归效果不显著的原因可能有1 影响Y的因素除了x还有别的因素且不能忽略2E(Y)与x的关系不是线性关系而是其他关系3Y与x没关系。
回归方程检验
回归系数检验
回归系数的置信区间 (β^1±tα/2(n−2)ssxx−−−√)(\hat \beta_1\pm t_{\alpha/2}(n-2)\dfrac{s}{\sqrt{s_{xx}}})
一元线性回归方程的应用–预测 y^0β^0β^1x0\hat y_0=\hat\beta_0+\hat \beta_1x_0 在xx0x=x_0点预测y0y_0。