当前位置: 首页 > news >正文

网站有个栏目不想被搜索引擎收录要怎么办图怪兽在线制作图片

网站有个栏目不想被搜索引擎收录要怎么办,图怪兽在线制作图片,网站建站建设多少钱,免费建站推广模型评估 在进行回归和分类时#xff0c;为了进行预测#xff0c;我们定义了函数 f θ ( x ) f_\theta(x) fθ​(x)#xff0c;然后根据训练数据求出了函数的参数 θ \theta θ。 如何预测函数 f θ ( x ) f_\theta(x) fθ​(x)的精度#xff1f;看它能否很好的拟合训练数…模型评估 在进行回归和分类时为了进行预测我们定义了函数 f θ ( x ) f_\theta(x) fθ​(x)然后根据训练数据求出了函数的参数 θ \theta θ。 如何预测函数 f θ ( x ) f_\theta(x) fθ​(x)的精度看它能否很好的拟合训练数据 我们需要能够定量的表示机器学习模型的精度这就是模型的评估。 交叉验证 回归问题的验证 把获取的全部训练数据分成两份一份用于测试一份用于训练。前者来评估模型。一般37或者28这种训练数据更多的比例。 如图点击量预测的回归问题 f θ ( x ) f_\theta(x) fθ​(x)是二次函数拟合效果更好但考虑测试数据的话二次函数完全不行。 对于回归只要在训练好的模型上计算测试数据的误差的平方再取其平均值即可假设训练数据有 n n n个可以这样计算。 1 n ∑ i 1 n ( y ( i ) − f θ ( x ( i ) ) ) 2 \frac1n\sum\limits_{i1}^n(y^{(i)}-f_\theta(x^{(i)}))^2 n1​i1∑n​(y(i)−fθ​(x(i)))2 对于点击量的回归问题 y ( i ) y^{(i)} y(i)就是点击量 x ( i ) x^{(i)} x(i)就是广告费。 这个值被称为均方误差或者MSE(Mean Square Error) 这个误差越小精度就越高模型就越好。 分类问题的验证 数据这样分配 θ T x \theta^Tx θTx是一次函数 若 θ T x \theta^Tx θTx更复杂可能会这样紧贴着训练数据进行分类。 我们是根据图像为横向的概率来分类分类是否成功就会有下面 4 种情况。 可以这样计算分类的精度 A c c u r a c y T P T N T P F P F N T N Accuracy\frac{TPTN}{TPFPFNTN} AccuracyTPFPFNTNTPTN​ 它表示的是在整个数据集中被正确分类的数据 T P TP TP和 T N TN TN所占的比例。 精确率和召回率 有时候只看 A c c u r a c y Accuracy Accuracy会出问题 如果数据量极其不平衡 模型把全部数据分类为 Negative,不是好模型但精度会很高。 所以我们加入别的指标 精确率 P r e c i s i o n T P T P F P Precision\frac{TP}{TPFP} PrecisionTPFPTP​ 这个指标只关注 TP 和 FP。根据表达式来看它的含义是在被分类为 Positive 的数据中实际就是 Positive 的数据所占的比例 召回率 R e c a l l T P T P F N Recall\frac{TP}{TPFN} RecallTPFNTP​ 这个指标只关注 TP 和 FN。根据表达式来看它的含义是在 Positive 数据中实际被分类为 Positive 的数据所占的比例 基于这两个指标来考虑精度比较好。 但是一个高一个低就不好评估为此出现判定综合性能的指标F值。 F m e a s u r e 2 1 P r e c i s i o n 1 R e c a l l Fmeasure\frac{2}{\frac{1}{Precision}\frac1{Recall}} FmeasurePrecision1​Recall1​2​ 变形后 F m e a s u r e 2 ⋅ P r e c i s i o n ⋅ R e c a l l P r e c i s i o n R e c a l l Fmeasure\frac{2\cdot Precision\cdot Recall}{PrecisionRecall} FmeasurePrecisionRecall2⋅Precision⋅Recall​ F值称为F1值更准确 还有带权重的F值指标 W e i g h t e d F m e a s u r e ( 1 β 2 ) ⋅ P r e c i s i o n ⋅ R e c a l l β 2 ⋅ P r e c i s i o n R e c a l l WeightedFmeasure\frac{(1\beta^2)\cdot Precision\cdot Recall}{\beta^2\cdot PrecisionRecall} WeightedFmeasureβ2⋅PrecisionRecall(1β2)⋅Precision⋅Recall​ 之前的精确率和召回率是以 T P TP TP为主进行计算的也可以以TN为主。 P r e c i s i o n T N T N F N Precision\frac{TN}{TNFN} PrecisionTNFNTN​ R e c a l l T N T N F P Recall\frac{TN}{TNFP} RecallTNFPTN​ 把全部训练数据分为测试数据和训练数据的做法称为交叉验证 交叉验证中尤为有名的是K折交叉验证 把全部训练数据分为 K K K 份将 K − 1 K − 1 K−1 份数据用作训练数据剩下的 1 份用作测试数据每次更换训练数据和测试数据重复进行 K K K 次交叉验证最后计算 K K K 个精度的平均值把它作为最终的精度 假设进行4折交叉验证那么就会如图这样测试精度。 全部训练数据的量很大不切实际增大 K K K值会非常耗时要确定一个合适的 K K K值。 正则化 过拟合 只能拟合训练数据的状态被称为过拟合 有几种方法可以避免过拟合 增加全部训练数据的数量使用简单的模型正则化 正则化的方法 对于回归问题 E ( θ ) 1 2 ∑ i 1 n ( y ( i ) − f θ ( x ( i ) ) 2 E(\theta)\frac12\sum\limits_{i1}^n(y^{(i)}-f_\theta(x^{(i)})^2 E(θ)21​i1∑n​(y(i)−fθ​(x(i))2 向这个目标函数增加一个正则化项 R ( θ ) λ 2 ∑ j 1 m θ j 2 R(\theta)\frac\lambda2\sum\limits_{j1}^m\theta_j^2 R(θ)2λ​j1∑m​θj2​ ( m m m是参数的个数) 一般不对 θ 0 \theta_0 θ0​应用正则化假如预测函数的表达式为 f θ ( x ) θ 0 θ 1 x θ 2 x 2 f_\theta(x)\theta_0\theta_1x\theta_2x^2 fθ​(x)θ0​θ1​xθ2​x2 m 2 m2 m2意味着正则化的对象参数为 θ 1 \theta_1 θ1​和 θ 2 \theta_2 θ2​。 θ 0 \theta_0 θ0​这种只有参数的项为偏置项一般不对它进行正则化。 λ \lambda λ是决定正则化项影响程度的正的常数。 C ( θ ) 1 2 ∑ i 1 n ( y ( i ) − f θ ( x ( i ) ) 2 C(\theta)\frac12\sum\limits_{i1}^n(y^{(i)}-f_\theta(x^{(i)})^2 C(θ)21​i1∑n​(y(i)−fθ​(x(i))2 R ( θ ) λ 2 ∑ j 1 m θ j 2 R(\theta)\frac\lambda2\sum\limits_{j1}^m\theta_j^2 R(θ)2λ​j1∑m​θj2​ 这正是通过减小不需要的参数的影响将复杂模型替换为简单模型来防止过拟合的方式。 为了防止参数的影响过大在训练时要对参数施加一些惩罚。 λ \lambda λ是控制正则化惩罚的强度。 λ 0 \lambda0 λ0相当于不使用正则化。 λ \lambda λ越大正则化的惩罚就越严厉。 分类的正则化 l o g L ( θ ) ∑ i 1 n ( y ( i ) l o g f θ ( x i ) ( 1 − y ( i ) ) l o g ( 1 − f θ ( x ( i ) ) ) ) logL(\theta)\sum\limits_{i1}^n(y^{(i)}logf_\theta(x^{i}) ({1-y^{(i)}})log(1-f_\theta(x^{(i)}))) logL(θ)i1∑n​(y(i)logfθ​(xi)(1−y(i))log(1−fθ​(x(i)))) 分类也是在这个目标函数中增加正则化项就行了。 l o g L ( θ ) − ∑ i 1 n ( y ( i ) l o g f θ ( x i ) ( 1 − y ( i ) ) l o g ( 1 − f θ ( x ( i ) ) ) ) λ 2 ∑ j 1 m θ j 2 logL(\theta)-\sum\limits_{i1}^n(y^{(i)}logf_\theta(x^{i}) ({1-y^{(i)}})log(1-f_\theta(x^{(i)})))\frac\lambda2\sum\limits_{j1}^m\theta_j^2 logL(θ)−i1∑n​(y(i)logfθ​(xi)(1−y(i))log(1−fθ​(x(i))))2λ​j1∑m​θj2​ 对数似然函数本来以最大化为目标加负号使其变为和回归的目标函数一样的最小化问题像处理回归一样处理它只要加上正则化项就可以了。 包含正则化项的表达式的微分 E ( θ ) C ( θ ) R ( θ ) E(\theta)C(\theta)R(\theta) E(θ)C(θ)R(θ) 各部分进行偏微分 ∂ E ( θ ) ∂ θ j ∂ C ( θ ) ∂ θ j ∂ R ( θ ) ∂ θ j \frac{\partial E(\theta)}{\partial\theta_j} \frac{\partial C(\theta)}{\partial\theta_j} \frac{\partial R(\theta)}{\partial\theta_j} ∂θj​∂E(θ)​∂θj​∂C(θ)​∂θj​∂R(θ)​ ∂ C ( θ ) ∂ θ j ∑ i 1 n ( f θ ( x ( i ) ) − y ( i ) ) x j ( i ) \frac{\partial C(\theta)}{\partial\theta_j}\sum\limits_{i1}^n(f_\theta(x^{(i)})-y^{(i)})x_j^{(i)} ∂θj​∂C(θ)​i1∑n​(fθ​(x(i))−y(i))xj(i)​ ∂ R ( θ ) ∂ θ j λ θ j \frac{\partial R(\theta)}{\partial\theta_j}\lambda\theta_j ∂θj​∂R(θ)​λθj​ ∂ E ( θ ) ∂ θ j ∑ i 1 n ( f θ ( x ( i ) ) − y ( i ) ) x j ( i ) λ θ j \frac{\partial E(\theta)}{\partial\theta_j}\sum\limits_{i1}^n(f_\theta(x^{(i)})-y^{(i)})x_j^{(i)}\lambda\theta_j ∂θj​∂E(θ)​i1∑n​(fθ​(x(i))−y(i))xj(i)​λθj​ 得参数更新表达式 θ j : θ j − η ( ∑ i 1 n ( f θ ( x ( i ) ) − y ( i ) ) x j ( i ) λ θ j ) \theta_j:\theta_j-\eta(\sum\limits_{i1}^n(f_\theta(x^{(i)})-y^{(i)})x_j^{(i)}\lambda\theta_j) θj​:θj​−η(i1∑n​(fθ​(x(i))−y(i))xj(i)​λθj​) ( j 0 ) (j0) (j0) 这种方法叫L2正则化 还有L1正则化它的正则化项 R R R是 R ( θ ) λ ∑ i 1 m ∣ θ i ∣ R(\theta)\lambda\sum\limits_{i1}^m|\theta_i| R(θ)λi1∑m​∣θi​∣ L1 正则化的特征是被判定为不需要的参数会变为 0从而减少变量个数。而 L2 正则化不会把参数变为 0。二次式变为一次式的例子用 L1 正则化就真的可以实现了。 L2 正则化会抑制参数使变量的影响不会过大而 L1 会直接去除不要的变量。 学习曲线 欠拟合模型性能很差没有拟合训练数据的状态 区分过拟合与欠拟合 两种精度都是很差如何辨别 随着数据量的增加使用训练数据时的精度一直很高而使用测试数据时的精度一直没有上升到它的水准。只对训练数据拟合得较好这就是过拟合的特征。 这也叫作高方差。 欠拟合的图像如下 这是一种即使增加数据的数量无论是使用训练数据还是测试数据精度也都会很差的状态。 像这样展示了数据数量和精度的图称为学习曲线
http://www.zqtcl.cn/news/954828/

相关文章:

  • 软文营销推广成都seo正规优化
  • soho建设外贸网站怎样取消网站备案
  • 建设部网站实名制举报wordpress.org去掉
  • 网站地址ip域名查询公司网站建设安全的风险
  • 盐城建设厅网站设计备案网站创建服务
  • wp如何做双语网站个人网站首页内容
  • 网络推广网站排行榜百度怎么搜索网址打开网页
  • 网站制作和如何推广深圳西乡
  • 男生女生做污事网站免费西安企业展厅设计公司
  • 做网络写手最好进那个网站网页建站需要多少钱
  • 网站打开不对摄影设计说明200字
  • 无锡网站制作公司排名网站开发与应用 大作业作业
  • 网站建设中搜索引擎wordpress 不在首页显示文章
  • 先做网站先备案嘉兴网站建设推广
  • 建设法律法规文本查询网站Html手机浏览网站变形
  • 怎么拥有个人网站wordpress做的网站
  • wordpress建什么站江苏网站建设效果
  • 建设网站网站多少钱东莞网站建设 光龙
  • 天津和平做网站哪家好搞笑网站建设目的和意义
  • 一般做网站带宽选择多大的wordpress页面侧菜单
  • 海淀青岛网站建设友情链接适用网站
  • 青海建设厅官方网站资阳seo
  • 网站个人备案 企业备案深圳高端网站建设网页设计
  • 网站广东省备案国产最好的a级suv88814
  • 没有公司怎么做网站西安市市政建设网站
  • 北京网站制作net2006装饰网站建设策划书
  • 建立什么网站中小学图书馆网站建设
  • 襄阳网站建设外包任县附近网站建设价格
  • led灯网站建设案例有没有什么东西可以做网站
  • 网站可视化设计企业网络管理系统