当前位置: 首页 > news >正文

自己的网站统计输入词wordpress随机播放器

自己的网站统计输入词,wordpress随机播放器,办公室装修注意事项,app制作教程视频转载自#xff1a; 【精选】机器学习#xff1a;支持向量机#xff08;SVM#xff09;-CSDN博客 1.概述 1.1#xff0c;概念 支持向量机#xff08;SVM#xff09;是一类按监督学习方式对数据进行二元分类的广义线性分类器#xff0c;其决策边界是对学习样本求解的最…转载自 【精选】机器学习支持向量机SVM-CSDN博客 1.概述 1.1概念 支持向量机SVM是一类按监督学习方式对数据进行二元分类的广义线性分类器其决策边界是对学习样本求解的最大边距超平面可以将问题化为一个求解凸二次规划的问题。与逻辑回归和神经网络相比支持向量机在学习复杂的非线性方程时提供了一种更为清晰更加强大的方式。 具体来说就是在线性可分时在原空间寻找两类样本的最优分类超平面。在线性不可分时加入松弛变量并通过使用非线性映射将低维度输入空间的样本映射到高维度空间使其变为线性可分这样就可以在该特征空间中寻找最优分类超平面。 SVM使用准则nn 为特征数 为训练样本数。 如果相较于mm而言nn要大许多即训练集数据量不够支持我们训练一个复杂的非线性模型我们选用逻辑回归模型或者不带核函数的支持向量机。 如果nn较小而且mm大小中等例如nn在 1-1000 之间而mm在10-10000之间使用高斯核函数的支持向量机。 如果nn较小而mm较大例如nn在1-1000之间而大于50000则使用支持向量机会非常慢解决方案是创造、增加更多的特征然后使用逻辑回归或不带核函数的支持向量机。 1.2 SVM的优缺点 优点 支持向量机算法可以解决小样本情况下的机器学习问题简化了通常的分类和回归等问题。 由于采用核函数方法克服了维数灾难和非线性可分的问题所以向高维空间映射时没有增加计算的复杂性。换句话说由于支持向量计算法的最终决策函数只由少数的支持向量所确定所以计算的复杂性取决于支持向量的数目而不是样本空间的维数。 支持向量机算法利用松弛变量可以允许一些点到分类平面的距离不满足原先要求从而避免这些点对模型学习的影响。 缺点 支持向量机算法对大规模训练样本难以实施。这是因为支持向量机算法借助二次规划求解支持向量这其中会涉及m阶矩阵的计算所以矩阵阶数很大时将耗费大量的机器内存和运算时间。 经典的支持向量机算法只给出了二分类的算法而在数据挖掘的实际应用中一般要解决多分类问题但支持向量机对于多分类问题解决效果并不理想。 SVM算法效果与核函数的选择关系很大往往需要尝试多种核函数即使选择了效果比较好的高斯核函数也要调参选择恰当的  参数。另一方面就是现在常用的SVM理论都是使用固定惩罚系数 但正负样本的两种错误造成的损失是不一样的。 2.硬间隔 2.1 求解间隔 2.2.对偶问题  2.3感知机与SVM线性可分的区别 感知机的目的是尽可能使得所有样本分类正确而SVM的目标是分类间隔最大化。支持向量机追求大致正确分类的同时一定程度上避免过拟合。 感知机使用的学习策略是梯度下降而SVM采用的是由约束条件构造拉格朗日函数然后求偏导为0求得极值点。   3软间隔 4核函数  5模型评估和超参数调优 5.1模型评估 Holdout检验Holdout检验是最简单也是最直接的验证方法它将原始的样本集合随机划分成训练集和验证集两部分。比方说对于一个2分类问题将样本按照7:3的比例分成两部分70%的样本用于模型训练30%的样本用于模型验证包括绘制ROC曲线、计算精确率和召回率等指标来评估模型性能。 Holdout检验的缺点很明显即在验证集上计算出来的最后评估指标与原始分组有很大关系。 交叉验证 k-fold交叉验证首先将全部样本划分成k个大小相等的样本子集依次遍历这k个子集每次把当前子集作为验证集其余所有子集作为训练集进行模型的训练和评估最后把k次评估指标的平均值作为最终的评估指标k通常取10。 留一验证每次留下1个样本作为验证集其余所有样本作为测试集。样本总数为n依次对n个样本进行遍历进行n次验证再将评估指标求平均值得到最终的评估指标。在样本总数较多的情况下留一验证法的时间开销极大。 留p验证每次留下p个样本作为验证集而从n个元素中选择p个元素有种可能因此它的时间开销更是远远高于留一验证故而很少在实际中应用。 5.2超参数调优 超参数搜索算法一般包括目标函数算法需要最大化/最小化的目标、搜索范围通过上限和下限来确定、算法的其他参数搜索步长。 网格搜索网格搜索是最简单、应用最广泛的超参数搜索算法它通过查找搜索范围内的所有的点来确定最优值。如果采用较大的搜索范围以及较小的步长网格搜索有很大概率找到全局最优值。然而这种搜索方案十分消耗计算资源和时间特别是需要调优的超参数比较多时。因此在实际应用中网格搜索算法一般会先使用较广的搜索范围和较大的步长来寻找更精确的最优值。这种方案可以降低所需的时间和计算量但由于目标函数一般是非凸的所以很可能会错过全局最优值。 随机搜索随机搜索的思想与网格搜索比较相似只是不再测试上界和下界之间的所有值而是在搜索范围中随机选取样本点。它的理论依据是如果样本点集足够大那么通过随机采样也能大概率地找到全局最优值或其近似值。随机搜索一般会比网格搜索要快一些但是和网格搜索一样结果无法保证。 贝叶斯优化算法贝叶斯优化算法在寻找最优参数时采用了与网格搜索、随机搜索完全不同的方法。网格搜索和随机搜索在测试一个新点时会忽略前一个点的信息而贝叶斯优化算法则充分利用了之前的信息。贝叶斯优化算法通过对目标函数形状进行学习找到使目标函数向全局最优值提升的参数。具体来说它的学习目标函数形状的方法是首先根据先验分布假设一个搜索函数然后每一次使用新的采样点来测试目标函数时利用这个信息来更新目标函数的先验分布最后算法测试由后验分布给出全局最值最可能出现的位置的点。对于贝叶斯优化算法有一个需要注意的地方一旦找到了一个局部最优值它会在该区域不断采样所以很容易陷入局部最优值。为了弥补这个缺陷贝叶斯优化算法会在探索和利用之间找到一个平衡点“探索”就是在未取样的区域获取采样点而“利用”则是根据后验分布在最可能出现的全局最值的区域进行采样。
http://www.zqtcl.cn/news/404335/

相关文章:

  • 做网站选哪个语言软文营销的方法
  • 青岛正规公司网站建设公司中国建设银行注册网站
  • 免费个人网站平台关键词检索
  • 定制型网站建设推广宁河网站建设
  • 主流网站开发语言有哪些电子邮件营销
  • 扫描二维码进入公司网站怎样做在万网上域名了怎么做网站
  • 销售型网站设计怎么做网站广告位
  • 网站推广的方法ppt购物网站logo
  • 网站关键词分割wordpress为展示的作品投票
  • 建立网站 域名 服务器吗wordpress超链接出错
  • 外贸开发网站建设注册会计师协会
  • 莆田建设网站dw网页设计作品及源码
  • 360免费建站视频淘宝客的网站怎么做
  • 四川自助seo建站短视频推广计划
  • 网站建设案例的公司黄冈网站建设公司
  • 做淘客网站需要营业执照吗制作网站公
  • 手机网站开发的目的鲁班设计远程工作
  • 宿迁网站建设要多少钱高密市住房和城乡建设局网站
  • 咸阳网站建设公司哪家好wordpress访客ip记录
  • 厦门建设银行网站那个网站做效果图电脑配置
  • 人才网站建设医院网站建设的好处
  • 房屋装修网站模板html5做网站
  • 网站建设需要的硬件网站建设知名公司排名
  • 绥化网站建设私自搭建vps犯法吗
  • 建设专业网站哪家比较好小程序源码是什么意思
  • 网站设计一般包括什么给公司做网站数据分析
  • 网站根目录在哪里1024cctvcom戊人影祝
  • wordpress转发微信南宁seo企业优化
  • 红旗渠建设集团网站昭通网络推广
  • 海陵区建设局网站计算机网站建设考试试卷