当前位置: 首页 > news >正文

网站外包一般多少钱啊东莞圆心科技网站开发

网站外包一般多少钱啊,东莞圆心科技网站开发,做网站都能用什么做,app制作开发报价机器学习是目前人工智能最令人激动的研究方向之一。我们可能更关注机器学习算法的实现细节#xff0c;沉浸于机器学习所需要的数学功底#xff0c;但对于机器学习从业者来说#xff0c;如何更好更快速的实现一个机器学习项目更值得关注。 正如吴恩达在《机器学习》这门课中所…机器学习是目前人工智能最令人激动的研究方向之一。我们可能更关注机器学习算法的实现细节沉浸于机器学习所需要的数学功底但对于机器学习从业者来说如何更好更快速的实现一个机器学习项目更值得关注。 正如吴恩达在《机器学习》这门课中所说他将花费更多的时间来教授机器学习、人工智能的最佳实践以及如何让它们工作。好的工具在会用和不会用的人之间存在着鸿沟。 当我们做一个机器学习项目时不纠结于各个模型算法的内部细节从整体的角度看具体问题该如何更可靠更高效得出结论才不至于浪费更多的时间。从对数学的焦虑中众多算法的选择中抽身出来 去思考以下几个问题 我们如何在项目中选择更为合适的算法 选择算法之后如何知道我们的模型是更有用的或更好的 如何进一步优化模型以达到更理想的效果 本文将基于上述几个问题展开在此之前首先明确几个概念。 机器学习机器学习是一门涉及多领域多门学科理论的交叉学科通过一个程序使其能从已有的经验中学习从而能提升对某一项任务的解决能力。有监督学习有监督学习是指需要给出一定量的标签指导计算机去完成任务。就像一个学生需要在老师的教导启发下进行学习。如预测房屋的价格需要预先知道一些房屋的价格以及房屋的有关属性的数据对已有数据进行训练后得到的模型将会产生对不同属性房屋特性的价格预测情况。无监督学习无监督学习顾名思义是指不需要给定标签让模型自己训练得出结论。类似于一个学生通过自己的积累产生对知识的理解。如有一些房屋的有关属性的数据 模型可以自动识别出哪些特征是属于市中心的房子 哪些事属于郊区的房子得到的模型可以产生对不同房屋属性的类别的判断。 01.选择合适的算法 针对具体的问题选择不同的算法。 如一个分类问题可优先选择逻辑回归支持向量机神经网络等模型数据集较大的问题优先选择朴素贝叶斯方法决策树和逻辑回归具有可解释性。聚类问题我们可能会考虑层次分析k均值模型。 如果数据集的特征很多可以考虑采用主成分分析线性判别分析等进行降维。  第一步明确具体问题 有监督学习主要有回归和分类任务 回归是研究因变量与自变量之间关系的方法。上文所说的房屋价格的预测的例子就是一个回归问题构建房屋价格与房屋其他属性之间关系的模型 实现新房屋的价格的预测我们预测的是一个模型的连续性的值。 分类将数据集按照不同的特点分为不同的类别。如金融市场中一个常见的预测股价涨跌的示例给定一段时间内股价的涨跌方向作为模型的输出即我们设定的标签预测后一段时间股价的涨跌情况这里的结果只会有涨和跌两种情况预测的是间断的值。 无监督学习主要有聚类和降维任务 聚类将数据集分为多个类似的对象组成的多个类。当我们在网站上搜索一条内容的时候网站会有相似的内容推荐这是因为网站通过聚类的方式将有相似浏览特征的客户聚集在一起共同分析以便更了解客户。聚类与分类的差别是分类是我们知道怎样的特征能够属于一类并设定了标签而聚类分的类别则完全是模型自主切分。降维的基本原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间从而降低了原数据集的维度同时又能尽量减少数据信息的丢失。经过降维一方面可以对数据进行可视化研究另一方面由于数据量大大减少将提高机器学习的效率。 第二步选择算法 确项目的任务对算法有进一步的了解可以帮助我们了解模型的使用细节以便更快速实现模型。 我们将一些算法模型整理成如下思维导图的形式并对相关算法的基本思想做了简单阐述。 你可以很快速的浏览每个算法的核心及应用在面对实际问题时做出大致的判断。 我们论述了有关问题的定位以及相关算法模型的选择但需要注意的是我们已经针对算法模型有一个初步的定位在实践过程中仍然需要将实际数据与模型结合考虑。最初尝试时可以使用较少的数据量快速过滤出一些算法最终选定少数的算法进行后续的优化。同时对数据的理解程度也将影响模型的选择对数据越熟悉越能够做出更高效的判断。 02.模型评估 选择合适的算法之后如何知道我们所设计的模型是有用的或者较好的 机器学习是利用模型对数据进行拟合对训练集进行拟合训练模型对样本外数据集进行预测。其中模型对训练集数据的误差称为经验误差 对测试集数据的误差称为泛化误差。模型对样本外数据集的预测能力称为模型的泛化能力。 过拟合与欠拟合 欠拟合和过拟合都是模型泛化能力不高的表现。欠拟合通常表现为模型学习能力不足没有学习到数据的一般规律。而过拟合则是模型捕捉到数据中太多的特征以至于将所有特征都认为是数据的一般规律。如下图树叶的示例很形象的表达了欠拟合与过拟合。 我们希望的状态是模型能训练出数据的一般规律既不过拟合也不欠拟合。如下图所示最左侧可能是一种欠拟合状态拟合的函数和训练集的误差较大最右侧是过拟合拟合的函数与训练集几乎完全匹配这种情况在测试集中结果反而会变差。由此需要构建评估模型来评估模型的泛化能力这是检验一个模型是否更为有效的方法。 评估方法 将一个模型的训练集也当作测试集会导致对模型泛化能力的评估不准确因此我们需要将数据拆分即使用训练集进行训练 测试集进行验证评估模型的准确性 两个数据集不相交从而验证模型的泛化能力。 常见的模型评估方法有留出法k折交叉验证法和自助法 K折交叉验证中k一般会选择5,10,20其中k越大需要训练的次数越长其误差估计的效果也越好。在验证中训练集和测试集的数据分布应尽可能一致如果不一致可能会影响测试集的误差。 03.优化模型 评估模型的泛化能力评估当模型的应用不理想时我们应该如何优化模型 假设我们在做一个预测模型时 预测的结果与实际有很大的误差。我们知道模型不理想主要来源于模型的欠拟合和过拟合接下来该如何做 学习曲线 考虑使用学习曲线来判断模型的过拟合问题。 学习曲线是通过画出不同训练集大小时训练集和交叉验证的准确率可以看到模型在新数据上的表现进而判断模型是否方差偏高或偏差过高以及增大训练集是否可以减小过拟合。 当训练集与测试集的误差收敛但却很高时为高偏差左上角偏差较高训练集和验证集的准确率很低可能是欠拟合。当训练集与测试集的误差之间有很大的差距时为高方差右上角中方差较高训练集的准确率要高于验证集的准确率可能是过拟合。理想的状况是偏差和方差都很小此时既不欠拟合也不过拟合。  优化模型 基于上文当模型出现过拟合或欠拟合时可从以下几个方面考虑 1. 数据量的多少。较少的数据量更容易过拟合增大数据量对过拟合是有效的。2. 增加或减少特征量。特征值较少会影响模型对样本数据的认识导致欠拟合增加特征值对欠拟合时有效的。3. 增加或减少正则化。正则化的使用对过拟合是有效的。 具体可以参见以下思维导图   一个机器学习项目是实践与理论相结合的过程通过实践加深对理论的认识学习理论提高对实际问题的应用能力。在不断熟悉实际问题的数据类型与背景的过程中通过训练机器学习模型使用各种方法调整并优化模型以得到满意的结论这一过程可能比单一熟悉机器学习算法理论耗时要长。 通常情况下我们会花更多的时间在数据的预处理和参数调优上需要不断调整数据优化模型直到达到较为理想的效果。  转载于:https://www.cnblogs.com/yyy-blog/p/10400885.html
http://www.zqtcl.cn/news/514580/

相关文章:

  • 上海网站定制设计图wordpress网站在线安装
  • 互动网站的核心技术wordpress不用插件
  • 厦门市建设工程交易中心网站怎么自己做游戏软件的app
  • 网站论文参考文献人力资源公司名称大全简单大气
  • 射阳做企业网站哪家好wordpress 进销存
  • 青海个人旅游网站建设wordpress用户名密码加密方式
  • 安徽平台网站建设找哪家wordpress首页加登录
  • 雅安市住房和城乡建设局网站湖南全程电子化服务平台官网
  • dw做的上传网站打不开网页制作培训价格
  • 工程网站怎么做广州做网站平台
  • 成都网站建设 全美深圳定制网站建设
  • 邢台网站建设与制作陕西高速公路建设集团网站
  • 太原 招聘 网站建设 技术经理关于 建设 二级网站
  • 如何做网站店铺的模板著名的响应式网站有哪些
  • 相城区建设网站做网站 设计师很
  • python网站开发好吗广州软件外包
  • 山东能源集团 网站建设对网站建设功能的情况说明
  • 网站设计个人各种类型网站建设口碑好
  • 西安巨久科技网站建设嘚嘚笔记 wordpress主推
  • 杭州利兴建设官方网站上海专业网站建设费
  • 自适应网站制作费用中国建设网官方网站企业登录
  • h5网站和传统网站区别电子商务主要学什么就业方向及前景
  • 凡科建站弊端各学院二级网站建设通报
  • 做网站怎么注册营业执照民制作网站哪家便宜
  • 临沂做进销存网站推广软件公司
  • 网站前端建设唐山网站建设托管
  • 做效果图有哪些网站seo怎么做关键词排名
  • 深圳手机网站开发什么网站可以做英语题
  • 网站优化什么意思图片展示网站
  • 建德做网站米趋外贸网站建设