当前位置: 首页 > news >正文

杭州做网站多少钱在家建设一个网站需要什么

杭州做网站多少钱,在家建设一个网站需要什么,手机网站弹出层插件有哪些,福田网站制作公司导读#xff1a;本文为有志于成为数据科学家或对此感兴趣的读者们介绍最流行的机器学习算法。 作者#xff1a;Fahim ul Haq 译者#xff1a;刘志勇#xff0c;策划#xff1a;赵钰莹 来源#xff1a;InfoQ#xff08;ID#xff1a;infoqchina#xff09; 机器学习是…导读本文为有志于成为数据科学家或对此感兴趣的读者们介绍最流行的机器学习算法。 作者Fahim ul Haq 译者刘志勇策划赵钰莹 来源InfoQIDinfoqchina 机器学习是该行业的一个创新且重要的领域。我们为机器学习程序选择的算法类型取决于我们想要实现的目标。 现在机器学习有很多算法。因此如此多的算法可能对于初学者来说是相当不堪重负的。今天我们将简要介绍 10 种最流行的机器学习算法这样你就可以适应这个激动人心的机器学习世界了 让我们言归正传 01 线性回归 线性回归Linear Regression可能是最流行的机器学习算法。线性回归就是要找一条直线并且让这条直线尽可能地拟合散点图中的数据点。它试图通过将直线方程与该数据拟合来表示自变量x 值和数值结果y 值。然后就可以用这条线来预测未来的值 这种算法最常用的技术是最小二乘法Least of squares。这个方法计算出最佳拟合线以使得与直线上每个数据点的垂直距离最小。总距离是所有数据点的垂直距离绿线的平方和。其思想是通过最小化这个平方误差或距离来拟合模型。 例如简单线性回归它有一个自变量x 轴和一个因变量y 轴。 02 逻辑回归 逻辑回归Logistic regression与线性回归类似但它是用于输出为二进制的情况即当结果只能有两个可能的值。对最终输出的预测是一个非线性的 S 型函数称为 logistic function, g()。 这个逻辑函数将中间结果值映射到结果变量 Y其值范围从 0 到 1。然后这些值可以解释为 Y 出现的概率。S 型逻辑函数的性质使得逻辑回归更适合用于分类任务。 逻辑回归曲线图显示了通过考试的概率与学习时间的关系。 03 决策树 决策树Decision Trees可用于回归和分类任务。 在这一算法中训练模型通过学习树表示Tree representation的决策规则来学习预测目标变量的值。树是由具有相应属性的节点组成的。 在每个节点上我们根据可用的特征询问有关数据的问题。左右分支代表可能的答案。最终节点即叶节点对应于一个预测值。 每个特征的重要性是通过自顶向下方法确定的。节点越高其属性就越重要。 决定是否在餐厅等候的决策树示例。 04 朴素贝叶斯 朴素贝叶斯Naive Bayes是基于贝叶斯定理。它测量每个类的概率每个类的条件概率给出 x 的值。这个算法用于分类问题得到一个二进制“是 / 非”的结果。看看下面的方程式。 朴素贝叶斯分类器是一种流行的统计技术可用于过滤垃圾邮件 05 支持向量机SVM 支持向量机Support Vector MachineSVM是一种用于分类问题的监督算法。支持向量机试图在数据点之间绘制两条线它们之间的边距最大。为此我们将数据项绘制为 n 维空间中的点其中n 是输入特征的数量。在此基础上支持向量机找到一个最优边界称为超平面Hyperplane它通过类标签将可能的输出进行最佳分离。 超平面与最近的类点之间的距离称为边距。最优超平面具有最大的边界可以对点进行分类从而使最近的数据点与这两个类之间的距离最大化。 例如H1 没有将这两个类分开。但 H2 有不过只有很小的边距。而 H3 以最大的边距将它们分开了。 06 K- 最近邻算法KNN K- 最近邻算法K-Nearest NeighborsKNN非常简单。KNN 通过在整个训练集中搜索 K 个最相似的实例即 K 个邻居并为所有这些 K 个实例分配一个公共输出变量来对对象进行分类。 K 的选择很关键较小的值可能会得到大量的噪声和不准确的结果而较大的值是不可行的。它最常用于分类但也适用于回归问题。 用于评估实例之间相似性的距离可以是欧几里得距离Euclidean distance、曼哈顿距离Manhattan distance或明氏距离Minkowski distance。欧几里得距离是两点之间的普通直线距离。它实际上是点坐标之差平方和的平方根。 ▲KNN 分类示例 07 K- 均值 K- 均值K-means是通过对数据集进行分类来聚类的。例如这个算法可用于根据购买历史将用户分组。它在数据集中找到 K 个聚类。K- 均值用于无监督学习因此我们只需使用训练数据 X以及我们想要识别的聚类数量 K。 该算法根据每个数据点的特征将每个数据点迭代地分配给 K 个组中的一个组。它为每个 K- 聚类称为质心选择 K 个点。基于相似度将新的数据点添加到具有最近质心的聚类中。这个过程一直持续到质心停止变化为止。 08 随机森林 随机森林Random Forest是一种非常流行的集成机器学习算法。这个算法的基本思想是许多人的意见要比个人的意见更准确。在随机森林中我们使用决策树集成参见决策树。 为了对新对象进行分类我们从每个决策树中进行投票并结合结果然后根据多数投票做出最终决定。 在训练过程中每个决策树都是基于训练集的引导样本来构建的。 在分类过程中输入实例的决定是根据多数投票做出的。 09 降维 由于我们今天能够捕获的数据量之大机器学习问题变得更加复杂。这就意味着训练极其缓慢而且很难找到一个好的解决方案。这一问题通常被称为“维数灾难”Curse of dimensionality。 降维Dimensionality reduction试图在不丢失最重要信息的情况下通过将特定的特征组合成更高层次的特征来解决这个问题。主成分分析Principal Component AnalysisPCA是最流行的降维技术。 主成分分析通过将数据集压缩到低维线或超平面 / 子空间来降低数据集的维数。这尽可能地保留了原始数据的显著特征。 可以通过将所有数据点近似到一条直线来实现降维的示例。 10 人工神经网络ANN 人工神经网络Artificial Neural NetworksANN可以处理大型复杂的机器学习任务。神经网络本质上是一组带有权值的边和节点组成的相互连接的层称为神经元。在输入层和输出层之间我们可以插入多个隐藏层。人工神经网络使用了两个隐藏层。除此之外还需要处理深度学习。 人工神经网络的工作原理与大脑的结构类似。一组神经元被赋予一个随机权重以确定神经元如何处理输入数据。通过对输入数据训练神经网络来学习输入和输出之间的关系。在训练阶段系统可以访问正确的答案。 如果网络不能准确识别输入系统就会调整权重。经过充分的训练后它将始终如一地识别出正确的模式。 每个圆形节点表示一个人工神经元箭头表示从一个人工神经元的输出到另一个人工神经元的输入的连接。 接下来是什么现在你已经了解了最流行的机器学习算法的基础介绍。你已经准备好学习更为复杂的概念甚至可以通过深入的动手实践来实现它们。如果你想了解如何实现这些算法可以参考 Educative 出品的 Grokking Data Science 课程该课程将这些激动人心的理论应用于清晰、真实的应用程序。 祝你学习愉快 作者介绍 Fahim ul Haq曾在 Facebook、Microsoft 工作。Educative.io 联合创始人。Educative 旨在帮助学生使用交互式课程来学习编程知识。 原文链接 https://towardsdatascience.com/the-top-10-ml-algorithms-for-data-science-in-5-minutes-4ffbed9c8672
http://www.zqtcl.cn/news/805702/

相关文章:

  • 网站关键词优化软件效果wordpress如何网站顶部右侧广告
  • seo整站优化报价wordpress网站资源
  • 假冒彩票网站开发仿小刀娱乐wordpress主题
  • 东光做淘宝网站古色古香的网站模板
  • 创建网站得花多少钱福州最好的网站建设
  • mysql asp网站开发企业失信被执行人查询
  • 网站制作完工验收单软件开发模型有哪几种
  • saas建站平台源码wordpress 安装主题 无法创建目录
  • 兰州做高端网站做网站学什么专业
  • dedecms 图片网站模板wordpress省市联动
  • pw域名网站杭州建站官网建设
  • 河北省建设厅网站官网网站js时间代码
  • 网站开发实现编码深圳做网站专业
  • 网站建设电子合同h5网站开发多少钱
  • 邓州做网站投票网站做seo如何
  • 环保网站建设项目备案系统免费虚拟主机空间
  • 网站实现语言转换技术上该怎么做免费下载网页模板
  • 云南网站建设专业品牌网站建设电子商务
  • 保健食品东莞网站建设莱芜金点子信息港交友
  • 小程序视频网站开发网站开发项目预算表
  • 邢台手机网站建设价格iis 手机网站
  • 网站开发流程三大部分微信学校网站模板
  • 网站推荐正能量专业做网站多少钱
  • 网站界面设计总结淘客手机端网站建设
  • 天津网站建设zhy88宁波企业黄页公司黄页
  • 个人网站课程设计报告app免费制作软件中文版
  • 品牌建设网站规划盛唐网站建设
  • 商城网站系统建站平台上建设的网站可以融资吗
  • 怎么查网站空间wordpress快速入门
  • 长沙 网站运营德国服务器网站