当前位置: 首页 > news >正文

南宁网站建设策划外包陕西省建筑信息平台

南宁网站建设策划外包,陕西省建筑信息平台,培训信息,大连微网站开发文章目录 一、机器学习是什么#xff1f;二、模型训练YouTube流量预测1. 先写一个具有未知参数的函数#xff08;Function#xff09;2. 定义损失#xff08;从训练数据进行计算#xff09;3.最优化4.结果分析 Back to framework1.带有未知数的函数#xff1a;2.定义损失… 文章目录 一、机器学习是什么二、模型训练YouTube流量预测1. 先写一个具有未知参数的函数Function2. 定义损失从训练数据进行计算3.最优化4.结果分析 Back to framework1.带有未知数的函数2.定义损失从训练数据进行计算3. 最优化4.[激活函数](https://blog.csdn.net/weixin_39910711/article/details/114849349)5.继续改我们的模型 三、Neural Network 一、机器学习是什么 机器学习≈找一个函数 这个函数不是人能容易的找出来需要借助机器的力量。 不同的函数 回归Regression:函数输出一个标量。eg.对PM2.5的预测 分类Classification:给定选项(类)函数输出正确的选项。eg1二分类.是否为垃圾邮件 eg2多分类.下围棋 二、模型训练 训练 先写一个具有未知参数的函数Function定义损失从训练数据进行计算最优化 YouTube流量预测 有没有可能找一个函数输入是这个频道后台的数据输出隔天的总点阅率 机器学习找这个函数分为三个过程以 YouTube流量预测为例。 1. 先写一个具有未知参数的函数Function 先猜测函数的类型 2. 定义损失从训练数据进行计算 损失是一个关于参数的函数 函数输入的值代表这一组参数设定某一组数值这个数值是好还是不好。 同样的方法我们可以算出三年来每一天的预测误差。 接下来我们把三年的误差求平均。 L越小参数设置越好越大越不好。 计算误差有很多方式根据需求选取。 如果真实值与预测值是概率分布可能选择交叉熵损失。 误差曲面 3.最优化 找一组参数是的L最小 为此我们使用梯度下降gradient decent 简化过程一个参数的gradient decent 随机选取初始点 w 0 w_0 w0​计算 ∂ L ∂ w ∣ w w 0 \frac{\partial L}{\partial w}|_{ww_0} ∂w∂L​∣ww0​​。就是看左右哪边高向低的跨步 若求出为负值左高右低的切线增大wloss就变小若求出为正值左低右高的切线减小wloss就变大。 步子跨多大取决于1.斜率斜率大就跨大一点2学习率自己设定的更新迭代w 当 ∂ L ∂ w ∣ w w 0 \frac{\partial L}{\partial w}|_{ww_0} ∂w∂L​∣ww0​​计算为0就不在更新了。 有可能梯度下降会陷入局部最优 局部最小值真的会导致问题吗后面会说gradient decent的真正痛点 两个参数的gradient decent 随机选取初始点 w 0 b 0 w_0b_0 w0​b0​计算 ∂ L ∂ w ∣ w w 0 b b 0 ∂ L ∂ b ∣ w w 0 , b b 0 \frac{\partial L}{\partial w}|_{ww_0bb_0}\frac{\partial L}{\partial b}|_{ww_0, bb_0} ∂w∂L​∣ww0​bb0​​∂b∂L​∣ww0​,bb0​​。就是看左右哪边高向低的跨步 若求出为负值左高右低的切线增大wloss就变小若求出为正值左低右高的切线减小wloss就变大。 步子跨多大取决于1.斜率斜率大就跨大一点2学习率自己设定的更新迭代w 在深度学习中微分应该怎么算 ---- 程序会自己算 4.结果分析 能否做的更好 从图中看出7天一个循环。我们分别考虑2017-2020的前1、7、18、56天对2021年的某一天的影响。我们采用的是Linear Model。 线性模型太简单了… 我们需要更复杂的模式。 线性模型具有严重的局限性。模型偏差我们需要一个更灵活的模式! 所有分段的线性曲线可以可以由常数与一系列蓝色Function组成。 转折越多越复杂需要的蓝色Function就越多。 如果不是分段曲线而是连续曲线我们可以使用分段线性曲线去逼近。 如何表示蓝色的Function呢 我们可以使用 y c 1 1 e − ( b w 1 x ) yc\frac{1}{1e^{-(bw_1x)}} yc1e−(bw1​x)1​: Sigmoid Function(S型曲线: y c ∗ s i g m o i d ( b w 1 x ) c 1 1 e − ( b w 1 x ) y c*sigmoid(bw_1x) c\frac{1}{1e^{-(bw_1x)}} yc∗sigmoid(bw1​x)c1e−(bw1​x)1​ w改变斜率、b曲线左右移动、c改变他的高度 新的模型有更多的特征 我们把它画出来直观 x 1 , x 2 , x 3 x_1,x_2,x_3 x1​,x2​,x3​与 r 1 , r 2 , r 3 r_1,r_2,r_3 r1​,r2​,r3​的关系我们可以用矩阵表示出来 Back to framework 1.带有未知数的函数 特征与参数 2.定义损失从训练数据进行计算 Loss是参数的函数 L ( θ ) L(\theta) L(θ) Loss意味着一套参数值有多好 3. 最优化 随机选取初始点 θ 0 \theta_0 θ0​计算微分 就是看左右哪边高向低的跨步 若求出为负值左高右低的切线增大wloss就变小若求出为正值左低右高的切线减小wloss就变大。 更新迭代w 步子跨多大取决于1.斜率斜率大就跨大一点2学习率自己设定的 直到你不想做了或计算出的gradient为零向量。 实际做gradient decent N的数据分成多个Batch计算loss更新参数。 为什么Hard Sigmoid 要换成Soft Sigmoid Hard Sigmoid 表示 ReLU函数 从ReLU到Sigmoid2个ReLU合成Sigmoid 4.激活函数 5.继续改我们的模型 机器02/14左右高估了因为除夕。 三、Neural Network 那这个 Sigmoid 或是 ReLU,它们在机器学习里面叫做 Activation Function 激活函数。 这些Sigmoid 或 ReLU ,它们叫做 Neuron 神经元。我们这边有很多的 Neuron,很多的 Neuron 就叫做 Neural Network。 每一排neourn叫做hidden layer许多layer就叫做Deep Learning。 为什么不做的更深呢 会过拟合即在训练资料上变好在没训练的资料上变差 预测未知资料
http://www.zqtcl.cn/news/831279/

相关文章:

  • 公司注销后网站备案大型网站建设用什么系统好
  • 网站建设服务公司专业服务海外留学网站建设方案
  • 哈尔滨建站模板搭建马鞍山市网站建设
  • 上海网站设计专注乐云seo个人简介代码网页制作模板
  • 法律网站建设价格做视频周边的网站
  • 京东物流网站地方门户网站源码下载
  • 重庆建设工程信息网站企业宣传片制作公司光年映画
  • 哪家做网站好 成都ktv网络推广方案
  • 网站开发的软件支持哈尔滨最新消息
  • jsp淘宝客网站有限公司怎么注册
  • 香奈儿电子商务网站建设策划书怎样进行网络营销吸引顾客
  • 昆山网站建设费用我们公司想做网络推广
  • 网站建设一般要多少钱网站开发主要步骤
  • 商用图片的网站网络文化经营许可证查询
  • c 高性能网站开发弄一个公司网站需要多少钱
  • 建设部网站招标投标文件网页设计专业公司
  • 使用iis6搭建网站wordpress调用搜索功能
  • 装配式建筑网站生活家装饰
  • 怎样做软件网站建设百度网站认证官网
  • phpcms网站什么网站都能进的浏览器
  • 建设配资网站有要求吗网站建设不一定当地
  • 永兴网站开发智慧门店管理服务平台
  • 网站建设前的市场分析李炎辉网站建设教程
  • 乱起封神是那个网站开发的?广州市建设注册中心网站首页
  • 网站开发配置网络广告的投放技巧
  • wordpress 漫画网站安徽省建设厅八大员报名网站
  • 音乐网站排名建设部证书查询网站
  • 长沙建站挺找有为太极wordpress eshop 教程
  • 郑州平台类网站网站开发常见面试题
  • 城乡建设网站职业查询系统做网站设计的需要什么材料