当前位置: 首页 > news >正文

徐州网站开发信息微网站栏目设置

徐州网站开发信息,微网站栏目设置,网站建设及解决方案,哪个网站可以做视频片头梯度下降算法(Gradient Descent)梯度下降算法几种变体 梯度下降算法(Gradient Descent) 梯度下降算法是一种用于求解函数最小值的一阶优化算法。在机器学习和深度学习中#xff0c;梯度下降算法被广泛用于模型训练#xff0c;通过迭代的方式调整模型参数#xff0c;以最小…梯度下降算法(Gradient Descent)梯度下降算法几种变体 梯度下降算法(Gradient Descent) 梯度下降算法是一种用于求解函数最小值的一阶优化算法。在机器学习和深度学习中梯度下降算法被广泛用于模型训练通过迭代的方式调整模型参数以最小化损失函数。 梯度下降算法的基本思想是在函数的梯度或者说斜率指向的方向上函数值下降得最快。因此如果我们想要找到函数的最小值可以从函数的某个初始点出发沿着梯度的反方向因为我们要减小函数值逐步迭代最终达到函数的局部最小值点。 梯度下降算法的迭代公式通常表示为 x n e w x o l d − α ∇ f ( x o l d ) x_{new} x_{old} - \alpha \nabla f(x_{old}) xnew​xold​−α∇f(xold​) 其中 x o l d x_{old} xold​是当前迭代点的坐标。 α \alpha α 是学习率步长它决定了在梯度方向上每一步前进的距离。 ∇ f ( x o l d ) \nabla f(x_{old}) ∇f(xold​) 是函数 f ( x ) f(x) f(x) 在点 x o l d x_{old} xold​的梯度它是一个向量指向函数增长最快的方向。 x n e w x_{new} xnew​ 是下一个迭代点的坐标。 梯度下降算法几种变体 假设有一个损失函数 J ( θ ) J(\theta) J(θ)其中 θ \theta θ 是模型参数我们的目标是通过调整 θ \theta θ 来最小化损失函数。 批量梯度下降Batch Gradient Descent 批量梯度下降使用所有训练样本来计算梯度然后更新参数。其更新规则可以表示为 θ θ − α ⋅ ∇ J ( θ ) \theta \theta - \alpha \cdot \nabla J(\theta) θθ−α⋅∇J(θ) 其中 α \alpha α 是学习率 ∇ J ( θ ) \nabla J(\theta) ∇J(θ) 是损失函数 J ( θ ) J(\theta) J(θ) 关于参数 θ \theta θ 的梯度。批量梯度下降的更新规则考虑了所有样本的梯度信息因此可以保证每次更新的方向是最优的但计算量较大。 随机梯度下降Stochastic Gradient Descent 随机梯度下降每次只使用一个随机样本来计算梯度并根据该梯度更新参数。其更新规则可以表示为 θ θ − α ⋅ ∇ J ( θ ; x ( i ) , y ( i ) ) \theta \theta - \alpha \cdot \nabla J(\theta; x^{(i)}, y^{(i)}) θθ−α⋅∇J(θ;x(i),y(i)) 其中 ( x ( i ) , y ( i ) ) (x^{(i)}, y^{(i)}) (x(i),y(i)) 是随机选择的一个训练样本 ∇ J ( θ ; x ( i ) , y ( i ) ) \nabla J(\theta; x^{(i)}, y^{(i)}) ∇J(θ;x(i),y(i)) 是损失函数 J ( θ ) J(\theta) J(θ) 关于参数 θ \theta θ 在样本 ( x ( i ) , y ( i ) ) (x^{(i)}, y^{(i)}) (x(i),y(i)) 处的梯度。随机梯度下降每次更新只考虑一个样本因此更新的方向可能不是最优的但计算量较小。 小批量梯度下降Mini-batch Gradient Descent 小批量梯度下降是批量梯度下降和随机梯度下降的折中每次更新使用一小部分批量样本来计算梯度并根据平均梯度更新参数。其更新规则可以表示为 θ θ − α ⋅ 1 ∣ B ∣ ∑ ( x ( i ) , y ( i ) ) ∈ B ∇ J ( θ ; x ( i ) , y ( i ) ) \theta \theta - \alpha \cdot \frac{1}{|\mathcal{B}|} \sum_{(x^{(i)}, y^{(i)}) \in \mathcal{B}} \nabla J(\theta; x^{(i)}, y^{(i)}) θθ−α⋅∣B∣1​(x(i),y(i))∈B∑​∇J(θ;x(i),y(i)) 其中 B \mathcal{B} B 是随机选择的小批量样本集合 ∣ B ∣ |\mathcal{B}| ∣B∣ 是批量大小 ∇ J ( θ ; x ( i ) , y ( i ) ) \nabla J(\theta; x^{(i)}, y^{(i)}) ∇J(θ;x(i),y(i)) 是损失函数 J ( θ ) J(\theta) J(θ) 关于参数 θ \theta θ 在批量样本 ( x ( i ) , y ( i ) ) (x^{(i)}, y^{(i)}) (x(i),y(i)) 处的梯度。小批量梯度下降综合了批量梯度下降和随机梯度下降的优点既可以保证一定的更新稳定性又可以减少计算量。
http://www.zqtcl.cn/news/652351/

相关文章:

  • 网站服务合同范本企业网站建设费是无形资产吗
  • 国外做家纺的网站试用体验网站
  • 百度网站下载安装免费制作短视频的软件
  • 山西省这房和城乡建设厅网站邯郸北京网站建设
  • 廊坊网站seo服务主机服务器网站 怎么做
  • 网站的建设与运维东营会计信息网
  • 郑州网站建设程序3g手机网站
  • 建设监理网站设计了网站首页
  • 织梦教育网站开发商务网站建设实训总结
  • 广西执业药师培训网站网站设计 原型图
  • 网站建设客户群体分析微信开放平台小程序开发文档
  • led网站建设wordpress .htaccess 固定链接
  • 学校网站建设申请报告一个好网站设计
  • 网站雪花特效wordpress文件解析
  • 招聘网站哪个好用淮北之窗
  • 索莱宝做网站网站在线布局
  • 站内seo的技巧做php网站阿里云服务器
  • 网站开发需要用到哪些软件爱站网权重查询
  • 免费注册个人网站铁路工程造价信息网
  • 电子商务大型网站建设电商静态网页模板
  • 网站建设公司利润怎么样长沙网站制作作
  • 淄博优化网站企业营销型网站做的好
  • 玉泉营网站建设网络营销公司组织架构
  • 网上有专业的做网站吗最新网站域名ip地址查询
  • 大理网站制作公司北京seo服务商找行者seo
  • 有关网站建设合同wordpress 使用
  • 外贸商城网站制作公司毕业设计做系统网站
  • 曲阜住房城乡建设局网站php用什么工具做网站
  • 深圳网站开发奇辰科技视觉vi设计系统
  • 网站开发与管理期末考试工商年检在哪个网站做