当前位置: 首页 > news >正文

佛山市企业网站建设平台网站建设颜色

佛山市企业网站建设平台,网站建设颜色,wordpress实现多用户,网站禁ping文章目录 #x1f340;引言#x1f340;eta参数的调节#x1f340;sklearn中的梯度下降 #x1f340;引言 承接上篇#xff0c;这篇主要有两个重点#xff0c;一个是eta参数的调解#xff1b;一个是在sklearn中实现梯度下降 在梯度下降算法中#xff0c;学习率#xf… 文章目录 引言eta参数的调节sklearn中的梯度下降 引言 承接上篇这篇主要有两个重点一个是eta参数的调解一个是在sklearn中实现梯度下降 在梯度下降算法中学习率通常用符号η表示也称为步长或学习速率的选择非常重要因为它直接影响了算法的性能和收敛速度。学习率控制了每次迭代中模型参数更新的幅度。以下是学习率η的重要性 收敛速度学习率决定了模型在每次迭代中移动多远。如果学习率过大模型可能会在参数空间中来回摇摆导致不稳定的收敛或甚至发散。如果学习率过小模型将收敛得很慢需要更多的迭代次数才能达到最优解。因此选择合适的学习率可以加速收敛速度。 稳定性过大的学习率可能会导致梯度下降算法不稳定甚至无法收敛。过小的学习率可以使算法更加稳定但可能需要更多的迭代次数才能达到最优解。因此合适的学习率可以在稳定性和收敛速度之间取得平衡。 避免局部最小值选择不同的学习率可能会导致模型陷入不同的局部最小值。通过尝试不同的学习率您可以更有可能找到全局最小值而不是被困在局部最小值中。 调优学习率通常需要调优。您可以尝试不同的学习率值并监视损失函数的收敛情况。通常您可以使用学习率衰减策略逐渐降低学习率以改善收敛性能。 批量大小学习率的选择也与批量大小有关。通常小批量梯度下降Mini-batch Gradient Descent使用比大批量梯度下降更大的学习率因为小批量可以提供更稳定的梯度估计。 总之学习率是梯度下降算法中的关键超参数之一它需要仔细选择和调整以在训练过程中实现最佳性能和收敛性。不同的问题和数据集可能需要不同的学习率因此在实践中通常需要进行实验和调优来找到最佳的学习率值。 eta参数的调节 在上代码前我们需要知道如果eta的值过小会造成什么样的结果 反之如果过大呢 可见eta过大过小都会影响效率所以一个合适的eta对于寻找最优有着至关重要的作用 在上篇的学习中我们已经初步完成的代码这篇我们将其封装一下 首先需要定义两个函数一个用来返回thera的历史列表一个则将其绘制出来 def gradient_descent(eta,initial_theta,epsilon 1e-8):theta initial_thetatheta_history [initial_theta]def dj(theta): return 2*(theta-2.5) # 传入theta,求theta点对应的导数def j(theta):return (theta-2.5)**2-1 # 传入theta获得目标函数的对应值while True:gradient dj(theta)last_theta thetatheta theta-gradient*eta theta_history.append(theta)if np.abs(j(theta)-j(last_theta))epsilon:breakreturn theta_historydef plot_gradient(theta_history):plt.plot(plt_x,plt_y)plt.plot(theta_history,[(i-2.5)**2-1 for i in theta_history],colorr,marker)plt.show()其实就是上篇代码的整合罢了 之后我们需要进行简单的调参了这里我们分别采用0.1、0.01、0.9这三个参数进行调节 eta 0.1 theta 0.0 plot_gradient(gradient_descent(eta,theta)) len(theta_history)运行结果如下 eta 0.01 theta 0.0 plot_gradient(gradient_descent(eta,theta)) len(theta_history)运行结果如下 eta 0.9 theta 0.0 plot_gradient(gradient_descent(eta,theta)) len(theta_history)运行结果如下 这三张图与之前的提示很像吧可见调参的重要性 如果我们将eta改为1.0呢那么会发生什么 eta 1.0 theta 0.0 plot_gradient(gradient_descent(eta,theta)) len(theta_history)运行结果如下 那改为1.1呢 eta 1.1 theta 0.0 plot_gradient(gradient_descent(eta,theta)) len(theta_history)运行结果如下 我们从图可以清楚的看到当eta为1.1的时候是嗷嗷增大的这种情况我们需要采用异常处理来限制一下避免报错处理的方式是限制循环的最大值且可以在expect中设置inf正无穷 def gradient_descent(eta,initial_theta,n_iters1e3,epsilon 1e-8):theta initial_thetatheta_history [initial_theta]i_iter 1def dj(theta): try:return 2*(theta-2.5) # 传入theta,求theta点对应的导数except:return float(inf)def j(theta):return (theta-2.5)**2-1 # 传入theta获得目标函数的对应值while i_itern_iters:gradient dj(theta)last_theta thetatheta theta-gradient*eta theta_history.append(theta)if np.abs(j(theta)-j(last_theta))epsilon:breaki_iter1return theta_historydef plot_gradient(theta_history):plt.plot(plt_x,plt_y)plt.plot(theta_history,[(i-2.5)**2-1 for i in theta_history],colorr,marker)plt.show()注意inf表示正无穷大 sklearn中的梯度下降 这里我们还是以波士顿房价为例子 首先导入需要的库 from sklearn.datasets import load_boston from sklearn.linear_model import SGDRegressor之后取一部分的数据 boston load_boston() X boston.data y boston.target X X[y50] y y[y50]然后进行数据归一化 from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split X_train,X_test,y_train,y_testtrain_test_split(X,y) std StandardScaler() std.fit(X_train) X_train_stdstd.transform(X_train) X_test_stdstd.transform(X_test) sgd_reg SGDRegressor() sgd_reg.fit(X_train_std,y_train)最后取得score sgd_reg.score(X_test_std,y_test)运行结果如下 挑战与创造都是很痛苦的但是很充实。
http://www.zqtcl.cn/news/182753/

相关文章:

  • 视频网站闪图怎么做网件路由器管理地址
  • 一个完整的网站建设网站模板去哪要
  • 烤漆 东莞网站建设水果香精东莞网站建设技术支持
  • 国家重大项目建设库网站北京网站开发外包公司
  • 建设免费网站制作二维码的软件app
  • 网站突然没收录了网站建设和运营的成本是多少钱
  • 家政公司网站模板wordpress防cc代码
  • 福田附近做网站公司网站反向链接
  • 南阳网站关键词哪做网站便宜
  • 往网站上做新东西需要什么智库网站建设
  • 网站建站系统程序做网站代理商好赚吗
  • 哪些网站是做食品dedecms转wordpress
  • 广东华迪工程建设监理公司网站网站的优化从哪里进行
  • 国产做的视频网站优秀网站首页
  • 做国际黄金看什么网站网络营销品牌推广公司
  • 手机自助建站平台手机网站开发设计报价单
  • 网站建设标书范本注册了一个域名怎么做网站
  • 行政部建设公司网站东莞市做网站
  • 网站建设开发的流程建设官方网站的主要作用
  • 怎样用模板做网站wordpress柚子皮
  • 长宁区网站建设公司内蒙古赤峰市建设局网站
  • 网站配色怎么对网站的数据库做管理
  • 企业网站效果图wap网站
  • 网站建设优化托管跨境电商怎么做流程
  • 昆明网站建站平台在线阅读网站开发教程
  • pv3d 优秀网站18种最有效推广的方式
  • 一站式网站建设顾问网站建设公司专业网站科技开发
  • python做网站比php好网站开发财务费用
  • 图片上传网站变形的处理北京网站建设有哪些公司
  • 昆山品牌网站建设wordpress 浮动二维码