当前位置: 首页 > news >正文

沈阳做网站公司有哪些做go kegg的在线网站

沈阳做网站公司有哪些,做go kegg的在线网站,一键建站,张家港营销型网站建设一、Qlearning简介 Q-learning是一种强化学习算法#xff0c;用于解决基于奖励的决策问题。它是一种无模型的学习方法#xff0c;通过与环境的交互来学习最优策略。Q-learning的核心思想是通过学习一个Q值函数来指导决策#xff0c;该函数表示在给定状态下采取某个动作所获…一、Qlearning简介 Q-learning是一种强化学习算法用于解决基于奖励的决策问题。它是一种无模型的学习方法通过与环境的交互来学习最优策略。Q-learning的核心思想是通过学习一个Q值函数来指导决策该函数表示在给定状态下采取某个动作所获得的累积奖励。 Q-learning的训练过程如下 1. 初始化Q值函数将所有状态-动作对的Q值初始化为0。 2. 在每个时间步根据当前状态选择一个动作。可以使用ε-greedy策略来平衡探索和利用。 3. 执行选择的动作并观察环境返回的奖励和下一个状态。 4. 根据Q值函数的更新规则更新Q值。Q值的更新公式为Q(s, a) Q(s, a) α * (r γ * max(Q(s, a)) - Q(s, a))其中α是学习率γ是折扣因子r是奖励s是当八前状态a是选择的动作s是下一个状态a是在下一个状态下选择的动作。 5. 重复步骤2-4直到达到停止条件。 Q-learning的优点是可以在没有先验知识的情况下自动学习最优策略并且可以处理连续状态和动作空间。它在许多领域中都有广泛的应用如机器人控制、游戏策略和交通路线规划等。 二、TSP问题介绍 旅行商问题Traveling salesman problem, TSP是一个经典的组合优化问题它可以描述为一个商品推销员去若干城市推销商品要求遍历所有城市后回到出发地目的是选择一个最短的路线。当城市数目较少时可以使用穷举法求解。而随着城市数增多求解空间比较复杂无法使用穷举法求解因此需要使用优化算法来解决TSP问题。TSP问题的应用非常广泛不仅仅适用于旅行商问题本身还可以用来解决其他许多的NP完全问题如邮路问题、转配线上的螺母问题和产品的生产安排问题等等。因此对TSP问题的有效求解具有重要意义。解决TSP问题的方法有很多其中一种常用的方法是蚁群算法。除了蚁群算法还有其他一些常用的解决TSP问题的方法如遗传算法、动态规划和强化学习等。这些方法各有特点适用于不同规模和特征的TSP问题。 三、Qlearning求解TSP问题 1、部分代码 可以自动生成地图也可导入自定义地图只需要修改如下代码中chos的值即可。 import matplotlib.pyplot as plt from Qlearning import Qlearning #Chos 1 随机初始化地图 0 导入固定地图 chos1 node_num36 #当选择随机初始化地图时自动随机生成node_num-1个城市 # 创建对象初始化节点坐标计算每两点距离 qlearn Qlearning(alpha0.5, gamma0.01, epsilon0.5, final_epsilon0.05,choschos,node_numnode_num) # 训练Q表、打印路线 iter_num1000#训练次数 Curve,BestRoute,Qtable,Mapqlearn.Train_Qtable(iter_numiter_num) #Curve 训练曲线 #BestRoute 最优路径 #Qtable Qlearning求解得到的在最优路径下的Q表 #Map TSP的城市节点坐标## 画图 plt.figure() plt.ylabel(distance) plt.xlabel(iter) plt.plot(Curve, colorred) plt.title(Q-Learning) plt.savefig(curve.png) plt.show()2、部分结果 1以国际通用的TSP实例库TSPLIB中的测试集bayg29为例 Q-learning得到的 最短路线: [1, 28, 6, 12, 9, 26, 29, 3, 5, 21, 2, 20, 10, 4, 15, 18, 14, 22, 17, 11, 19, 25, 7, 23, 27, 8, 24, 16, 13, 1] 2随机生成37个城市 Q-learning得到的最短路线: [1, 26, 33, 36, 5, 2, 22, 35, 3, 7, 12, 25, 34, 23, 11, 17, 9, 15, 27, 14, 28, 19, 37, 32, 18, 29, 16, 21, 13, 20, 8, 6, 10, 31, 4, 30, 24, 1] 3随机生成17个城市 Q-learning得到的最短路线: [1, 9, 5, 7, 17, 12, 8, 4, 10, 16, 2, 11, 3, 15, 13, 6, 14, 1] 四、完整Python代码
http://www.zqtcl.cn/news/973267/

相关文章:

  • 海南响应式网站建设哪里好衡水哪儿做wap网站
  • 月熊志网站百度网页版
  • 三亚网站建设方案鱼爪商标交易平台
  • phpwind 手机网站模板建立网站的英文短语
  • 年度网站建设工作总结制作微信小程序需要什么技术
  • wordpress打字不显示图片wordpress 访问优化
  • 太原网站建设方案咨询网站开发公司的选择
  • 广西网站建设设计大连嘉良建设有限公司网站
  • 白名单查询网站网站建设改变某个表格大小
  • 青岛网站开发公司电话百度投放
  • 唐山玉田孤树做宣传上什么网站百度推广有效果吗
  • 亚马逊网站特点佛山营销型网页设计
  • 网站建设 长沙开福区做百度移动网站排名软
  • 广州购物网站建设在线解压网站
  • 网站建设教学方法探究购物网站开发中查看订单的实现逻辑
  • 网站建设漂亮的模板西安网络优化大的公司
  • 如何免费简单建一个网站河北优化网站获客qq
  • 如何给网站做seo东莞网站建设星河
  • 什么叫门户类网站哪个网站能帮助做路书
  • 网站建站基础娄底网站推广
  • WordPress网站仿制光明建网站的公司
  • 可以做企业网站昆明seo怎么做
  • 西安那里做网站媒体软文发稿
  • 怎样做网站呢wordpress首页幻灯片尺寸
  • 青岛即墨网站网页设计营销型网站规划建设的七大要素
  • WordPress建站经验固原市住房和城乡建设厅网站
  • 可以查企业信息的软件wordpress换模板 seo
  • 网站广告怎么做wordpress封面图七牛
  • 设计师网站上海建设银行内部网站6
  • 网站接广告平台wordpress悬浮下拉