当前位置：首页 > news >正文

帝国cms怎样做网站迁移长春火车站到吉大一院

news 2025/11/14 15:36:22

帝国cms怎样做网站迁移,长春火车站到吉大一院,wordpress短标签,有关建筑网站建设方案案例planning algorithms chapter 2 :Discrete Planning 离散可行规划导论问题定义在离散规划中#xff0c;状态是“可数”的#xff0c;有限的。离散可行规划: 非空状态空间 X对于每个状态 x#xff0c;存在一个有限的动作空间 U(x)对于每个状态和动作空间#xff0c;存在状… planning algorithms chapter 2 :Discrete Planning 离散可行规划导论问题定义在离散规划中状态是“可数”的有限的。离散可行规划: 非空状态空间 X对于每个状态 x存在一个有限的动作空间 U(x)对于每个状态和动作空间存在状态转移方程产生一个新的状态一个初始状态 xi一个目标集 Xg为了方便表达离散可行规划的定义通常采用有向状态转移图来表示图上的顶点集合表示状态空间 X只有当两顶点之间可状态转移时图上两顶点之间的有向边才存在。初始状态和目标集可以表示为图上特别指定的顶点。离散规划的例子 2D 网格上移动“迷宫” 魔方拼图图搜索算法前向搜索算法上图显示了通用图搜索算法模板其中有几点需要注意Q 内部如何排序如何判断状态属于目标状态如何得到计划动作序列)如何判断该状态是否已经访问过是否需要更新状态代价值如在Dijkstra 和 A* 算法几种前向搜索算法区别在于定义了Q 这个优先级队列内部不同的排序方式广度优先FIFO深度优先LIFODijkstra 一种图单源最短路径搜索算法一种特殊的动态规划形式在Dijkstra中图上每条边附带一个代价l(x, u) 0Q 内部是按照从初始状态到达该状态的累计代价C(x),cost-to-come排序。cost-to-come 在搜索过程中通过DP方式来增量计算C(x‘) C(x) l(x, u), 代表最优)。 Dijkstra 可以保证一旦某个状态被访问则该状态的 cost-to-come一定是最优的。Dijkstra 内部 Q 实现采用的 Fibonacci heap 这种数据结构可以实现在常数时间内判断某个状态是否被访问过。A-star 基于Dijkstra进行扩展引入启发项值G(x)cost-to-go)当G(x) 0 时 A-star 退化成DijkstraQ 内部是按照从初始状态到达目标状态的预估最优代价( C(x’) G(x‘)) 进行排序。最佳优先搜索Q 内部是按照 cost-to-go 排序一种贪心搜索不保证最优但搜索速度快。迭代加深搜索通过不断增加深度优先搜索深度的一种搜索将深度优先搜索转换为一种系统性搜索方式能够访问可到达的所有状态)。迭代加深搜索相比 BFS 使用更少的内存迭代加深搜索结合 A-star 的思想形成了 IDA* 算法在每次迭代过程中最大深度步长为C(x’) G(x‘)。其他搜索算法反向搜索算法双向搜索算法当两棵搜索树相遇时搜索结束返回成功。如果其中任一搜索树的优先级队列为空且两颗树未相遇则搜索结束返回失败。搜索算法的统一视角上述所有的搜索算法遵循以下一些共同的模式初始搜索开始时搜索图 G(V,E)中 E为空集V只包含初始状态选择顶点从V中选择一个顶点这通常是通过维护一个优先级队列实现应用动作基于V中选择的某个顶点应用动作后生成一个新的状态 x f(x0, u)向搜索图中插入有向边新状态 x 如果不在 V 中则将 x 插入到 V 中检查解决方案如果只有一颗搜索树根据搜索图 G 得到从初始状态到目标状态的路径会比较简单。如果搜索树数量大于 1 颗复杂度会增加。返回到步骤 2 迭代直到找到一个解决方案。离散最优规划最优定长规划 $L\left ( \pi _{K} \right ) \sum_{k1}^{K}l(x_{k},u_{k}) l_{F}(x_{F})$ 通过引入代价项Lf(xf)这一技巧将离散可行规划中的约束转换为优化问题代价函数中的一项。基本思想: 最优规划解决方案的子组成方案也是最优的于是可以通过动态规划方法解决。在最优定长规划中采用一种迭代算法称为值迭代它的主要思想是在状态空间中迭代计算最优的 cost-to-go(或 cost-to-come)。Dijkstra’s algorithm 也是值迭代的一种方式。反向值迭代基本思想在状态空间中迭代计算最优的 cost-to-go 代价值。在特殊场景下该方法退化为 Dijkstra 方法。符号 $ G_{k}^{ \ast} $ F 表示最后一步$ G_{k}^{ \ast} $ 表示从第 k 步到最后一步F 步最佳计划下的累计代价初始条件 $ G_{F}^{ \ast}\left ( x_{F} \right ) l_{F}\left ( x_{F} \right ) $ 结论推导过程值迭代过程 $ G_{F}^{ \ast}\rightarrow G_{K}^{ \ast}\rightarrow G_{K-1}^{ \ast}\cdots G_{k}^{ \ast}\rightarrow G_{k-1}^{ \ast}\rightarrow\cdots G_{2}^{ \ast}\rightarrow G_{1}^{ \ast} $ 时间复杂度 $ O\left ( K\left | X \right |\left | U \right | \right ) $ 离散最优规划标准定义$L\left ( \pi _{K} \right ) \sum_{k1}^{K}l(x_{k},u_{k}) l_{F}(x_{F})$该时间复杂度为 $ O\left | U \right |^K $通过引入动态规划极大降低了复杂度。举例如上图a 列 $ G_{1}^{ \ast} $ 的值 $G_{1}^{ \ast}\left ( a \right ) $ 代表了 5 步定步长最优规划的累计代价为 6 。那么如何体现动态规划思想降低时间复杂度呢当计算 $ G_{4}^{ \ast} $ 的值时只有 b 和 c 可以只经过 1 步到达 d再经过1 步到达目标 e因此只有$G_{4}^{ \ast}\left ( b \right )$、$G_{4}^{ \ast}\left ( c \right )$为有限值。再计算 $G_{3}^{ \ast}$ 的值时只有经过 b 和 c 的路径才可能经过 5 步到达目标 e因此缩小了考虑的范围具体程序表现为选择到达下一顶点的最小累计代价的行为。那么得到了最佳cost-to-go的表如何提取最佳计划或路径一种解决方案是为每个顶点存储最优 $G_{n}^{ \ast}$所对应的行为因此这样需要的内存复杂度为 $O(K\left | X \right |)$ 。正向值迭代为什么需要正向值迭代正向值和反向值迭代的区别是什么反向反向值迭代可以同时找到各顶点到目标顶点的最优计划反向值迭代需要目标顶点是确定不变的正向正向值迭代可以用来找到从初始顶点出发到其他各顶点的最优计划正向值迭代需要初始顶点是确定不变的基本思想在状态空间中迭代计算最优的 cost-to-come 代价值。下图为上例根据正向值迭代得到的最优 cost-to-come 代价值表。最优不定步长规划 $L\left ( \pi _{K} \right ) \sum_{k1}^{K}l(x_{k},u_{k}) l_{F}(x_{F})$ 通过引入代价项Lf(xf)这一技巧将离散可行规划中的约束转换为优化问题代价函数中的一项。对比最优定长规划问题和最优不定步长规划的区别主要在于终止条件的设置。定长问题不定步长允许不同长度的计划在最优不定步长问题中从$x_{I}$到$X_{G}$的两步计划$\left ( u_{1}, u_{2}\right )$等效于从$x_{I}$到$X_{G}$的五步计划$\left ( u_{1}, u_{2},u_{T},u_{T},u_{T}\right )$因此最优定长规划中的正(反)向值迭代优化方法都可以扩展用于最优不定步长问题中。使用逻辑定义离散规划当状态空间巨大时对于计算机去解决这样的规划问题会比较困难基于逻辑的表示形式在定义离散规划问题时比较流行因为输出的结果是逻辑可解释的但是由于基于逻辑的表示形式难以泛化因此在连续空间、感知不确定、多决策的规划问题中状态空间的表示形式仍然适用。 STRIPS-Like 表示法举例放电池到手电筒内转载于:https://www.cnblogs.com/zwk-coder/p/11097876.html

查看全文

http://www.zqtcl.cn/news/801152/