题目
3. 动态规划有两种优化策略,一个是 输入答案,而另一种是 输入答案____。
3. 动态规划有两种优化策略,一个是 输入答案,而另一种是 输入答案____。
题目解答
答案
动态规划有两种优化策略,一个是值迭代[1],而另一种是策略迭代。
解析
动态规划是一种在数学、管理科学、计算机科学、经济学和生物信息学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。动态规划的两种优化策略分别是值迭代和策略迭代。值迭代通过不断更新状态值来逼近最优值函数,而策略迭代则是通过迭代地改进策略来达到最优策略。