题目
AlphaGo 使用了哪种搜索算法来优化决策()。A. 启发式搜索B. 随机搜索C. 穷举搜索[1]D. 深度优先搜索[2]
AlphaGo 使用了哪种搜索算法来优化决策()。
A. 启发式搜索
B. 随机搜索
C. 穷举搜索[1]
D. 深度优先搜索[2]
题目解答
答案
A. 启发式搜索
解析
考查要点:本题主要考查对AlphaGo核心算法的理解,特别是其使用的搜索算法类型。
解题思路:需明确AlphaGo结合了蒙特卡洛树搜索(MCTS)与深度学习,而MCTS本质上属于启发式搜索。关键点在于区分不同搜索算法的特点:
- 启发式搜索利用启发式函数优先探索高潜力路径,提升效率。
- 随机搜索仅依赖随机采样,缺乏优化方向。
- 穷举搜索和深度优先搜索在复杂问题中效率极低,无法应对围棋的庞大搜索空间。
AlphaGo的核心决策机制包含以下关键点:
- 蒙特卡洛树搜索(MCTS):通过随机模拟生成可能的走子序列,并统计获胜概率,从而选择最优路径。
- 启发式策略:MCTS中的UCT算法(平衡探索与利用)依赖于对节点价值的评估,属于启发式搜索的典型应用。
- 深度神经网络:提供对局势的评估(如走子概率),进一步优化搜索方向。
选项分析:
- A. 启发式搜索:正确。MCTS通过启发式信息(如胜率)指导搜索,而非盲目穷举。
- B. 随机搜索:错误。虽然包含随机采样,但整体框架通过统计优化路径选择。
- C. 穷举搜索:错误。围棋的搜索空间极大,穷举不可行。
- D. 深度优先搜索:错误。深度优先效率低下,无法处理围棋的复杂性。