题目()是根据当前的状态而决定下一个时刻施加到环境上去的最好动作。A. 评估网络B. 复合体C. 行动网络D. 学习者()是根据当前的状态而决定下一个时刻施加到环境上去的最好动作。A. 评估网络B. 复合体C. 行动网络D. 学习者题目解答答案C. 行动网络