题目()是根据当前的状态而决定下一个时刻施加到环境上去的最好动作。A. 评估网络B. 学习者C. 行动网络D. 复合体()是根据当前的状态而决定下一个时刻施加到环境上去的最好动作。A. 评估网络B. 学习者C. 行动网络D. 复合体题目解答答案C. 行动网络