题目时序差分学习(TD)与蒙特卡洛方法的主要区别是()A. TD仅适用于离散状态B. TD需要环境模型C. TD使用自举法更新D. 蒙特卡洛方差更低时序差分学习(TD)与蒙特卡洛方法的主要区别是()A. TD仅适用于离散状态B. TD需要环境模型C. TD使用自举法更新D. 蒙特卡洛方差更低题目解答答案C. TD使用自举法更新