← 返回数学题库
5087机器学习困难essaymedium

强化学习训练诊断 22

题目

为什么 RL 智能体通常仍然需要显式探索,即使当前的贪心动作看起来已经很好?

解题计时

0:00

提交作答时记录,用于后续平均用时统计。