题目2单选题
下列关于探索与利用的说法中,不正确的是( )A. 在多臂赌博机问题中,过度探索会导致算法很少主动去选择比较好的摇臂B. 在多臂赌博机问题中,过度利用可能导致算法对部分臂膀额奖励期望估计不准确C. 在<img src="https://tihai-oss-cloud.itihey.com/img/5e543256c480ac577d30f76f9120eb74.webp">贪心算法中,<img src="https://tihai-oss-cloud.itihey.com/img/5e543256c480ac577d30f76f9120eb74.webp">的值越大,表示算法越倾向于探索D. 在多臂赌博机问题中,某时刻UCB1算法选择的臂膀置信上界为<img src="https://tihai-oss-cloud.itihey.com/img/5e543256c480ac577d30f76f9120eb74.webp">,则此时任意摇动一个臂膀,得到的硬币数量不会超过<img src="https://tihai-oss-cloud.itihey.com/img/5e543256c480ac577d30f76f9120eb74.webp">