题目3多选题
在强化学习中,设计一个智能体以优化其在经济市场中的投资决策.该智能体需要根据市场状态选择投资行动,并根据收益获得奖励.以下哪些选项正确描述了强化学习的基本组件及其在经济问题中的应用A. 状态可以定义为市场的当前经济指标,如股价、利率和市场趋势B. 行动是指智能体在给定状态下的任何选择,例如买入、卖出或持有某种资产C. 奖励是智能体在执行某个行动后所获得的直接经济收益,通常通过利润来衡量D. 强化学习的目标是最大化智能体的长期奖励,智能体会选择那些预期收益最高的行动E. 在强化学习中,状态、行动和奖励是独立的,无法相互影响