下面对上限置信区间(UpperConfidenceBound,UCB)算法在多臂赌博机中的描述,哪句描述是不正确的()AUCB算法在探索利用(explorationexploitation)之间寻找平衡BUCB算法既考虑拉动在过去时间内获得最大平均奖赏的赌博机,又希望去选择那些拉动臂膀次数最少的赌博机CUCB算法是优化序列决策问题的方法DUCB算法每次随机选择一个赌博机来拉动其臂膀

  尔雅 智慧树 mooc


+
账户
更新
搜索
帮助
主页