A梯度裁剪,给定梯度的上下阈值B批规范化C使用残差网络结构D采用带记忆的网络结构,如LSTM

  尔雅 智慧树 mooc


+
账户
更新
搜索
帮助
主页