阿丹(Adan)

Adan:自适应Nesterov动量算法,用于更快地优化深层模型

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部