Palm-Rlhf-Pytorch(PaLM-rlhf-pytorch) - 美瑞狮AI agibm - AI工具与模型和ComfyUI AI工作流

Palm-Rlhf-Pytorch(PaLM-rlhf-pytorch)

在棕榈体系结构之上实施RLHF（通过人为反馈的增强学习）。基本上是changpt，但用棕榈

发表评论取消回复