页面历史

跳转至：导航、搜索

RLHF

2023年11月8日 (星期三)

江南仁
创建页面，内容为“{{4}} RLHF（Reinforcement Learning from Human Feedback）：这是一种强化学习方法，主要关注如何通过人类反馈来优化智能系统的行为。...”
01:38
+797

取自“http://www.tywiki.com/index.php?title=特殊:历史/RLHF”