打开主菜单

页面历史

RLHF

2023年11月8日 (星期三)

  • 江南仁

    创建页面,内容为“{{4}} RLHF(Reinforcement Learning from Human Feedback):这是一种强化学习方法,主要关注如何通过人类反馈来优化智能系统的行为。...”

    01:38

    +797

取自“http://www.tywiki.com/index.php?title=特殊:历史/RLHF”

通约智库

  • 隐私
  • 桌面版