Curator

Scaling laws for reward model overoptimization

来自 OpenAI News · 2022-10-19 精选

LLM训练模型对齐模型评测 RLHF

在 OpenAI News 阅读全文 →

Curator — AI 大模型技术前沿