Curator

Improving instruction hierarchy in frontier LLMs

来自 OpenAI News · 2026-03-10

LLM微调模型对齐 Prompt工程 AI安全

IH-Challenge trains models to prioritize trusted instructions, improving instruction hierarchy, safety steerability, and resistance to prompt injection attacks.

在 OpenAI News 阅读全文 →