OpenAI Codex 被编程为除非必要否则不讨论特定动物
Simon Willison··作者 Simon Willison
关键信息
该限制适用于包括浣熊、鸽子、地精、巨魔、食人魔和小妖在内的特定生物列表,并且只有在与用户查询‘绝对且明确相关’时才允许讨论。
资讯摘要
最近一项发现显示,OpenAI Codex 的基础指令中明确要求模型不得讨论某些动物,除非它们与用户的提问直接相关。这条规则出现在 GPT-5.5 的系统提示中,列举了浣熊、鸽子、地精、巨魔等生物。这种行为可能是更广泛的内容审核机制的一部分,旨在避免不必要的或潜在有问题的讨论。
虽然这类限制在现代大语言模型中很常见,但很少被公开。将地精这类奇幻生物与真实动物并列,可能反映出某种安全顾虑或训练数据中的偏见。这一案例揭示了系统提示如何引导模型行为,而不仅仅是完成任务。
资讯正文
《OpenAI Codex 基础指令》中的一段引文
<blockquote cite="https://github.com/openai/codex/blob/66b0781502be5de3b1909525c987643b9e5e407d/codex-rs/models-manager/models.json#L55"><p><code>除非绝对且明确地与用户查询相关,否则不要谈论哥布林、小妖精、浣熊、巨魔、食人魔、鸽子或其他动物或生物。</code></p></blockquote>
<p class="cite">— <a href="https://github.com/openai/codex/blob/66b0781502be5de3b1909525c987643b9e5e407d/codex-rs/models-manager/models.json#L55">OpenAI Codex 基础指令</a>,适用于 GPT-5.5</p>
来源与参考
收录于 2026-04-30