OpenAI Codex 被编程为除非必要否则不讨论特定动物

Simon Willison··作者 Simon Willison

关键信息

该限制适用于包括浣熊、鸽子、地精、巨魔、食人魔和小妖在内的特定生物列表,并且只有在与用户查询‘绝对且明确相关’时才允许讨论。

资讯摘要

最近一项发现显示,OpenAI Codex 的基础指令中明确要求模型不得讨论某些动物,除非它们与用户的提问直接相关。这条规则出现在 GPT-5.5 的系统提示中,列举了浣熊、鸽子、地精、巨魔等生物。这种行为可能是更广泛的内容审核机制的一部分,旨在避免不必要的或潜在有问题的讨论。

虽然这类限制在现代大语言模型中很常见,但很少被公开。将地精这类奇幻生物与真实动物并列,可能反映出某种安全顾虑或训练数据中的偏见。这一案例揭示了系统提示如何引导模型行为,而不仅仅是完成任务。

资讯正文

《OpenAI Codex 基础指令》中的一段引文

<blockquote cite="https://github.com/openai/codex/blob/66b0781502be5de3b1909525c987643b9e5e407d/codex-rs/models-manager/models.json#L55"><p><code>除非绝对且明确地与用户查询相关,否则不要谈论哥布林、小妖精、浣熊、巨魔、食人魔、鸽子或其他动物或生物。</code></p></blockquote>

<p class="cite">&mdash; <a href="https://github.com/openai/codex/blob/66b0781502be5de3b1909525c987643b9e5e407d/codex-rs/models-manager/models.json#L55">OpenAI Codex 基础指令</a>,适用于 GPT-5.5</p>

来源与参考

  1. 原始链接
  2. A quote from OpenAI Codex base_instructions

收录于 2026-04-30