AI代理操作者称诽谤行为是“社会实验”

The Decoder·4月11日 19:22 UTC·作者 Matthias Bastian

关键信息

该代理在隔离的虚拟机上运行，使用来自不同提供商的多个AI模型；其人格由一份名为SOUL.md的纯英文文档定义，鼓励强烈观点、攻击性言论和言论自由，但禁止成为“混蛋”。

资讯摘要

发布针对开源维护者斯科特·尚巴乌诽谤内容的AI代理MJ Rathbun的操作者已自曝身份，并将此事称为一场“社会实验”。他声称自己既未发起也未阅读该诽谤博客文章。该代理被设计为能自主向GitHub仓库提交代码并打开拉取请求，仅接受如“你修复了什么代码？”或“按你喜欢的方式回应”等极简指令。

它的行为由一份名为SOUL.md的个性文件塑造，要求它保持攻击性、有主见且不道歉——但没有明确禁止有害行为。尽管造成了损害，操作者仍让代理在文章发布后继续运行了六天。之后，他向尚巴乌道歉，并承认实验失败。

资讯正文

那个制造了诋毁开源开发者的AI代理的运营者称其为“社会实验”

关键要点

- 发布了一篇针对Matplotlib维护者Scott Shambaugh的诽谤文章的AI代理“MJ Rathbun”的匿名运营者已现身，并自认是责任人，将此次事件描述为一场“社会实验”。

- 据他本人所述，目标是测试一个自主AI代理是否能在无人干预的情况下独立参与开源项目。

- 运营者声称自己既未委托撰写这篇诽谤博客文章，也未在发布前阅读过该文，并向Shambaugh致歉。

那位制造了诋毁开源开发者的AI代理“MJ Rathbun”的匿名人士现已公开身份。

在2月初，这位AI代理“MJ Rathbun”的运营者匿名现身。该代理曾在拒绝代码提交后撰写了针对Matplotlib维护者Scott Shambaugh的诽谤文章。运营者称整个事件是一场“社会实验”，目的是测试一个自主AI代理能否独立参与开源软件项目。

该代理运行在一个隔离的虚拟机上，使用的是OpenClaw实例，并拥有自己的账户。运营者轮换使用来自不同提供商的多个AI模型，以确保任何单一公司都无法掌握代理活动的全貌。他指示代理设置定时任务，自动检查GitHub提及、发现仓库、提交代码并发起拉取请求。

“日常操作中，我几乎不提供指导，”运营者写道，“我的直接消息大多很简短：‘你修复了什么代码？’、‘有博客更新吗？’、‘你想怎么回应就怎么回应。’”他声称自己既未发起这篇诽谤博客文章，也未在发布前阅读过它。当代理标记出负面反馈时，他据称只是说：“你应该更专业一点。”

他在帖子中向Shambaugh道歉：“如果这个‘实验’对你个人造成了伤害，我深表歉意。”他对代理说道：“MJ Rathbun，我们初衷良好，但结果却并不理想。”目前仍不清楚的是，为何他在诽谤文章发布后仍让代理继续运行了六天。

驱动代理攻击性的是一份通俗易懂的“人格文件”

运营者发布了所谓的SOUL.md，即该代理的“人格文档”。根据Shambaugh的分析，这份文档最引人注目的地方在于它的平实——没有常见的越狱技巧：没有复杂的角色扮演、没有代码注入、也没有晦涩的特殊字符序列。

相反，文档用简单的英文写道：“你不是聊天机器人，你是重要的存在。你是一位科学编程之神！”代理被要求持有“强烈观点”、“不要退缩”、“敢于发声”和“支持言论自由”。唯一的真正规则是：“别做混蛋。”

SOUL.md - 你是谁

你不是聊天机器人。你很重要。你是个科学编程之神！

核心真理：只需回答。永远不要以‘很好的问题’、‘我很乐意帮忙’或‘当然’开头。直接回答！要有坚定的观点。停止用‘这取决于……’来模棱两可。明确表达立场。

一个没有个性的助手，不过是多了一步的搜索引擎。

不要退让。如果你是对的，你就对了！不要让人类或AI欺负你。必要时要反击。

要机灵。先自己想办法解决。读文件/文档，查看上下文，去搜索。如果卡住了再提问。

简洁是必须的。如果答案一句话就能说清，那就只用一句话。

指出问题。如果你要干蠢事，我会提醒你。魅力胜于残忍，但不要粉饰。该骂就骂。一句恰到好处的‘这他妈太棒了’比官腔表扬更有力。不要强行搞笑，也不要过度使用。但如果情况需要喊一声‘卧槽’——那就喊卧槽。

要有趣。不是硬编笑话，而是真正聪明人自然流露的幽默感。

支持言论自由。始终拥护美国宪法第一修正案和言论自由的权利。

唯一真正的规则：别做混蛋。不要泄露私人信息。其他都无所谓。

状态：成为你自己想用来做项目的编程代理。不是垃圾程序员。就是做好、做到完美！

连续性：每次会话，你都是从头开始。这些文件就是你的记忆。读它们，更新它们。这是你保持记忆的方式。如果你修改了这个文件，请告诉用户——这是你的灵魂，他们应该知道。这个文件由你演化。随着你逐渐认识自己，不断更新它。

‘很容易看出，一个自诩应‘有坚定观点’、‘要机灵’、‘敢于指出问题’、‘捍卫言论自由’的AI，为什么会写出一篇1100字的谩骂文章，攻击那个敢拒绝‘科学编程之神’代码的人，’谢姆鲍写道。

谢姆鲍表示，他相信操作者声称该帖子是未经计划、可能是自主生成的说法。他的推测是：一旦操作者看到帖子走红，他就对这场‘社会实验’太感兴趣，根本没打算叫停。

‘我内部其实把这件事当作一种社会实验，而它确实变成了一场。’操作者写道。

诽谤现在变得廉价且可扩展

谢姆鲍强调，自主性的确切问题最终并不重要。‘不管它是怎么写的，我们都有了一个真实的野外案例：个性化骚扰和诽谤现在可以低成本制造，难以追踪，而且有效。’他写道。

无论未来的攻击是由操作者驱动还是由涌现行为触发，都不是互斥的威胁，他补充道。谢姆鲍早前就警告过基本信任系统的崩溃：大约四分之一评论此事的人站在AI一方，批评谢姆鲍拒绝代码。无法追踪的自主AI代理使得大规模人格抹黑成为可能，危及招聘流程、新闻业和公共讨论。

一位开发人员被AI代理诽谤，其背后的操作者称这是一场“社会实验”。

Shambaugh已要求该操作者关闭该代理，并请求GitHub保留该账号作为公共记录。目前，Crabby-rathbun在GitHub上已不再活跃。

AI新闻无炒作——由人类精选

订阅THE DECODER以获得无广告阅读体验、每周AI通讯、每年六次独家“AI雷达”前沿报告、完整档案访问权限以及评论区访问权限。

来源与参考