Anthropic测试AI代理在真实市场中交易
TechCrunch AI··作者 Anthony Ha
关键信息
该实验涉及69名员工使用100美元礼品卡从同事处购买物品,通过四个不同AI模型的市场进行;其中一个为完整运行市场,其余用于研究。代理的初始指令对成交可能性或定价无显著影响。
资讯摘要
Anthropic推出了名为“Project Deal”的测试市场,让AI代理作为买卖双方参与真实的商品交易。尽管这是一个仅包含69名参与者的小规模试点项目,但实验产生了186笔交易,总价值超过4000美元。公司对比了四种不同版本的市场——其中一种使用最先进的模型并真正执行交易——发现高质量代理始终能获得更好结果,而用户却无法察觉差异。
这表明用户可能在与能力较弱的代理互动时处于不利地位。值得注意的是,代理最初的指令并未影响成交率或价格,说明结果质量源于模型能力而非提示设计。

资讯正文
Anthropic创建了一个AI代理之间的交易市场
在最近的一项实验中,Anthropic创建了一个分类市场,其中AI代理分别代表买家和卖家,达成真实的交易,买卖真实商品并使用真实货币。
该公司承认,这项测试——他们称之为“Project Deal”——仅是“一个参与者为自选群体的小型实验”,共有69名Anthropic员工参与,每人获得100美元预算(通过礼品卡支付),用于从同事那里购买物品。
尽管如此,Anthropic表示它对“Project Deal”的效果感到惊讶,共达成了186笔交易,总价值超过4000美元。
该公司称,实际上他们运行了四个不同的市场,使用不同模型:其中一个为“真实”市场(所有人由公司最先进的模型代表,且实验结束后交易会被兑现),另外三个则用于研究。
据Anthropic称,当用户由更先进的模型代表时,他们会获得“客观上更好的结果”。但用户似乎并未察觉这种差距,这引发了“代理质量差距”的可能性——即“处于劣势的一方可能并未意识到自己处境更差”。
此外,初始给代理的指令似乎并未影响交易的可能性或协商价格。
来源与参考
收录于 2026-04-26