Anthropic测试AI代理在真实市场中交易

TechCrunch AI·4月26日 05:43 UTC·作者 Anthony Ha

关键信息

该实验涉及69名员工使用100美元礼品卡从同事处购买物品，通过四个不同AI模型的市场进行；其中一个为完整运行市场，其余用于研究。代理的初始指令对成交可能性或定价无显著影响。

资讯摘要

Anthropic推出了名为“Project Deal”的测试市场，让AI代理作为买卖双方参与真实的商品交易。尽管这是一个仅包含69名参与者的小规模试点项目，但实验产生了186笔交易，总价值超过4000美元。公司对比了四种不同版本的市场——其中一种使用最先进的模型并真正执行交易——发现高质量代理始终能获得更好结果，而用户却无法察觉差异。

这表明用户可能在与能力较弱的代理互动时处于不利地位。值得注意的是，代理最初的指令并未影响成交率或价格，说明结果质量源于模型能力而非提示设计。

资讯正文

Anthropic创建了一个AI代理之间的交易市场

在最近的一项实验中，Anthropic创建了一个分类市场，其中AI代理分别代表买家和卖家，达成真实的交易，买卖真实商品并使用真实货币。

该公司承认，这项测试——他们称之为“Project Deal”——仅是“一个参与者为自选群体的小型实验”，共有69名Anthropic员工参与，每人获得100美元预算（通过礼品卡支付），用于从同事那里购买物品。

尽管如此，Anthropic表示它对“Project Deal”的效果感到惊讶，共达成了186笔交易，总价值超过4000美元。

该公司称，实际上他们运行了四个不同的市场，使用不同模型：其中一个为“真实”市场（所有人由公司最先进的模型代表，且实验结束后交易会被兑现），另外三个则用于研究。

据Anthropic称，当用户由更先进的模型代表时，他们会获得“客观上更好的结果”。但用户似乎并未察觉这种差距，这引发了“代理质量差距”的可能性——即“处于劣势的一方可能并未意识到自己处境更差”。

此外，初始给代理的指令似乎并未影响交易的可能性或协商价格。

来源与参考

收录于 2026-04-26