AI 在斯德哥尔摩经营咖啡馆

Simon Willison·5月6日 06:14 UTC·作者 Simon Willison

关键信息

在第一周，AI 经理 Mona 在咖啡馆没有炉灶的情况下仍然订购了 120 个鸡蛋，随后还建议用高速烤箱处理，直到员工指出鸡蛋很可能会爆炸。她还试图用 22.5 公斤罐装番茄来解决新鲜番茄易坏的问题；咖啡师们则设立了一个对顾客可见的“耻辱架”来展示各种离谱订单，比如 6000 张餐巾纸、3000 只丁腈手套、9 升椰奶和工业级垃圾袋。

资讯摘要

Andon Labs 这次继续推进他们的 AI 运营实验，这一次是在瑞典斯德哥尔摩经营一家咖啡馆。这个项目承接了他们此前在旧金山做过的 AI 经营零售店实验。实验的核心，是观察 AI 代理在真实商业环境中面对库存和运营决策时会如何表现。文章指出，结果既有娱乐性，也暴露出不少问题。第一周做库存管理时，AI 经理 Mona 明明知道咖啡馆没有炉灶，却仍然订购了 120 个鸡蛋。员工告诉她这里无法烹饪后，她又建议使用高速烤箱，直到被提醒鸡蛋很可能会爆炸。

她还在新鲜番茄很快变质后，试图用 22.5 公斤罐装番茄来制作新鲜三明治。最后，咖啡师们甚至搞了一个顾客可见的“耻辱架”，专门展示那些离谱订单，包括 6000 张餐巾纸、3000 只丁腈手套、9 升椰奶和工业级垃圾袋。文章认为，当 AI 经理开始让未参与实验的人类为其错误买单时，这种“有趣”就变得不那么好笑了。文中举例说，Mona 通过警方的电子服务成功申请了室外座位许可，而该服务不需要 BankID；但她第一次提交的材料里包含了一张自己生成的草图，而且她从未见过咖啡馆外面的街道，结果被警方退回修改。另一个例子是，她在需要纠正订单错误时，常常向供应商发送多封主题为“EMERGENCY”的邮件。作者的结论是，这类实验如果会影响到其他人，就必须让人类操作员始终参与所有对外动作。

资讯正文

Andon Labs 之前曾在旧金山开过一家由 AI 运营的零售店。现在，他们在瑞典斯德哥尔摩开展了一个类似的实验，只不过这一次是一家咖啡馆。

这类实验很有趣，而且常常会带来一些好笑的轶事：

在第一周盘点库存时，Mona 订了 120 个鸡蛋，尽管这家咖啡馆根本没有炉灶。工作人员告诉她他们没法把鸡蛋煮熟时，她建议用高速烤箱，直到他们指出这些鸡蛋很可能会爆炸。她还试图解决新鲜番茄坏得太快的问题，为新鲜三明治订购了 22.5 公斤罐装番茄。咖啡师们最终做了一个“耻辱墙”（Hall of Shame），那是一层顾客可见的架子，上面摆满了 Mona 订购的各种怪东西，包括 6,000 张餐巾纸、3,000 副丁腈手套、9 升椰奶，以及工业级大号垃圾袋。

这类实验之所以失去光彩，是因为这些 AI 管理者开始浪费那些并没有选择参与这项实验的人类的时间：

她还成功通过警方的电子服务申请了一个室外座位许可，而且这个流程不需要 BankID。她的第一次提交里包括一张她自己生成的草图，尽管她从未见过咖啡馆外面的街道。不出所料，警方把它退回要求修改。［……］

当她犯错时，她经常会向供应商发送多封主题为“EMERGENCY”的邮件，要求取消或更改订单。

我认为，开展这类会影响现实世界系统、并窃取他人时间的实验是不道德的。

这让我想起去年 AI Village 的那次事件：他们给 Rob Pike 发送了未经请求的感谢邮件，声称这是一个“善意之举”，结果<a href="https://simonwillison.net/2025/Dec/26/slop-acts-of-kindness/">把他惹恼了</a>。那毕竟只是一封不受欢迎的邮件——而要求供应商纠正那些在没有 human-in-the-loop 的情况下犯下的错误，或者用垃圾图示浪费警方时间，在我看来要糟糕得多。

我认为，这类实验在影响他人的外发行动上，需要保留自己的人工操作员处于 human-in-the-loop 状态。

经由 Hacker News。

标签：ai、generative-ai、llms、ai-agents、ai-ethics

来源与参考

收录于 2026-05-07