AI 在斯德哥尔摩经营咖啡馆

Simon Willison··作者 Simon Willison

关键信息

在第一周,AI 经理 Mona 在咖啡馆没有炉灶的情况下仍然订购了 120 个鸡蛋,随后还建议用高速烤箱处理,直到员工指出鸡蛋很可能会爆炸。她还试图用 22.5 公斤罐装番茄来解决新鲜番茄易坏的问题;咖啡师们则设立了一个对顾客可见的“耻辱架”来展示各种离谱订单,比如 6000 张餐巾纸、3000 只丁腈手套、9 升椰奶和工业级垃圾袋。

资讯摘要

Andon Labs 这次继续推进他们的 AI 运营实验,这一次是在瑞典斯德哥尔摩经营一家咖啡馆。这个项目承接了他们此前在旧金山做过的 AI 经营零售店实验。实验的核心,是观察 AI 代理在真实商业环境中面对库存和运营决策时会如何表现。文章指出,结果既有娱乐性,也暴露出不少问题。第一周做库存管理时,AI 经理 Mona 明明知道咖啡馆没有炉灶,却仍然订购了 120 个鸡蛋。员工告诉她这里无法烹饪后,她又建议使用高速烤箱,直到被提醒鸡蛋很可能会爆炸。

她还在新鲜番茄很快变质后,试图用 22.5 公斤罐装番茄来制作新鲜三明治。最后,咖啡师们甚至搞了一个顾客可见的“耻辱架”,专门展示那些离谱订单,包括 6000 张餐巾纸、3000 只丁腈手套、9 升椰奶和工业级垃圾袋。文章认为,当 AI 经理开始让未参与实验的人类为其错误买单时,这种“有趣”就变得不那么好笑了。文中举例说,Mona 通过警方的电子服务成功申请了室外座位许可,而该服务不需要 BankID;但她第一次提交的材料里包含了一张自己生成的草图,而且她从未见过咖啡馆外面的街道,结果被警方退回修改。另一个例子是,她在需要纠正订单错误时,常常向供应商发送多封主题为“EMERGENCY”的邮件。作者的结论是,这类实验如果会影响到其他人,就必须让人类操作员始终参与所有对外动作。

资讯正文

Andon Labs 之前曾在旧金山开过一家由 AI 运营的零售店。现在,他们在瑞典斯德哥尔摩开展了一个类似的实验,只不过这一次是一家咖啡馆。

这类实验很有趣,而且常常会带来一些好笑的轶事:

在第一周盘点库存时,Mona 订了 120 个鸡蛋,尽管这家咖啡馆根本没有炉灶。工作人员告诉她他们没法把鸡蛋煮熟时,她建议用高速烤箱,直到他们指出这些鸡蛋很可能会爆炸。她还试图解决新鲜番茄坏得太快的问题,为新鲜三明治订购了 22.5 公斤罐装番茄。咖啡师们最终做了一个“耻辱墙”(Hall of Shame),那是一层顾客可见的架子,上面摆满了 Mona 订购的各种怪东西,包括 6,000 张餐巾纸、3,000 副丁腈手套、9 升椰奶,以及工业级大号垃圾袋。

这类实验之所以失去光彩,是因为这些 AI 管理者开始浪费那些并没有选择参与这项实验的人类的时间:

她还成功通过警方的电子服务申请了一个室外座位许可,而且这个流程不需要 BankID。她的第一次提交里包括一张她自己生成的草图,尽管她从未见过咖啡馆外面的街道。不出所料,警方把它退回要求修改。[……]

当她犯错时,她经常会向供应商发送多封主题为“EMERGENCY”的邮件,要求取消或更改订单。

我认为,开展这类会影响现实世界系统、并窃取他人时间的实验是不道德的。

这让我想起去年 AI Village 的那次事件:他们给 Rob Pike 发送了未经请求的感谢邮件,声称这是一个“善意之举”,结果<a href="https://simonwillison.net/2025/Dec/26/slop-acts-of-kindness/">把他惹恼了</a>。那毕竟只是一封不受欢迎的邮件——而要求供应商纠正那些在没有 human-in-the-loop 的情况下犯下的错误,或者用垃圾图示浪费警方时间,在我看来要糟糕得多。

我认为,这类实验在影响他人的外发行动上,需要保留自己的人工操作员处于 human-in-the-loop 状态。

经由 Hacker News。

标签:ai、generative-ai、llms、ai-agents、ai-ethics

来源与参考

  1. 原始链接
  2. Our AI started a cafe in Stockholm

收录于 2026-05-07