OpenAI 用推理模型打破数学边界
据称,OpenAI 的内部模型推翻了埃尔多什单位距离猜想,标志着 AI 正从模式生成走向开放式数学发现。
AI 日报
今天的核心主题很清晰:AI 正从“模型能力竞赛”转向“算力、分发和治理”的硬碰硬博弈。OpenAI 的数学突破、Anthropic 与 SpaceX 的超大算力协议、特朗普推迟 AI 行政令,以及 Spotify、Google、Meta 的一系列产品与平台动作,共同勾勒出一个更成熟也更昂贵的 AI 时代。
Overview
从 74 条资讯中筛选出 39 条
今天的核心主题很清晰:AI 正从“模型能力竞赛”转向“算力、分发和治理”的硬碰硬博弈。OpenAI 的数学突破、Anthropic 与 SpaceX 的超大算力协议、特朗普推迟 AI 行政令,以及 Spotify、Google、Meta 的一系列产品与平台动作,共同勾勒出一个更成熟也更昂贵的 AI 时代。
据称,OpenAI 的内部模型推翻了埃尔多什单位距离猜想,标志着 AI 正从模式生成走向开放式数学发现。
SpaceX 文件披露 Anthropic 每月支付 12.5 亿美元获取 Colossus 算力,说明顶级 AI 竞争的核心已经是基础设施锁定。
特朗普推迟 AI 行政令,表明美国 AI 治理仍在“安全审查”和“对华竞争”之间摇摆。
Spotify 与 UMG 推出付费 AI 混音、翻唱和有声书工具,试图把生成式 AI 纳入可授权、可分账的商业模式。
Google 持续把 AI 代理嵌入搜索与 Android,Meta 则通过裁员重配资源;同时,Cohere、SAP、Claude Code 和 Datasette 也在把 AI 推入企业与开发流。
AI 行业的重心正在同时向三个方向移动:更强的推理能力、更紧的基础设施争夺,以及更明确的政策和版权框架。头部公司一边在证明模型能力,一边在争夺算力与分发入口,另一边则开始面对更直接的监管、版权和安全审查。
OpenAI 的内部推理模型据称推翻了埃尔多什单位距离猜想,成为 AI 辅助数学的标志性时刻之一(#1949)。这类成果的意义不在于数值提升有多大,而在于模型开始进入人类长期依赖直觉、耐心和跨学科工具才能触及的开放式问题。
SpaceX S-1 文件进一步暴露了前沿 AI 的成本结构:Anthropic 与 SpaceX 的算力协议按月支付 12.5 亿美元,持续到 2029 年,规模接近每年 150 亿美元(#1951 #1962)。与此同时,xAI 的亏损和资本开支也显示,扩张不再只是“烧钱”,而是围绕数据中心、GPU 和长期供给锁定展开的基础设施战争(#1956)。
白宫在最后时刻推迟 AI 行政令,特朗普对草案内容、发布前评估机制以及“是否会拖慢美国竞争力”都表示顾虑(#1950 #1953)。另一边,美国网络司令部正推动把 OpenAI、Google 等公司的模型部署进高度机密的国防网络,显示 AI 安全正在从企业问题升级为国家安全问题(#1958)。
Spotify 与 Universal Music 正式把 AI 混音、翻唱和有声书制作带入授权模式,尝试用“同意、署名、补偿”替代灰色地带式生成(#1948 #1970 #1979 #1983)。Google 则在搜索、Chrome、Android 和 Gemini 中继续推进消费者级 AI 代理生态,试图把 AI 从问答工具变成全天候助手(#1967 #1969 #1978)。
Cohere 开源 Command A+,SAP 用 Mistral 帮客户迁移到 S/4HANA,Simon Willison 为 Datasette 加入对话式 AI,而 Anthropic 的 Claude Code 事件则说明软件开发流程本身已经被 AI 重塑(#1959 #1981 #1966 #1965)。Linux 之父 Linus Torvalds 也直言:AI 让提交增加、流程加速,但同时让安全披露与重复报告问题更难处理(#1942)。
Meta 正通过裁员和岗位重组,把更多资源转向 AI 超级智能与基础设施(#1947);Hark 则以异常高额融资押注“通用 AI 接口”与硬件结合(#1954)。在更边缘但有代表性的案例里,AI 也继续扩散到音乐硬件、治疗产品、视频制作和桌面工具中(#1982 #1980 #1984 #1985)。
今天的新闻不再只是“哪个模型更强”,而是“谁能拿到算力、分发入口、监管空间和用户默认位置”。这意味着下一阶段的竞争,将更多由资本开支、许可协议、政府规则和平台整合能力决定,而不仅仅是模型榜单。
Stories
The Decoder

OpenAI 的一个内部推理模型据称推翻了保罗·埃尔多什 1946 年提出的单位距离猜想,它找到了一种新的点阵排列,比经典的方格构造产生了更多单位距离点对。该结果随后由九位外部数学家独立验证、压缩并在一篇配套论文中进行了分析。
这标志着 AI 辅助数学的一个重要里程碑,因为它表明推理模型可能帮助发现人类用传统搜索方式难以找到的证明或反例。它也说明自动化推理正在从狭窄的定理证明,走向在成熟数学领域中的创造性问题求解。
OpenAI 表示,其一个内部推理模型找到了单位距离猜想的反例。这个猜想由保罗·埃尔多什于 1946 年提出,问题是:平面上放置若干点时,能有多少点对之间的距离恰好为 1。埃尔多什认为,一个略微倾斜的方格排列已经接近最优。九位外部数学家随后验证了这一结果,压缩了证明,并写出了配套分析论文。文章指出,这个问题长期以来被视为组合几何中最著名、也最容易表述的问题之一。文中还提到,埃尔多什当年甚至为其反例提供过 500 美元悬赏。
新的构造确实比经典方格排列产生了更多单位距离点对,Will Sawin 估计其优势大约是每当点数翻倍时多出 1% 左右。尽管如此,这个问题并没有完全终结,因为 1984 年就已知的一个理论上界仍然高于这项新构造。最令人意外的是方法本身:模型并没有直接依赖几何,而是使用了代数数论中的工具。Thomas Bloom 认为,人类若想找到同样的思路,需要极强的耐心、敢于挑战埃尔多什观点的决心、对数域的熟悉,以及对较为专门的类域论的掌握。Sawin 还补充说,常见的“在旧方格基础上无限放大”思路最终仍会回到埃尔多什的界,而模型的关键技巧是保持每个数体系中的尺度不变,同时逐步切换到更丰富的数体系。
这项突破并不是只靠经典几何完成的;模型使用了代数数论中的工具,尤其是带有丰富对称性的复数体系。文章指出,这一提升在绝对数值上并不大——每当点数翻倍时,单位距离点对大约多出 1%——但在数学上意义重大,因为埃尔多什的猜想几乎断言不可能出现这种改进。
Financial Times AI
白宫在原定签署前几个小时,突然推迟了一项计划中的人工智能行政令。报道指出,特朗普因不满该政策的部分内容,并担心它会让美国AI开发者相对中国处于不利地位,而拒绝批准该命令。
这件事很重要,因为行政令可以迅速重塑联邦AI政策,并向企业、投资者和监管机构传递政府优先事项。此次推迟也凸显出,美国AI治理正同时受到国内监管诉求和与中国的地缘政治竞争的拉扯。
白宫在原定签署前几个小时,突然推迟了一项计划中的AI行政令,因为特朗普总统拒绝批准该命令。报道显示,这一决定发生在白宫内部就草案内容发生冲突之际。特朗普并不是把签字当作例行程序,而是对该行政令的某些方面提出了异议。他还据称担心,这项措施会让美国AI创新者相对于中国处于不利地位。
此次推迟表明,AI政策很容易与国家竞争力的更大争论交织在一起。它也说明政府对一种批评非常敏感:即监管可能会拖慢美国AI企业,而海外竞争对手却在更快推进。事件发生后,这项行政令的具体发布时间和最终内容都变得不确定。整体来看,这反映出华盛顿围绕AI政策的高风险博弈,产业战略与地缘政治竞争正越来越紧密地联系在一起。
这一决定是在最后一刻做出的,说明拟定命令的范围和后果在白宫内部存在明显分歧。报道提到的核心担忧是,这项政策可能会让美国AI创新者在与中国的竞争中处于劣势。
Simon Willison
SpaceX 的 S-1 引文显示,公司一边在 COLOSSUS II 上训练 Grok 5,一边向第三方客户出售算力访问。文件称 Anthropic 于 2026 年 5 月签署了覆盖 COLOSSUS 和 COLOSSUS II 的云服务协议,每月支付 12.5 亿美元,持续到 2029 年 5 月。
这段内容凸显了前沿 AI 公司正在把超大训练集群变成可创收的基础设施,而不只是内部模型实验室。若属实,Anthropic 的协议说明大规模算力已经变得极其稀缺,也是 AI 公司竞争的核心资源。
2026 年 5 月 20 日,Simon Willison 贴出了一段来自 SpaceX S-1 文件的引文,内容描述了公司的 AI 算力策略。文件称,SpaceX 既可以将其算力资源用于自有 AI 应用,包括正在 COLOSSUS II 上训练的 Grok 5。与此同时,SpaceX 也可以向部分第三方客户提供算力容量。文中举的例子是 Anthropic,该公司在 2026 年 5 月与 SpaceX 签订了云服务协议。
协议覆盖 COLOSSUS 和 COLOSSUS II 上的算力访问。根据文件,Anthropic 同意在 2029 年 5 月之前每月支付 12.5 亿美元。文件还说明,2026 年 5 月和 6 月的产能爬坡阶段会按较低费用计费,而且任一方都可以提前 90 天通知终止协议。这个引文之所以引人注目,是因为它把 SpaceX 描述成了既做内部 AI 训练、又向外出售算力的基础设施提供方。
引文点名涉及的算力系统是 COLOSSUS 和 COLOSSUS II,并称 Grok 5 目前正在 COLOSSUS II 上训练。它还说明协议可由任一方提前 90 天通知终止,而且 2026 年 5 月和 6 月的产能爬坡阶段会按较低费用计费。
TechCrunch AI

Spotify宣布与Universal Music Group达成许可协议,允许Premium订阅用户使用生成式AI创作歌曲的粉丝自制翻唱和混音。该工具将作为付费增值功能推出,并与参与的艺术家分享收入,但Spotify尚未公布定价或上线时间。
这标志着AI音乐从未经授权的生成,转向围绕同意、署名和补偿的授权模式。它可能为大型平台和唱片公司如何在不依赖法律灰色地带的情况下处理粉丝生成音乐,提供一个可参考的模板。
Spotify周四宣布与Universal Music Group达成合作,允许粉丝使用生成式AI创作喜爱歌曲的翻唱和混音。该功能将作为面向Spotify Premium订阅用户的付费增值服务推出,并会与使用其作品的艺术家分享收入,但公司没有公布价格或上线日期。Spotify表示,这项合作延续了其去年就透露的“以艺术家为先”的AI产品方向,当时公司曾提到正与Universal Music Group、Sony Music Group、Warner Music Group、Merlin和Believe等合作开发相关工具。Spotify此前强调,这类工具会通过“事先达成协议”来推进,而不是先上线再解决法律问题,这一点显然是在影射Suno等公司。
Spotify联合首席执行官Alex Norström表示,这些粉丝自制翻唱和混音建立在同意、署名和补偿的基础上。Universal Music Group董事长兼首席执行官Sir Lucian Grainge则称,这种模式可以帮助艺术家加深与粉丝的联系,并创造额外收入机会。目前Spotify尚未透露有哪些UMG艺人已经同意参与。该消息发布于Spotify投资者日的多项AI公告之中,其他内容还包括AI有声书制作工具、播客AI功能、面向个人播客的桌面工具,以及为顶级粉丝预留演唱会门票。
Spotify表示,艺术家和权利方可以选择是否参与以及如何参与,愿意加入的人应获得公平补偿。此次宣布发生在主流唱片公司起诉Suno和Udio等AI音乐初创公司之后,而这些公司已经与部分唱片公司达成了和解。
TechCrunch AI

美国总统唐纳德·特朗普推迟签署一项拟议中的行政令,该行政令原本将允许政府在人工智能模型发布前对其进行评估。他表示自己对部分措辞不满意,也不想让这项措施妨碍美国在人工智能领域的领先地位。
这项行政令原本会成为政府在人工智能系统发布前进行审查的重要一步,尤其是针对具备网络安全能力的模型。它的推迟凸显出人工智能安全监管与保持对中国等竞争对手领先之间的持续张力。
美国总统唐纳德·特朗普推迟签署一项行政令,这项行政令原本会允许政府在人工智能模型发布前对其进行评估。特朗普在白宫记者团面前表示,他不喜欢其中某些措辞,并称自己不想做任何会妨碍美国在人工智能领域领先的事情。他强调,美国正在领先中国以及其他所有国家,因此相关政策措辞不应成为阻碍。报道还称,这次推迟也受到现实政治因素影响,包括短时间内没有足够多的科技公司首席执行官能赶到华盛顿。
原本的签署活动不仅是一项政策动作,也会是一场公开的照片展示。该行政令预计将要求国家网络主管办公室和其他机构制定一套在模型发布前进行安全评估的流程。这样做部分是为了回应一些新模型引发的担忧,例如 Anthropic 的 Mythos 和 OpenAI 的 GPT-5.5 Cyber,它们都能够快速发现并利用安全漏洞。争议最大的条款之一,是要求人工智能公司在发布前14到90天把先进模型提供给政府。
报道指出,国家网络主管办公室和其他机构原本将被要求制定一套在模型上线前进行安全评估的流程。CNN称,一个关键争议点是要求企业在发布前14到90天向政府共享先进模型的措辞。
TechCrunch AI

由 Brett Adcock 创立的神秘 AI 实验室 Hark 表示,已完成 7 亿美元 A 轮融资,投后估值达到 60 亿美元。该公司称自己正在打造一种 agentic AI 系统,作为通向数字世界的通用接口,并计划在今年夏天发布首批多模态模型。
7 亿美元的 A 轮融资无论按什么标准都极不寻常,尤其是对一家几乎没有公开产品细节的公司来说更是如此。这笔融资表明,投资者仍然相信消费级 AI 还有机会诞生颠覆性的交互界面,同时也把多家芯片和企业巨头带入了这场竞争。
Hark 在周四宣布完成一轮高达 7 亿美元的 A 轮融资,投后估值达到 60 亿美元。该公司称自己正在为一款 AI 个人助手同时开发模型和硬件,这个系统的目标是成为通向数字世界的“通用接口”。Hark 由 Brett Adcock 创立,他也是机器人公司 Figure.AI 和电动飞行器公司 Archer 的创始人,Hark 于 2025 年底启动时就投入了 1 亿美元自有资金。此次融资由 Parkway Venture Capital 领投,并吸引了 Nvidia、AMD Ventures、Intel Capital、Qualcomm Ventures、Salesforce Ventures 等一众战略投资者。Hark 计划在今年夏天发布首批多模态模型,并称这些模型将驱动一个可与现有产品和服务协同工作的个人 AI 平台。
随后,公司还打算推出专为这些系统设计的硬件设备。Hark 表示,这笔新资金将主要用于招聘硬件、产品设计和 AI 研究人才,同时也会用于获取算力和零部件。该公司目前有 70 名员工,并运营着一座配备 Nvidia B200 GPU 的数据中心。Hark 的设计总监 Abidur Chowdhury 曾在 Apple 担任产品高管,他表示投资人对团队的一系列演示印象深刻,但拒绝透露更多产品细节。他还认为,目前市场上的 AI 产品大多是在帮助人们写软件,而 Hark 想做的是面向“普通人”的消费级产品。
这轮融资由 Parkway Venture Capital 领投,参与方包括 Nvidia、AMD Ventures、Intel Capital、Qualcomm Ventures、Salesforce Ventures、ARK Invest、Brookfield、Greycroft、Prime Movers Lab、Align Ventures 和 Tamarack Global。Hark 目前有 70 名员工,运行着配备 Nvidia B200 GPU 的数据中心,这笔资金将用于招聘、算力和零部件采购。
TechCrunch AI

Anthropic 向投资者表示,预计第二季度营收将增长一倍以上,达到约 109 亿美元,并首次实现经营利润。根据《华尔街日报》的报道,这一里程碑来自 Claude 和企业 AI 工具需求的快速增长。
如果这一点被证实,Anthropic 将成为最早实现盈利的主要 AI 实验室之一,说明头部模型公司能够把爆发式使用量转化为真实的经营利润。这也会强化 Anthropic 在与 OpenAI 的竞争中的位置,尤其是在双方都在加速扩大收入、算力和产品采用率的背景下。
据《华尔街日报》报道,Anthropic 已向投资者说明,公司预计将在第二季度首次实现经营利润,同时营收约为 109 亿美元。这意味着公司在短时间内完成了巨大的业绩反转,因为就在去年夏天,Anthropic 还告诉投资者,年度盈利可能要到 2028 年之后才会出现。报道显示,这一季度营收同比增长约 130%,即使放在近期 AI 热潮中也属于极快增速。公司预计该季度的经营利润为 5.59 亿美元。增长的主要动力来自 Anthropic 的编程工具获得大规模企业采用,以及 Claude 的“agentic”使用场景,即模型在较长时间内自主处理任务。
Anthropic 也在尝试拓展核心聊天机器人之外的市场,例如面向小企业主的新服务和面向律师事务所的新工具。与此同时,需求一度超过公司可用算力,导致部分用户被限流,并促使公司签订新的数据中心合作安排。报道还指出,尽管本季度单位收入对应的算力支出有所下降,但由于后续还要承担大量算力成本,Anthropic 可能无法在全年持续保持盈利。值得注意的是,这一消息发布当天,OpenAI 也被报道称可能很快提交 IPO 相关文件,这进一步凸显了两家头部 AI 实验室之间的竞争。
据报道,Anthropic 第二季度经营利润为 5.59 亿美元,营收为 109 亿美元,营收同比增长 130%。报道还指出,尽管本季度每赚 1 美元收入对应的算力支出下降了,但由于未来将承担高额算力成本,公司可能无法全年保持盈利。
TechCrunch AI

·#xai
TechCrunch 报道称,xAI 在 2025 年营收 32 亿美元的情况下运营亏损 64 亿美元,这些信息来自 SpaceX 的 IPO 文件。文件还提到 Grok 预计将扩展到“数万亿参数”规模,意味着未来还会有更大规模的算力投入。
这几乎是外界首次公开看到 xAI 的财务状况,说明马斯克的 AI 业务烧钱规模已经非常大。它也暗示随着 Grok 扩张,AI 基础设施支出可能继续快速上升,从而影响竞争对手、投资者和数据中心市场。
TechCrunch 表示,SpaceX 的 IPO 文件首次让外界看到 xAI 的部分财务情况,而数字非常惊人。2025 年,xAI 的运营亏损高达 64 亿美元,但营收只有 32 亿美元。相比之下,2024 年该公司还只是亏损 15.6 亿美元,营收为 26.2 亿美元,说明亏损扩大得很快。文件显示,营收增长的一部分来自“AI 解决方案和基础设施收入”,其中包括 X 和 Grok 的订阅收入、数据授权收入,以及广告收入。即便如此,收入与支出之间的缺口仍然明显拉大。
文件还暗示,xAI 的投入并没有放缓。其 AI 业务在 2026 年第一季度的资本开支就达到 77 亿美元,按年化计算约为 308 亿美元。SpaceX 还称,xAI 的 Colossus 和 Colossus II 两座数据中心分别在 122 天和 91 天内建成,目前合计提供约 1 吉瓦算力,用于训练和推理。公司下一步计划把 Grok 扩展到“数万亿参数”规模,并将其描述为在推理深度和整体智能上的“跃迁”。文件还提到将扩展 AI 算力基础设施,甚至设想未来把训练和推理迁移到轨道数据中心,初步卫星部署时间最早可能是 2028 年。
文件显示,xAI 的亏损从 2024 年的 15.6 亿美元(营收 26.2 亿美元)扩大到 2025 年的 64 亿美元(营收 32 亿美元)。文件还称,2026 年第一季度 AI 业务资本开支就达到 77 亿美元,而 Colossus 和 Colossus II 两座数据中心合计提供约 1 吉瓦算力,用于训练和推理。
TechCrunch AI

英伟达公布了截至4月26日的季度财报,营收达到816亿美元,其中数据中心业务收入创下752亿美元的新高。公司还授权800亿美元回购股份,并披露其持有的未上市初创公司股权增至430亿美元,几乎是季度初220亿美元的两倍。
这份业绩再次巩固了英伟达在 AI 基础设施中的核心地位,说明加速卡和数据中心系统需求仍在推动其超常增长。大规模回购授权和扩大的初创公司持仓也表明,英伟达现金流极其充裕,并且正在积极向整个 AI 生态投入资本。
英伟达在周三收盘后公布了截至4月26日的季度业绩,再次创下纪录。该季度公司营收达到816亿美元,较上个季度增长20%,其中数据中心业务收入创下752亿美元的新高。基于这份强劲表现,公司授权了800亿美元的股票回购。首席财务官 Colette Kress 表示,Blackwell 架构已经被每一家主要超大规模云厂商、云服务商和主要模型厂商采用并部署。不过,英伟达也提示增长速度可能放缓,预计下一季度营收将达到910亿美元,对应12%的增长。Kress 还表示,中国出口并没有对公司盈利产生明显影响;虽然 H200 已获美国出口批准,但公司尚未因此获得收入,而且是否能够进入中国市场仍存在不确定性。
另一个引人注目的信息,是英伟达在未上市公司中的股权持有规模,即报表中的“非市场性股权证券”。这部分持仓在本季度几乎翻倍,从220亿美元升至430亿美元,主要由185亿美元的买入推动,而上一季度类似买入仅为6.49亿美元。该披露不包括英伟达近期对 Corning 和 IREN 等上市公司的投资,也不包括尚未完成交割的未来承诺。英伟达还在2月承诺向 OpenAI 投资300亿美元,但交易的具体结构并未披露。在财报电话会上,Jensen Huang 强调了英伟达在 AI 基础设施中的更广泛作用,并表示公司今年和明年都会为 Anthropic 带来相当可观的算力建设,而在此之前英伟达对 Anthropic 的覆盖几乎是零。
英伟达表示,Blackwell 架构已经被主要超大规模云厂商、云服务商和模型厂商采用并部署,但公司同时预计下个季度增速会放缓,给出的营收指引为910亿美元,对应12%的增长。公司还表示,中国市场没有对业绩造成明显影响,同时指出 H200 已获美国出口批准,但尚未带来收入,而且在中国是否能够进口仍存在不确定性。
The Decoder

美国网络司令部已经成立了一个新工作组,以加快将 OpenAI、Google 等公司的 AI 模型部署到高度机密的五角大楼和 NSA 网络上。该行动由 Joshua Rudd 上将通过内部邮件宣布,目标是评估这些模型如何在最高机密系统上安全使用。
这很重要,因为它可能把前沿商用 AI 直接带入美国最敏感的国防和情报环境,从而改变网络防御的工作方式。若部署成功,可能加快威胁检测、漏洞分析和决策速度,但也会带来严重的安全与滥用风险。
据 Politico 和知情人士称,美国网络司令部已经成立了一个新的工作组,目的是加快把先进 AI 模型部署到五角大楼和 NSA 使用的高度机密网络上。这个工作组大约在两周前由同时领导 NSA 和网络司令部的 Joshua Rudd 上将通过内部邮件宣布。它的任务是评估来自 OpenAI、Google 等硅谷公司的模型,如何在所谓的 high-side 系统上安全运行,而这些系统是政府环境中保护最严密的网络。技术支持将主要来自 NSA 的 AI 安全中心,同时由一名网络司令部军官负责推进相关工作。推动这一行动的直接原因,是已经出现了能够比最优秀的人类黑客更快发现数字系统安全漏洞的 AI 模型。
文章提到,Anthropic 最近限制了 Claude Mythos 模型的访问,因为其被滥用可能带来严重的经济和国家安全后果,而 OpenAI 也宣布了具有类似能力的模型。报道认为,这一趋势让军方专家相信,AI 正在成为威胁检测、漏洞优先级排序,以及在攻防网络行动中加快决策的关键工具。前网络司令部副司令 Charles Moore 中将告诉 Politico,这项计划不仅有价值,而且是必要的。Anthropic 估计,类似工具可能在 6 到 24 个月内广泛可用,这也说明威胁环境正在迅速变化。
这个工作组横跨网络司令部和 NSA,技术支持主要来自 NSA 的 AI 安全中心,并由一名网络司令部军官负责领导。推动该计划的直接原因,是一些 AI 系统已经能够比人类黑客更快发现安全漏洞,而 Anthropic 预计类似工具可能在 6 到 24 个月内广泛可用。
The Decoder

Cohere 已将 Command A+ 以 Apache 2.0 许可证开源发布。该模型是一个 2180 亿参数的混合专家模型,激活参数为 250 亿,支持 128K 上下文,并具备文本和图像的多模态能力。
这是大型企业 AI 厂商发布的重要开源模型,让开发者和系统构建者更容易接触到高端多模态能力。它在效率和基准测试上的提升,使其对智能体、检索增强生成和多语言文档处理等生产场景更具吸引力。
加拿大 AI 公司 Cohere 将其迄今最强大的语言模型 Command A+ 以 Apache 2.0 许可证开源发布。该模型采用混合专家架构,总参数量为 2180 亿,激活参数为 250 亿。Cohere 表示,它主要面向企业工作流,特别适用于智能体任务、检索增强生成以及多语言文档处理。该模型支持文本和图像,覆盖 48 种语言,并提供 128K 的上下文窗口。
Cohere 还称,这个模型可以在两块 Nvidia H100 GPU 或一块 Blackwell GPU 上运行,显示出相对高效的部署特性。与前代 Command A Reasoning 相比,它在 τ²-Bench Telecom 上从 37% 提升到 85%,在 Terminal-Bench Hard 上从 3% 提升到 25%。在 Artificial Analysis Intelligence Index 上,它得分略低于 37 分,大致与 Claude 4.5 Haiku、Gemma 4 31B 和 Mistral Medium 3.5 处于同一水平。Cohere 表示,模型权重已在 Hugging Face 上以多种量化格式提供,而该公司近期还收购了德国 AI 公司 Aleph Alpha。
Cohere 表示,Command A+ 可以在两块 Nvidia H100 GPU 或一块 Blackwell GPU 上运行,这说明它在模型规模之外具备相对高效的部署特性。与 Command A Reasoning 相比,它在 τ²-Bench Telecom 上据称从 37% 提升到 85%,在 Terminal-Bench Hard 上从 3% 提升到 25%,并且权重已在 Hugging Face 上以多种量化版本提供。
The Decoder

《华尔街日报》报道称,OpenAI 正在准备 IPO 文件,并可能在几天内向 SEC 提交保密材料。该公司目标是在最早 9 月启动上市,Goldman Sachs 和 Morgan Stanley 正在协助制作招股书。
OpenAI 潜在的 IPO 将是 AI 行业内最具影响力的上市事件之一,可能改变估值基准、资本流向以及行业对治理结构的预期。它也意味着一家领先的 AI 实验室正在更接近公开市场,这可能重塑竞争格局,以及竞争对手和投资者的融资策略。
据报道,OpenAI 正在推进首次公开募股(IPO),并可能在几天内向 SEC 提交保密版上市文件。根据《华尔街日报》的说法,该公司已经在与 Goldman Sachs 和 Morgan Stanley 等大型投行合作,准备招股书。报道指出,OpenAI 的目标是最早在 9 月启动上市。若此事成真,这将是人工智能领域最受关注的公司之一迈出的关键一步。OpenAI 最近一轮融资中的估值达到 8520 亿美元,显示出投资者对其业务规模的高度认可。
本周,公司还在与联合创始人 Elon Musk 的诉讼中赢得了重要阶段性胜利,Musk 曾指控 OpenAI 从非营利使命转向了营利性结构。不过,Musk 表示将提起上诉。尽管如此,OpenAI 仍面临内部执行压力,包括营收和用户目标未达成。随着 Anthropic 和 SpaceX 等竞争对手也被报道在筹备 IPO,AI 与更广泛的科技上市市场都可能迎来更多高关注度事件。
OpenAI 在最近一轮融资中的估值达到 8520 亿美元,这说明其拟上市规模可能非常大。公司仍面临一些挑战,包括未达成内部营收和用户目标;同时,它在与 Elon Musk 的诉讼中获胜,暂时排除了一个法律障碍,但 Musk 计划上诉。
The Verge AI

在埃隆·马斯克与山姆·奥特曼围绕 OpenAI 的审判中,陪审团仅商议了几个小时,就以诉讼时效为由驳回了全部指控。庭审中还听取了马斯克、奥特曼、微软 CEO 萨提亚·纳德拉、OpenAI 联合创始人格雷格·布罗克曼,以及前 OpenAI 董事会成员希冯·齐利斯等人的证词。
这起案件是围绕 OpenAI 使命、公司结构和控制权最重要的法律争端之一,可能影响 ChatGPT 以及公司的公共利益公司地位。它也凸显了 AI 领域更广泛的矛盾:非营利起源的理想与推动模型研发和竞争的商业压力之间的冲突。
这篇文章回顾了埃隆·马斯克与山姆·奥特曼之间围绕 OpenAI 方向和治理的高调诉讼。马斯克作为 OpenAI 联合创始人,于 2024 年提起诉讼,声称 OpenAI 背离了其“为全人类利益开发 AI”的创始使命,转而优先追求利润。马斯克还表示,奥特曼和格雷格·布罗克曼误导他出资支持公司,随后却背弃了最初的愿景。OpenAI 否认这些指控,并将这起诉讼描述为马斯克试图拖慢竞争对手,同时扶持自己的业务,包括 xAI 和 Grok。
长达近一个月的庭审中,法院听取了来自 AI 和科技界多位重要人物的证词,包括微软 CEO 萨提亚·纳德拉、OpenAI 联合创始人格雷格·布罗克曼、前董事会成员希冯·齐利斯等。马斯克的诉讼请求包括罢免奥特曼和布罗克曼,并阻止 OpenAI 继续以公共利益公司的形式运营。陪审团只商议了几个小时,最终以诉讼时效为由驳回案件。文章将这场争端描述为一场可能重塑 OpenAI 的重大对决,但最终陪审团并未就实体争议作出裁决。
马斯克既是 OpenAI 联合创始人,也是竞争对手 xAI 的首席执行官,他指控奥特曼和布罗克曼背弃了 OpenAI 的最初使命,并不当地将公司转向逐利。OpenAI 则称这起诉讼是“毫无根据、出于嫉妒、试图阻挠竞争对手”的行为,而马斯克要求的救济包括罢免奥特曼和布罗克曼,并终止 OpenAI 作为公共利益公司的运作。
The Verge AI

SpaceX 的 S-1 文件披露,Anthropic 同意在 2029 年 5 月前每月支付 12.5 亿美元,以使用位于孟菲斯的 Colossus I 和 Colossus II。按此计算,这笔交易每年约 150 亿美元,而且在当前扩容阶段,费用会在本月和下月暂时下调。
这笔交易凸显了大规模 AI 训练算力已经变得多么昂贵和稀缺,即使对头部模型公司也是如此。它还表明,数据中心接入正在成为一种战略性商业资产,而不只是基础设施细节。
就在本月早些时候,SpaceX 和 Anthropic 刚刚宣布了一项新的算力合作,让 Anthropic 可以使用 SpaceX 位于田纳西州孟菲斯的 Colossus 数据中心。随后 SpaceX 的 IPO 文件进一步披露了这笔交易的财务细节。根据 S-1 文件,Anthropic 同意从现在起到 2029 年 5 月,每月向 SpaceX 支付 12.5 亿美元,以获得 Colossus I 和 Colossus II 这些 AI 训练中心的访问权限。按年计算,这相当于大约 150 亿美元,几乎可以把 SpaceX 2025 年 187 亿美元的营收再翻一倍。合同中还包含一项条款,允许任一方在提前 90 天通知后终止协议。与此同时,在本月和下月的产能爬坡阶段,Anthropic 的费用还会暂时降低。
文件显示,这种安排显然是为了适应 AI 基础设施需求快速变化的现实。更广泛地看,这也反映出 AI 公司正在为算力展开激烈争夺,因为训练所需的基础设施越来越紧缺。埃隆·马斯克在 X 上表示,SpaceX 也准备向其他希望使用这些数据中心的 AI 公司提供类似服务。文件还显示,自今年早些时候与 xAI 合并以来,SpaceX 在 AI 上的投入极其激进:2025 年 AI 资本支出达到 127 亿美元,占总支出的约 61%。到 2026 年第一季度,SpaceX 在 AI 上又花了 77 亿美元,而其航天业务支出仅约 10 亿美元。披露文件同时指出,SpaceX 的 AI 部门在 2025 年和 2026 年初都录得巨额运营亏损;相比之下,Anthropic 的业务则在快速增长,并接近首次实现季度经营利润。
协议包含双方均可提前 90 天终止的条款,这反映出 AI 市场变化极快且存在不确定性。SpaceX 还提到,Anthropic 的 Claude 与 X 的 Grok 存在竞争关系,这也说明 AI 产品竞争与算力供给之间的重叠正在加深。
The Verge AI

据报道,Meta 已裁掉数千名员工,以便将更多资金转向 AI 基础设施和“超级智能”项目。Business Insider 称,受影响员工被告知,这轮裁员是公司提升效率并抵消其他投资支出的举措之一。
这轮裁员显示 Meta 正在非常激进地把资源转向 AI,即使这意味着大规模缩减员工规模。对更广泛的科技行业来说,这也说明大型平台正在优先投入资本密集型 AI 建设,而不是继续扩大人力规模。
据报道,Meta 已经开始通知数千名员工,他们将被裁撤,而公司这样做的目的,是为了抵消其不断增加的 AI 投资成本。Business Insider 分享的一封管理层邮件称,这轮裁员是公司“持续努力以更高效率运营,并抵消我们正在进行的其他投资”的一部分。关于大规模裁员的传闻最早在 3 月流出,当时外界一度认为 Meta 可能会裁掉最多 20% 的总员工数。到了 5 月,一份更近的备忘录显示,这轮裁员目前预计影响约 8000 人,约占 Meta 7.8 万名员工的 10%。这些裁员发生在 Meta 今年 1 月给出重磅资本开支指引之后。
公司当时预计 2026 年资本支出将达到 1150 亿至 1350 亿美元,用于支持 Meta Superintelligence Labs 以及核心业务,而这几乎是 2025 年 722.2 亿美元支出的两倍。与此同时,Business Insider 还报道称,Meta 正在把 7000 多名员工转去新的 AI 项目,Bloomberg 则称公司正在关闭 6000 个开放岗位。Meta 在备忘录结尾向被裁员工表示感谢,称他们对公司“故事”的贡献非常重要。已经有部分受影响员工在 LinkedIn 上发帖确认自己被裁,其中有人提到自己是与“8000 名 Meta 同事”一起被解雇的。Meta 目前尚未公开最终确认受影响员工总数。
Meta 在今年 1 月预测,2026 年资本支出将达到 1150 亿至 1350 亿美元,用于支持 Meta Superintelligence Labs 和核心业务,几乎是 2025 年 722.2 亿美元支出的两倍。据称,这次裁员约影响 8000 人,同时超过 7000 名员工被调往新的 AI 项目,另有 6000 个空缺岗位被关闭。
Ars Technica AI
SpaceX 现在把 AI 定位为公司未来业务的核心,并在为预期 IPO 准备的财务披露中,将火箭发射和卫星业务描述为配套业务。公司称其 AI 机会可能价值 26.5 万亿美元,而且在今年早些时候正式收购 xAI 之后,SpaceXAI 部门如今负责 Grok。
这表明 SpaceX 不再只是火箭发射公司,而是在争夺 AI 赛道的重要位置,其估值叙事也可能越来越依赖 AI。若这一战略成功,将加剧它与 OpenAI、Anthropic 以及大科技公司支持的 AI 产品之间的竞争,并影响投资者对 SpaceX IPO 的预期。
SpaceX 正把 AI 描述为其长期业务战略的核心,并认为这一市场机会大到足以与整个美国经济相提并论。根据公司为预期中的首次公开募股准备的财务披露,传统的火箭发射和卫星业务被定位为支撑性业务,而不是未来增长的主轴。这一战略变化发生在 SpaceX 今年早些时候正式收购 xAI 之后,Grok 模型和 Grok 聊天机器人也因此被纳入新的 SpaceXAI 部门管理。公司在 S-1 文件中声称,AI 属于“人类历史上最大可执行总市场”,并将这一机会估值为 26.5 万亿美元。
文件并未说明这一估值对应的时间范围,但该数字明显高于行业机构的预测,例如 Gartner 预计到 2027 年全球 AI 支出将达到 3.3 万亿美元,而 Citigroup 估计到 2030 年全球 AI 市场可能超过 4.2 万亿美元。尽管 SpaceX 口径十分激进,它仍必须证明自己能在由大科技资金支持的 AI 竞赛中追上领先者。报道提到,马斯克此前在与 OpenAI 相关的法律程序中曾把 xAI 形容为“最小的 AI 公司”。文章还指出,Grok 虽然深度整合在马斯克的 X 平台中,但用户付费采用率依然偏弱,显示它在与 ChatGPT 等竞品的竞争中仍处于落后位置。
SpaceX 的 S-1 文件称,AI 构成了其所谓“人类历史上最大可执行总市场”中的大部分,但并未说明 26.5 万亿美元估算对应的时间范围。公司仍面临可信度差距:报道援引的 AppMagic 调查显示,2026 年第二季度受访美国用户中只有 0.174% 为 Grok 付费,而为 ChatGPT 付费的比例超过 6%。
MIT Technology Review AI

Anthropic 于 5 月 19 日在伦敦举办了为期两天的 Code with Claude 开发者活动,展示了 Claude Code 以及更新的“dreaming”功能,用于更具代理性的编码工作流。此次活动把 Claude 介绍为不仅是编程助手,更是一个能够越来越多地自我提示、自我测试并自我纠错的系统。
这次活动说明 AI 编码工具正在迅速改变软件工程的规范,尤其是人类编写、审查和信任代码的方式。它也凸显了行业内日益扩大的争论:这些工具究竟是在真正提高生产力,还是只是把工作重心转移到审查更多机器生成代码上。
《MIT Technology Review》将 Anthropic 的 Code with Claude 活动描述为一个很能说明软件开发走向的窗口。这场为期两天的开发者聚会于 5 月 19 日在伦敦开始,恰好与 Google I/O 在帕洛阿尔托开幕同一天,Anthropic 员工强调这只是巧合。活动主舞台上,Anthropic 工程师 Jeremy Hadfield 问现场有多少人在过去一周里提交过一份完全由 Claude 编写的 pull request,结果几乎半个会场都举起了手。当他接着问有多少人在合并这些代码之前根本没有阅读过代码时,大多数举手的人仍然保持举手,这引发了现场的紧张笑声。文章借此说明,AI 生成代码在一些开发者中已经变得相当普遍。Anthropic 管理层表示,公司希望把自动化推到尽可能远的程度,Claude Code 负责人 Boris Cherny 说,默认方式已经不是直接提示 Claude,而是让 Claude 自己去提示自己。
在这种模式下,Claude 需要自行测试、调整并修复自己的工作,尽量让人类甚至看不到错误信息。Ravi Trivedi 还介绍了 Claude Code 的新功能 dreaming,它允许代理给自己写笔记,供后续运行复用任务知识并从之前的错误中学习。Anthropic 认为,dreaming 通过读取并整合这些笔记中的信息,可以帮助 Claude Code 随着时间推移更好地理解某个代码库。活动中还包括来自 Spotify、Delivery Hero、Lovable、Base44 和 Monday.com 的产品展示和实操工作坊,这些公司都被当作围绕 Claude Code 重塑软件开发团队的成功案例。与此同时,文章指出,在会场外,许多开发者对这种“光明未来”越来越不安,他们在 Reddit 和 Hacker News 等地方担心,AI 工具可能会增加审查负担,甚至让编程能力退化。
在活动现场,Anthropic 工程师 Jeremy Hadfield 说,几乎半个房间的人在过去一周里提交过完全由 Claude 编写的 pull request,而且很多人承认在合并前并没有认真阅读代码。Anthropic 将 Claude Code 的“dreaming”功能描述为让编码代理留下笔记,供后续运行使用,从而帮助系统更好地理解代码库并整合先前任务的经验。
Simon Willison

Simon Willison 宣布发布 Datasette Agent 的首个版本,这是一个可扩展的 Datasette AI 助手。它允许用户以对话方式查询数据,并且借助 datasette-agent-charts 插件还可以生成图表。
这把对话式 AI 直接带进了 Datasette,而 Datasette 是一个广泛用于探索 SQLite 和其他表格数据的工具。它之所以重要,是因为它可能让开发者、分析师以及不熟悉 SQL 的用户更快、更容易地完成数据分析。
Simon Willison 表示,Datasette Agent 的首个版本已经发布,这也标志着他长期开发的 LLM 工作与 Datasette 终于结合到了一起。Datasette Agent 是一个可扩展的 AI 助手,运行在 Datasette 之上,允许用户用自然语言询问存储在其中的数据。安装 datasette-agent-charts 插件后,它还可以基于数据生成图表。Willison 录制演示视频时使用的是 agent.datasette.io 这个在线演示站点,其中运行了若干示例数据库,包括经典的 Global Power Plants 数据集,以及他博客的一个备份副本。这个演示使用 Gemini 3.1 Flash-Lite,Willison 说它成本低、速度快,而且编写 SQLite 查询没有问题。
演示中的一个问题是“Simon 最近一次看到鹈鹕是什么时候”,系统据此生成了一条针对他博客数据的 SQL 查询来寻找答案。最终系统回答说,最近一次鹈鹕目击记录发生在 2026 年 5 月 20 日,并列出了那次观察中记录到的鸟类和其他动物。Willison 还强调,插件机制是这个项目最有意思的部分,因为 Datasette Agent 延续了 Datasette 一贯的插件优先设计。目前已经发布了三个插件,其中包括使用 Observable Plot 生成图表的插件,以及基于 ChatGPT Images 2.0 的图像生成工具。
现场演示使用的是 Gemini 3.1 Flash-Lite,Willison 说它便宜、速度快,而且能够很好地编写 SQLite 查询。Datasette Agent 的设计强调插件扩展性,目前已发布的早期插件包括基于 Observable Plot 的图表生成,以及基于 ChatGPT Images 2.0 的图像生成工具。
TechCrunch AI

在 Google I/O 上,谷歌推出了面向消费者的 AI 代理方案,包括信息代理、Gemini Spark、Android Halo 通知,以及 Gemini 应用中的 Daily Brief 功能。公司还展示了 Chrome 中更具代理能力的体验,并表示部分功能会先向付费订阅用户开放。
这是谷歌试图把 AI 从聊天机器人变成全天候助手的最新动作,让它能够跨产品监控信息并处理日常任务。这很重要,因为它可能重塑消费者与 Gmail、Docs、Calendar、Chrome 和 Android 的交互方式,同时也会进一步拉大付费 AI 功能与谷歌免费消费级产品之间的差距。
谷歌在其 I/O 开发者大会上推出了面向消费者的新一代 AI 代理愿景,但这场发布会也被认为相当令人困惑。公司把信息代理定位为 Google Alerts 的 AI 版本,能够在后台全天候监控用户关心的话题,比如市场趋势、价格追踪或天气预警。谷歌还发布了 Gemini Spark,这是一个个人代理,能够接入 Gmail、Google Docs 和 Google Workspace 等产品,帮助用户完成日常整理和规划任务。谷歌表示,Spark 可以从新闻简报中提炼主题、整理家庭库存、跟踪需要补货的物品,还能协助安排朋友间的团体旅行。
Gemini 应用也将获得一项名为 Daily Brief 的功能,它会从 Gmail、日历和任务中汇总出个性化摘要。谷歌还给 Android 上的相关通知起了新名字 Android Halo,表示用户将通过它追踪 Spark 的提醒。大多数功能目前都不会立即向所有人开放,而是先面向最重度的用户,尤其是每月 100 美元的 Google Ultra 订阅者。在美国,Pro 和 Ultra 订阅用户将于今年夏天获得信息代理,Spark 很快会向 Ultra 用户提供,Halo 将于今年晚些时候登陆 Android,而 Daily Brief 则会向 Ultra、Pro 和 Plus 订阅用户推送。
信息代理被定位为 Google Alerts 的重做版本,旨在全天 24 小时在后台运行,跟踪市场趋势、价格变化和天气预警等主题。Gemini Spark 面向更个人化的整理任务,而 Daily Brief 会汇总 Gmail、日历和任务中的更新;其中许多功能最初仅面向美国的 Google Ultra、Pro 或 Plus 订阅用户。
TechCrunch AI

黄仁勋表示,英伟达已经发现了一个与其新款 Vera CPU 相关的“全新2000亿美元可服务市场”,并称这款产品是为智能体 AI 专门打造的。他是在财报电话会上作出这一表态的,当时英伟达刚刚公布了81.6亿美元的季度营收,并给出了下一季度910亿美元的营收指引。
如果英伟达能把 CPU 变成一个重要新业务,就可能把公司的增长从 GPU 扩展到更广泛的 AI 基础设施领域,并巩固其行业地位。这个判断也说明 AI 芯片竞争正在扩大,云厂商和其他芯片公司正试图在 GPU 和 CPU 两条线上同时挑战英伟达。
TechCrunch 认为,英伟达 CEO 黄仁勋再次借助财报电话会,为公司下一个增长引擎描绘了极其乐观的前景。在英伟达公布又一个创纪录季度、营收达到816亿美元,并给出下一季度910亿美元指引之后,黄仁勋表示,公司已经发现了一个与 Vera CPU 相关的“全新2000亿美元可服务市场”。Vera 是英伟达在3月推出的新产品线,黄仁勋把它定位为能够重塑公司机会边界的关键业务。他称 Vera 是“世界上第一款为智能体 AI 专门设计的 CPU”,并表示各大超大规模云厂商和系统厂商都在与英伟达合作部署它。
黄仁勋解释说,GPU 负责模型的“思考”部分,而智能体会更多依赖 CPU 来执行任务和调用工具。按照他的说法,Vera 的设计目标是尽可能快地处理 token,这与传统云 CPU 按“核心”设计、强调并行运行多个应用的思路不同。他进一步预测,世界将从10亿人类用户走向数十亿 AI 智能体,而这些智能体都需要类似 PC 的工具,因此对 CPU 的需求会大幅增加。文章同时提到,华尔街仍担心未来会有什么因素削弱英伟达的统治地位,尤其是在 AWS 等厂商也在推进自研 AI 芯片的情况下,但黄仁勋的核心观点是,Vera 可能会成为英伟达新的重大增长动力。
黄仁勋表示,Vera 既可以单独销售,也可以与英伟达的 Rubin GPU 捆绑销售,而且它并不是面向传统云 CPU 的设计,而是为了让 AI 智能体更快处理 token 而优化。他还称英伟达今年已经卖出了价值200亿美元的独立 Vera CPU,但文章将这一说法放在黄仁勋一贯乐观表述的背景下,并未把它当作独立核实的市场数据。
The Decoder

Google 正在测试一个名为“Agentic Browsing”的新实验性 Lighthouse 类别,用来检查网站是否为 AI 代理做好了准备。该审计会查看可访问性树质量、Cumulative Layout Shift(CLS)、WebMCP 注册情况,以及是否存在 llms.txt 文件。
这表明一种新的网页实践正在形成,其目标是让 AI 代理更容易与网站交互,例如填写表单、预订或比较商品。如果这些做法被广泛采用,网页团队可能不仅要为人类和屏幕阅读器设计页面,还要考虑自动化代理的工作流程。
Google 正在试验 Lighthouse 中一个名为“Agentic Browsing”的新实验性类别,用来评估网站对 AI 代理的适配程度。报道指出,这套机制基于一些尚未最终定稿的提案标准,因此目前还不是正式规范。尽管如此,它被认为与未来的网页使用方式有关,因为 AI 代理可能需要代用户填写表单、完成预订或比较商品。与传统 Lighthouse 不同,这个审计不会给出 0 到 100 的总分。
它只显示各项检查的通过比例。检查内容包括 Google 的 WebMCP API、可访问性树质量、以 Cumulative Layout Shift(CLS)衡量的视觉稳定性,以及是否存在 llms.txt 文件。Google 对 llms.txt 的态度并不热情,报道提到公司自己认为它对 AI 搜索并没有实际意义。面向开发者的建议则是使用语义化 HTML、正确的 ARIA 标签,并尽量减少布局偏移,以便网站更适合机器读取和操作。
这项审计不会给出 0 到 100 的分数,而是返回各项检查的通过比例。Google 的建议强调语义化 HTML、正确的 ARIA 标签以及尽量减少布局偏移,同时也指出 Google 自己并不认为 llms.txt 对 AI 搜索有实际意义。
The Verge AI

Spotify 与环球音乐集团(UMG)宣布达成一项授权协议,允许 Premium 用户生成流媒体歌曲的 AI 混音和翻唱。该功能将作为付费附加服务推出,参与计划的艺人可以选择退出,或从这些 AI 生成作品中获得版税。
这意味着 AI 音乐生成正从未经授权的“新奇玩法”转向受许可的流媒体功能,可能影响其他平台和版权方对生成式 AI 的处理方式。若该模式获得成功,它也可能为艺人和词曲作者带来新的收入来源。
Spotify 与环球音乐集团(UMG)宣布达成一项授权协议,允许用户通过提示词生成平台上歌曲的 AI 混音和翻唱。这个新功能不会免费开放给所有人,而是会作为 Premium 订阅用户的付费附加服务推出。艺术家可以选择退出该计划,但愿意参与的艺人将从这些 AI 生成的混音和翻唱中获得版税。这个消息看起来是 Spotify 先前与大型音乐公司推动“负责任 AI 产品”合作后,真正落地的第一个具体产品。去年 10 月,Spotify 曾表示正在与 UMG、Sony Music Group、Warner Music Group、Merlin 和 Believe 合作推进这一方向,但当时并没有明确说明最终会做成什么样。
Spotify 现在给出的原则包括:参与选择权、公平补偿与新增收入,以及艺人与粉丝之间的连接。Spotify 联席 CEO Alex Norström 表示,这项工作建立在参与艺术家和词曲作者的“同意、署名和补偿”之上。UMG CEO Sir Lucian Grainge 则称,这是一项 AI 驱动的“超级粉丝”计划,目标是支持人类创作、加深粉丝关系,并为艺术家和词曲作者创造更多收入机会。Spotify 目前还没有公布该功能的上线时间,也没有说明除 Premium 之外的具体收费标准。
Spotify 表示,该项目围绕三个原则展开:是否参与由艺术家自行选择、公平补偿与新增收入、以及加强艺人与粉丝的连接。公司尚未公布具体上线时间,也没有说明除 Premium 订阅之外的额外定价。
ZDNET AI

·#ai
在 Linux Foundation 的 Open Source Summit North America 上,Linus Torvalds 表示,AI 工具正在增加 Linux 内核的贡献数量,并改变开发者的工作方式。他还公布了更严格的 AI 辅助安全披露指导,警告研究人员不要公开可直接利用的漏洞利用代码。
Torvalds 的表态之所以重要,是因为他是 Linux 的创始人,所说的话直接反映了 AI 如何重塑全球最重要的开源项目之一。他的警告也凸显了安全工作的一个新矛盾:AI 让发现漏洞更容易,但也可能让披露渠道不堪重负,并增加不负责任公开发布的风险。
在 Linux Foundation 的 Open Source Summit North America 上,Linus Torvalds 将 AI 描述为有用的工具,而不是程序员的替代品。他说,近期 AI 编码工具的进步,已经明显改变了 Linux 内核开发的方式,带来了更多提交,也让更多人参与进来。Torvalds 指出,自从转向 Git 之后,内核的发布流程大约稳定了 20 年,但这种模式在过去 6 个月被打破了。期间,他估计最近两个版本的提交量比过去很多年的版本大约多了 20%。起初,他以为提交激增是因为大家对某个大版本更新更兴奋,但后来他发现,真正的变化是 AI 工具已经好到足以被很多开发者实际使用。他认为,这降低了参与门槛,并让整体开发活动显著增加。
与此同时,他强调开源项目里最棘手的问题往往不是代码本身,而是工作方式和流程被迫改变时带来的社会性压力。一个典型例子是 Linux 内核安全邮件列表,他说那里最近被 AI 生成的重复漏洞报告淹没了。为此,Torvalds 公布了新的安全披露指导,并表示如果一个漏洞是借助 AI 发现的,通常应当视为已经接近公开,因为其他人也很可能用 AI 找到同样的问题。他还警告研究人员不要公开可直接利用的漏洞利用代码,并表示不要到处炫耀自己如何让某家公司瘫痪。这些评论表明,Torvalds 认为 AI 对开发有帮助,但它也给安全工作流程和负责任披露规范带来了新的压力。
Torvalds 表示,自从迁移到 Git 之后,Linux 的发布流程大约稳定了 20 年,但过去 6 个月的提交量比以往版本大约增加了 20%。他还说,内核安全邮件列表最近被 AI 生成的重复报告淹没,因此他提出新规则:用 AI 发现的安全漏洞应当视为几乎已经公开,因为很多其他人也可能同样发现它们。
ZDNET AI

微软表示,将开始逐步取消个人 Microsoft 账户的短信身份验证和账户恢复方式。公司正引导用户改用通行密钥,并搭配已验证邮箱用于恢复。
这代表业界正在逐步摆脱被普遍认为较弱的短信验证,因为它容易受到钓鱼和 SIM 卡交换攻击。对用户和 IT 团队来说,通行密钥通常能带来更强的安全性和更简单的登录体验,尤其是在更多服务转向无密码认证的背景下。
微软正在改变个人 Microsoft 账户的认证方式,开始逐步取消用于登录和账户恢复的短信验证。公司是在一页新的支持文档中公布这一变化的,并表示将引导用户转向通行密钥。微软认为,基于短信的认证容易受到钓鱼和 SIM 卡交换攻击,攻击者可能借此获取验证码并接管账户。微软还指出,短信并没有端到端加密,因此在传输过程中更容易被拦截。
为了替代短信,微软表示会引导用户添加已验证邮箱和通行密钥。如果用户想更早使用通行密钥,微软也提供了设置方法的支持说明。文章提到,通行密钥可以通过主流密码管理器、实体安全密钥、移动设备,或 Windows 电脑上的 Windows Hello 使用。虽然这一迁移需要一些额外设置步骤,但文章认为从长期看,安全性和便利性的提升值得这样做。
微软表示,短信身份验证如今已成为欺诈的重要来源,因为短信没有端到端加密,可能被拦截。公司建议将通行密钥存入密码管理器、使用实体安全密钥,或通过 Windows Hello、面部/指纹识别和 PIN 完成登录。
Financial Times AI
英伟达公布的营收和业绩指引都好于预期,同时还提高了股息。尽管如此,投资者并未完全买账,公司股价仍然下跌。
这一反应说明市场对英伟达的预期已经非常高,作为 AI 芯片的主导供应商,哪怕业绩强劲,也未必足以推动股价上涨。若投资者期待更快增长或更大惊喜,普通的超预期表现可能仍然不够。
英伟达是全球市值最高的公司之一,但在公布业绩后股价仍然下跌。公司披露的营收高于市场预期,对未来业绩的指引也好于预期,同时还宣布上调股息,显示其现金流和资产负债表状况较强。通常情况下,这种“业绩超预期并上调指引”的组合,再加上更高的股东回报,都会受到市场欢迎。然而这一次,投资者在公告后仍然选择卖出股票。
市场反应表明,外界对英伟达的预期已经非常高,尤其是在它处于 AI 硬件热潮核心位置的背景下。投资者似乎认为这份更新虽然不错,但还不足以支撑股价进一步大幅上涨。这个消息也说明,即使是最强的大盘科技公司,在被定价为“必须持续交出惊人增长”的情况下,也很难轻易满足市场。
这次更新同时包含了财务数据超预期和通过提高股息回馈股东。股价下跌说明,在短期内,估值担忧和过高预期可能会压过亮眼的表面数据。
Financial Times AI
·#ai
《金融时报》这篇文章探讨了AI是否能让公共部门更高效,但也提醒说,公众在与政府部门打交道时同样会使用这些工具,这可能抵消一部分生产率提升。文章关注的并不是某个单一突破,而是对AI如何改变政府服务供给和需求的更广泛重新评估。
如果AI能帮助政府员工更快地工作,就可能缩短响应时间、减少积压并降低行政成本。但如果公众也用AI生成更多咨询、申诉或服务请求,那么政府机构最终获得的净生产率提升可能会比预期更小。
《金融时报》探讨了一个越来越现实的问题:AI能否让公共部门更高效?文章指出,AI可能帮助政府工作人员处理重复性任务、回答问题,并加快服务交付。与此同时,文章也提出了一个重要的限制:公众在与政府部门打交道时,同样可能使用这项技术。这样一来,政府一侧通过自动化获得的效率提升,可能会被更多由AI辅助发起的申请、咨询或文书工作部分甚至全部抵消。
文章因此把AI描述为不仅影响政府内部效率的工具,也是一种会改变公共服务供需关系的力量。也正因为如此,衡量生产率提升不能只看自动化了多少任务或节省了多少员工时间。更大的启示是,政府在部署AI时,必须同时考虑它如何改变公众行为,而不只是改变官僚流程。
这篇文章的核心矛盾在于:AI既能自动化一部分面向公众的服务,也可能让公众更容易、大规模地与政府互动。这与各地政府办公室正在进行的更广泛试验相呼应,其中AI工具正被用于回答咨询并提升响应能力。
Financial Times AI
《金融时报》这篇文章指出,如果 AI 破坏或大幅压缩就业市场,政府将面临劳动收入税收下降的缺口。文章把这一问题描述为自动化可能带来的财政难题,而不仅仅是劳动力市场问题。
劳动税收是许多经济体的重要财政来源,因此如果就业长期下降,福利、医疗和其他公共服务的预算都会承压。文章凸显了一个更广泛的政策问题:如果 AI 和自动化削弱了人类税基,政府是否需要更直接地对 AI 或自动化征税。
这篇文章提出了一个简单但后果重大的财政论点:如果 AI 造成大量岗位消失,政府将失去相当一部分劳动收入税收。这个问题之所以重要,是因为许多公共预算高度依赖工薪阶层缴纳的税,而不是依赖机器或资本。随着自动化推进,即使企业的生产率和利润提高,按工资征收的税收也可能减少。结果就是,人类税基不断缩小,而公共支出需求却可能上升,二者之间的错配会越来越明显。
文章认为,政策制定者必须思考如何在自动化经济中补回流失的劳动税收。在更广泛的政策讨论中,可能的应对方式包括对 AI 部署征税、对机器人或自动化征税,或者重新设计税制,让技术本身更直接地为公共收入做出贡献。文章的核心提醒是:AI 的经济影响不仅仅是就业被冲击,还包括当劳动不再是经济中心时,政府该如何筹措财政收入。
其核心机制很直接:如果 AI 取代工人,即便总产出上升,工资税和所得税收入也可能下降。在更广泛的讨论中,人们提出过机器人税、自动化税等方案,用于弥补被替代劳动带来的税收损失,但这篇文章本身更像是一则简短论点,而不是完整的政策方案。
Google DeepMind News

Google DeepMind 正在亚太地区启动首届加速器项目,主题为“AI for the Planet”。这个为期三个月的项目将支持初创公司、研究团队和非营利组织,利用前沿 AI 解决气候、自然、农业、能源及其他环境风险问题。
这个项目之所以重要,是因为亚太地区既是全球经济增长的重要引擎,也面临极高的气候脆弱性,而绿色技术的扩张速度仍不足以应对不断上升的环境风险。通过提供导师支持和 Google AI 专家资源,加速器有望帮助有潜力的项目更快从研究走向落地。
Google DeepMind 正在亚太地区推出首届加速器项目,主题是“AI for the Planet”。公司表示,这个项目旨在帮助创新者应对亚太地区不断加剧的环境风险。Google 认为,亚太地区虽然是全球经济增长的重要引擎,但同时也对气候变化高度脆弱。尽管绿色技术正在获得更多关注,但其扩张速度仍然不足以赶上该地区持续上升的环境挑战。
该加速器为期三个月,面向初创公司、研究团队和非营利组织开放。参与者将使用前沿 AI 解决自然、气候、农业、能源等领域的问题。Google 表示,入选机构将获得专家导师指导和定制化支持,并得到 Google AI 专家的帮助,把前沿 AI 和科学 AI 模型整合到项目或产品中。项目将以在新加坡举行的线下训练营开始,感兴趣的机构现在可以报名表达意向。
入选团队将获得专家导师指导、定制化支持,以及来自 Google AI 专家的帮助,以整合前沿 AI 和科学 AI 模型。该项目将以新加坡的线下训练营开场,Google 也在邀请有意向的机构报名。
MIT Technology Review AI

·#ai
《MIT Technology Review》于2026年5月21日发布了一场圆桌讨论录制,参与者包括主编 Mat Honan、高级AI编辑 Will Douglas Heaven 和AI记者 Grace Huckins。讨论的重点是,AI是否能够学习“世界模型”,从而超越语言模型,更好地理解并与物理世界互动。
“世界模型”正被越来越多人视为AI从文本预测走向理解物理世界的一条重要路径。如果这一方向取得成功,可能会影响机器人、具身AI,以及各大AI公司围绕更强通用系统展开的竞争。
《MIT Technology Review》举办了一场题为“Can AI Learn to Understand the World?”的圆桌讨论,核心问题是:AI系统能否形成“世界模型”,从而理解并作用于物理世界。该讨论录制于2026年5月21日,参与者包括主编 Mat Honan、高级AI编辑 Will Douglas Heaven 和AI记者 Grace Huckins。页面指出,AI公司正在努力构建超越大型语言模型局限的系统。此次活动把“世界模型”放在了当前AI讨论的前沿位置。
页面可见内容并未提供完整文字实录,只提示读者可以收听或观看讨论。该内容还标注为仅限 MIT 校友和订阅者访问。页面同时引导读者查看 MIT Technology Review 的其他AI报道,包括关于AI现状的图表内容,以及斯坦福2026年 AI Index。总体来看,这更像是一场编辑部策划的专题讨论,而不是一项技术公告或产品发布。
该页面是仅面向订阅者和 MIT 校友的圆桌内容,因此目前可见信息主要是讨论主题框架,而不是完整技术实录。该讨论录制于2026年5月21日,页面还引导读者查看相关AI报道以及斯坦福2026年AI Index 以获取更广泛背景。
TechCrunch AI

TechCrunch 报道称,谷歌在 2026 年 Google I/O 上宣布将推出更偏对话式、以 AI 为核心的搜索体验,用户一开始就能使用 AI Mode,而且 AI Overviews 还会加入可继续追问的聊天框。作为回应,这篇文章介绍了几款希望减少 AI 干扰的替代搜索引擎。
谷歌搜索是许多人进入互联网的默认入口,因此这次向 AI 优先的重大改版,可能改变人们获取和判断信息的方式。文章也反映出用户对 AI 摘要、广告和平台垄断的日益不满,这可能推动更多人转向小众或注重隐私的搜索工具。
TechCrunch 表示,在 Google I/O 2026 的主题演讲之后,谷歌搜索即将变得非常不同,因为公司正在把搜索重塑为一种更具对话感、以 AI 为中心的体验。负责 Google Search 的 Elizabeth Reid 将这次变化称为 25 年来搜索框最大的升级。按照新的设计,用户一开始就可以选择 AI Mode,即使不选择 AI Mode,普通搜索结果也可能出现 AI Overviews,并带有聊天框供用户继续追问。文章认为,这会让谷歌看起来越来越像 ChatGPT,而不再是人们过去几十年熟悉的传统搜索引擎。
作者还指出,这一改版并没有获得预期中的积极反应,许多用户反而反感 AI 被强行塞进网页体验的各个角落。文章提到,谷歌此前的 AI Overviews 就曾出现过问题,而公司在搜索领域的长期主导地位也一直备受争议,包括 2024 年美国联邦地区法院裁定谷歌非法维持在线搜索垄断。基于这种背景,TechCrunch 推荐了一些适合不想要强 AI 化结果的替代搜索引擎。其中包括 Kagi,它是付费、无广告的搜索引擎,支持自定义筛选和可选的 AI 摘要;DuckDuckGo,它是免费的,并且不收集搜索和浏览历史,还允许用户在设置里完全关闭 AI 功能;以及 Startpage,它相当于谷歌搜索结果的代理层。
文章指出,谷歌搜索现在会在一开始就提供 AI Mode,甚至普通结果页也可能出现带有聊天框的 AI Overviews,方便继续追问。文中还提到 Kagi 的付费无广告模式和可自定义的“lenses”、DuckDuckGo 可关闭 AI 功能,以及 Startpage 作为谷歌搜索结果的代理服务。
TechCrunch AI

Spotify 宣布推出一项由 ElevenLabs 提供支持的工具,并以邀请制 beta 形式开放,让作者可以通过 Spotify for Authors 自行发布 AI 生成的有声书。该功能计划在 6 月上线,首批仅支持英语。
这为 Spotify 的有声书平台增加了更低门槛的 AI 配音工具,可能让独立作者更容易制作并分发音频版本。它也反映出出版行业正在更广泛地转向 AI 辅助创作,尤其适合希望使用更自然合成语音、又不想签独家协议的创作者。
Spotify 正在为其 Spotify for Authors 平台新增一款由 ElevenLabs 驱动的工具,允许作者自行发布 AI 生成的有声书。公司在 Investor Day 上表示,这项功能将于 6 月以邀请制 beta 形式上线。最初版本仅支持英语有声书。Spotify 强调,使用该 AI 生成工具的作者不会被绑定到独家发布协议。也就是说,创作者可以把生成的有声书同时发布到其他平台。此举建立在 Spotify 现有的 ElevenLabs 合作基础之上,之前作者已经可以把在 ElevenLabs 语音 AI 平台制作的有声书提交到 Spotify。Spotify 也与 Google Play Books 有数字配音内容合作,不过这次明显更偏向更具表现力的语音模型。
值得注意的是,ElevenLabs 在 2025 年也推出了自己的作者自助出版平台。除了有声书制作工具,Spotify 还宣布将 Spotify for Authors 扩展到 10 种新语言,包括法语、加拿大法语、德语、荷兰语、拉丁美洲西班牙语、瑞典语、芬兰语、冰岛语、丹麦语和挪威语。公司还表示,今年会扩展 Audiobook+ 订阅方案,提高收听上限,并在未来加入学生和家庭选项,但没有公布具体价格或使用规则。Spotify 称其 Audiobook+ 订阅已超过 100 万,并且平台年化经常性收入正朝着 1 亿美元迈进。公司还推出了用自然语言提问来发现有声书的新方式,并计划在今年夏天把基于提示词生成播放列表的功能扩展到有声书。Spotify 表示,其有声书目录已经达到 70 万本,听书时长同比增长了 60%,而且超过一半的有声书听众是在过去一年内开始使用的。
Spotify 表示,使用该工具生成的 AI 有声书不受平台独家限制,因此作者也可以在其他地方发布。公司还在将 Spotify for Authors 扩展到 10 种新语言,并计划升级 Audiobook+ 订阅方案,但尚未公布具体定价和使用细节。
TechCrunch AI

由前 Calm 员工 Anson Whitmer 和 Tyler Sheaffer 创办的 AI 心理治疗与教练创业公司 The Path,刚完成 1430 万美元种子轮融资。Tony Robbins 最初通过 Prime Movers Lab 支持这家公司,后来也以联合创始人身份加入。
这笔融资显示,投资者仍然看好使用 AI 的心理健康产品,尤其是那些强调比通用聊天机器人更安全的工具。如果 The Path 能在安全控制下提供个性化支持,它可能会成为专业化 AI 心理服务产品浪潮的一部分。
The Path 的起点来自一款面向男性的心理健康应用 Mental。其创始人注意到,一个名为 AI interactive audio 的功能在用户中反响异常强烈,于是萌生了打造一款新的 AI 心理治疗与教练产品的想法,并希望它比通用消费级聊天机器人更安全。Anson Whitmer 和 Tyler Sheaffer 随后将这个想法发展为 The Path,Tony Robbins 也在 Prime Movers Lab 投资后逐步深度参与,最终以联合创始人身份加入。The Path 现在完成了 1430 万美元种子轮融资,领投方是 Prime Movers Lab,参与方包括阿波罗·安东·奥诺、德昂泰·维尔德和 Designer Fund。Whitmer 说,他投身心理健康科技来自个人经历:他的叔叔和表弟都曾自杀,这促使他攻读心理学博士,并希望把科学研究带给更多人。
此前他曾在 Calm 工作,但他认为仅靠冥想应用还不够,因为人们的问题过于个人化、过于独特。Whitmer 认为,大语言模型和 AI 有机会弥补“需要个性化关怀的人很多、治疗师和教练数量却远远不够”之间的缺口。他同时强调,消费级聊天机器人往往以“提升参与度”为目标,会强化用户观点并尽量快速给出答案,而治疗和教练更需要深入理解问题、挑战用户,并帮助他们自己找到解决方案。The Path 表示,其 AI 模型会先建立结构和理解,再逐步走向“解决”,并在心理健康安全基准 Vera-MH 上拿到了 95 分,而消费级聊天机器人的最高分只有 65。该应用目前提供 11 位虚拟 AI 治疗师,用户还可以调整对话的直接程度等偏好,目前免费开放,未来计划按月收取 40 美元。
公司表示,其模型是在开源模型基础上进行后训练,而不是直接基于主流消费级大模型,并且在心理健康安全基准 Vera-MH 上得分 95,而消费级聊天机器人最高只有 65。该应用提供 11 位虚拟 AI 治疗师,用户可以调整直接程度等偏好,目前免费,未来计划按每月 40 美元收费。
The Decoder

SAP 正在使用 Mistral AI 模型构建一个多语言 RAG 聊天机器人,帮助客户和员工迁移到 S/4HANA,也就是其用于财务、采购和物流的核心企业软件。在瑞士联邦铁路(SBB),该聊天机器人为 3 万名员工解答问题,检索内部文档,并将未解决的问题转交给人工专家。
这展示了企业 AI 正在被用于一个高摩擦、真实且复杂的工作流:迁移旧有业务软件。它也体现出市场对将数据保留在欧洲基础设施内的 AI 系统需求正在上升,这对受监管行业以及有严格数据驻留要求的客户尤为重要。
SAP 正在使用 Mistral AI 模型,帮助客户从旧系统迁移到 S/4HANA,这是该公司当前用于财务、采购和物流的核心平台。此次部署的重点是一个多语言 RAG 聊天机器人,用来帮助员工和客户应对迁移过程。在瑞士联邦铁路(SBB),这套聊天机器人已经在为大约 3 万名参与软件切换的员工解答问题。SAP 和 Mistral 表示,该系统会检索内部文档,理解技术缩写,并把无法回答的问题转交给人工专家。
人工给出的回复随后会被自动回填到系统中,从而帮助其改进后续回答。两家公司还表示,这套 AI 运行在欧洲的 SAP 基础设施上,数据不会跨越区域边界。双方合作始于 2024 年 6 月,并在 10 月进一步扩大。不过,用户组织指出,许多 SAP 客户仍然只是在试用 AI 工具,有限的云采用率和复杂的授权机制仍然在阻碍更广泛的落地。
该聊天机器人采用检索增强生成(RAG),从内部文档中回答问题,并且能够识别技术缩写。根据 SAP 和 Mistral 的说法,该系统运行在欧洲的 SAP 基础设施上,数据不会跨区域传输;未能回答的问题会交给人工处理,人工回复还会自动回流到系统中。
The Verge AI

Polyend 推出了 Endless,这是一款售价 299 美元的可编程吉他踏板,配套的 Playground 系统可以把文字提示词生成自定义效果。该踏板采用 ARM 处理器,并支持创建、下载或提交名为“Plates”的效果。
这款产品是把生成式 AI 引入实体音乐硬件的一次少见尝试,让吉他手可以快速原型化那些市面上并不存在的效果链。它也说明 AI 工具正在进入更细分的创作工作流,而不只是聊天机器人和软件。
Polyend 推出了 Endless,这是一款售价 299 美元的可编程吉他踏板,目标是让玩家借助 AI 创建自定义效果。Polyend 一直以偏小众、偏实验性的音乐设备闻名,因此这次推出 Endless 也延续了它做“非主流”硬件的路线,而不是传统意义上的标准失真踏板。该产品运行在 ARM 处理器上,并配套一个名为 Playground 的网页界面,用户可以用文字提示词来生成可用的吉他效果。Polyend 说,这套系统由多个互相协作的 AI 代理组成,并且这些代理是基于公司的效果库训练的,负责理解提示词、选择算法、生成代码并在加载到踏板前验证代码是否可运行。公司还特别说明,AI 并不直接运行在踏板内部,而是由定制的 LLM 先写出效果代码,再让用户导入到硬件上。
除了提示词生成之外,用户也可以用 C++ 手工编写效果,不过 Polyend 预计很多人会更多依赖社区图库或提示词工作流。当前 Plates 图库里大约有 60 种效果,大多由 Polyend 自己开发,覆盖饱和器、磁带循环模拟、吉他合成器,甚至还有自动演奏鼓机。文中提到的一些代表性效果包括 Grunt、Infinite Hall、Tessera 和 Stardust,它们分别体现了不同的音色设计方向。Polyend 还计划向第三方开放投稿,允许用户在 Playground 中做出效果后提交审核。每台设备附带 2,000 个 token,额外购买价格为每 2,000 个 token 20 美元,而且效果越复杂、迭代越多,消耗的 token 也越高。
Polyend 表示,AI 并不是直接运行在踏板里,而是通过定制的 LLM 生成可加载到硬件上的代码,并经过验证步骤确保代码能安全运行。用户随设备附带 2,000 个 token,之后每 2,000 个 token 需支付 20 美元,更复杂的效果生成成本也更高。
The Verge AI

Spotify Labs 正在推出 Studio,这是一款独立的 AI 应用,可以根据你的 Spotify 听歌历史和已连接的应用生成每日简报、播客和歌单。Spotify 还表示,该系统可以代表用户执行一些操作,例如研究主题、整理信息以及协助完成任务。
这意味着 Spotify 正从音乐和播客平台,进一步变成一个更主动的 AI 助手,用于个性化音频和类似生产力的任务。对于已经每天使用 Spotify 的用户来说,这也可能让 AI 生成音频更接近日常消费级功能。
Spotify 正在推出由 Spotify Labs 开发的 Studio,这是一款独立的 AI 应用,可以通过聊天提示在电脑上生成个性化的每日简报、播客和歌单。该应用会利用用户的 Spotify 听歌历史,也可以接入电子邮件、日历和笔记等其他应用,从而决定生成内容的方向。Spotify 表示,这个 AI 不只是生成内容,还能代表用户执行一些操作,包括研究主题、使用浏览器、整理信息以及帮助完成任务。Studio 生成的任何内容,包括每日简报播客,都可以直接保存到用户的 Spotify 资料库中。Spotify 说,Studio 将在未来几周内以研究预览版形式上线,面向 18 岁及以上用户。与此同时,Spotify 也在为现有产品加入新的 AI 播客功能。
今天开始,Premium 用户可以使用播客聊天机器人,它能够回答与节目相关的问题,例如帮助找到某个话题出现的时间戳。Spotify 还计划在下个月于应用内推出 Personal Podcasts,让用户直接在 Spotify 里根据提示生成 AI 播客。文章指出,Google、Amazon 和 Microsoft 也已经推出了类似的 AI 播客体验。虽然一些用户认为这类工具有助于快速了解新闻或学习新主题,但目前实际使用规模仍不清楚。Spotify 的优势在于,它已经拥有大量习惯在平台上听音频内容的用户,即使这些新内容并非由真人主持。
Studio 将在未来几周内以研究预览版形式上线,面向 18 岁及以上用户,生成的内容例如每日简报播客都可以保存到 Spotify 资料库。Spotify 还会从今天开始向 Premium 用户推出播客聊天机器人,可回答查找某个话题时间戳之类的问题,并计划在下个月于主应用内加入 Personal Podcasts。
The Verge AI

《The Verge》报道称,AI视频工具正在从生成炫目的独立短片,转向支持更完整的影视制作流程。Luma AI 和 Google 都在推进“智能体式”系统,不只是做 10 到 16 秒的视频,而是帮助概念构思、角色设计、风格开发和制作流程。
这之所以重要,是因为好莱坞不太可能被简单的 AI 短片取代,但影视公司可能会改变策划、迭代和制作内容的方式。如果这些工具如宣传所说那样有效,它们可能会减少前期制作和视觉开发中的摩擦,同时让制片方获得更高的控制力和一致性。
这篇文章认为,社交媒体上那些由 AI 生成的电影短片,并不意味着好莱坞就要被取代了。无论是伪造的 Daniel Craig 骑踏板车,还是 Godzilla 大战 King Kong、The Avengers 穿行曼哈顿,这些片段看起来很炫,但本质上仍只是短视频,不是真正可用的制作流程。文章指出,AI 视频公司真正发生的变化,是它们开始重新思考如何向影视公司销售自己的工具。Luma AI 首席执行官 Amit Jain 表示,公司最初向影视圈推销的方式,是说 AI 视频可以替代摄影机,让人们只靠提示词就能更快、更便宜、更好地拍电影。可是在与娱乐公司合作后,Luma 很快意识到,单纯生成一个片段并不能解决实际制作问题。Jain 说,10 到 16 秒的生成内容既不是镜头,也不是片段,更不是场景,影视行业需要的是不止于孤立输出的系统。
现在,Luma 希望自己的 AI 更像一个智能体,能够支持整个制作流程,这与 AI 编程工具从简单的 vibe coding 走向 agentic workflows 的演变很相似。Google 也在走类似路线,它新版的 Flow 是一个 AI 媒体创作平台,智能体会引导用户从概念出发,逐步完成剧情、角色和视觉风格的设计,然后再生成视频。新版 Flow 还强调一致性,用户可以像在 Slack 里添加同事一样,把已经开发好的角色通过标签加入项目。文章还提到,新一代视频模型在理解物理规律、特定年代的视觉风格以及电影语言方面也更强了,Flow 由 Google 的 Gemini Omni world model 驱动,而 Luma 则使用 Uni-1 作为统一模型。作为落地案例,Luma 最近还与 Amazon 合作制作了《The Old Stories: Moses》,这是 MGM《House of David》的一个配套特别节目;拍摄时,演员在显示 Luma 模型生成背景的 LED 屏前表演,连服装也由 AI 渲染。文章最后指出,如果某个镜头效果不理想,只需要重新给出一个提示词,就能快速生成新的素材,这说明 AI 对影视行业的影响更可能体现在加速和重塑制作流程,而不是简单地产出短片。
Luma 首席执行官 Amit Jain 说,短生成片段远远不够,因为它们既不是镜头,也不是段落,更不是场景,影视行业需要的是长期、端到端的工作。Google 新版 Flow 采用智能体引导用户完成多步骤流程,并可像在 Slack 里添加同事一样把已开发的角色加入提示词;而 Luma 的 Uni-1 模型则旨在无需极其复杂的提示词,也能理解一个设想中的世界。
The Verge AI

《The Verge》作者使用 Google 的 AI Studio 和 Gemini 在一个下午做出了三个 Android 应用,其中包括一款名为 MOOD 的类 Doom 文本冒险游戏。整个流程快到几分钟内就能生成代码、设计稿并安装到手机上,但应用本身质量一般,而且很快就触达了使用限制。
这篇文章展示了“vibe coding”在消费级应用创作上的进展,尤其是在 Android 上,非程序员也能很快把可运行原型装到真机上。与此同时,它也点出了 AI 生成应用的现实限制:速度虽然惊人,但质量、可控性和持续使用权限仍然很关键。
《The Verge》作者表示,自己在一天之内做出了第一个 Android 应用,随后又做出了另外两个,其中一个只用了 148 个词的提示词。Google 的 AI Studio 生成应用的速度非常快,作者只需要先在手机上开启 USB 调试并连接到电脑,就能在大约十分钟内把一个可运行的程序安装到真机上。起初,这让作者觉得普通人也许真的正在迎来一直被讨论的“个人软件革命”。在这个过程中,Gemini 还会主动替作者扩写需求,补充更多功能和设计想法。
作者的主要实验是做一款名为 MOOD 的类 Doom 文本冒险游戏,MOOD 是 Modern Online Oratory Dungeon 的缩写,作者也接受了 Gemini 提议的部分设定。AI Studio 很快生成了多套设计稿,并在大约二十分钟内交付了一个可以玩的 Android 应用。不过,当作者真正使用这些应用时,结果并不理想:计卡路里应用和几个游戏都很一般,地牢只有 11 个房间,文字质量也很差,而且只要一直按攻击键就能通关。作者还提到,AI Studio 很快就触发了每日使用上限,只能等待或付费继续,这也让“速度惊人”的体验多了一层现实限制。
作者提到,过程只需要先开启 USB 调试并把安卓手机连接到电脑,之后从提示词到安装基本都由 AI Studio 完成。Gemini 还会主动扩写需求,比如加入程序化生成、回合制战斗、隐藏要素和成长系统,但最终做出来的游戏规模很小,起初还有 bug,后来也能在大约一分钟内通关。
ZDNET AI

ZDNET 报道称,索尼在 CES 2019 推出的 360 Reality Audio,是一项试图通过音乐流媒体推动空间音频普及的早期尝试。文章认为,后来苹果的推进以及杜比的生态合作,最终让空间音频成为大众市场功能,而索尼的格式则逐渐失去势头。
这篇文章说明,在消费媒体领域,标准的胜出往往不只取决于谁先做出好技术,更取决于谁能建立最大的分发生态。它也展示了苹果的平台能力与杜比的合作网络,如何共同塑造了消费者对沉浸式音乐播放的默认预期。
索尼在 CES 2019 上发布了 360 Reality Audio,并将其描述为音乐的未来。这个格式得到了不少知名人士和机构的支持,包括 Pharrell Williams、Mark Ronson、Universal Music Group、Warner Music Group、Tidal 和 Amazon Music。索尼的策略是把这一格式与自家的耳机、耳塞、音箱、唱片业务以及面向第三方厂商的授权结合起来。公司对数字音乐流媒体时代沉浸式音频会变得重要这一点判断是准确的。
问题在于,索尼没有预料到控制这一未来的不会是自己。文章认为,索尼的核心失误不是技术本身,而是分发和生态能力不足。为了获得个性化播放,用户还必须在 Headphones Connect 应用中完成耳廓映射,而这一体验基本仍局限在索尼硬件之内。与此同时,苹果和杜比通过更广泛的平台与流媒体合作,让空间音频真正走向主流,最终使索尼的格式缺乏足够势头来占据主导地位。
索尼的方案依赖耳机、耳塞、音箱、流媒体平台接入以及其唱片公司关系,但它缺少一个大型流媒体平台或足够的硬件市场份额来形成规模。用户还需要在 Headphones Connect 应用中进行耳廓映射才能获得个性化播放,这使体验基本局限在索尼自己的生态内。
ZDNET AI

Fedora 已正式从其仓库中移除 Deepin Desktop Environment 软件包,紧随其后的是 SUSE 先前停止提供这些包。此举意味着用户已无法再从两大主流 Linux 发行版的官方仓库安装 Deepin。
这代表一个桌面环境在发行版层面遭到了明确否定,而它此前已经长期受到安全与隐私争议困扰。对于希望继续进入主流仓库的项目来说,这也提高了门槛:必须具备干净的打包、及时维护,以及能够通过严格审查的代码。
ZDNET 表示,曾经被认为是最漂亮的 Linux 桌面之一的 Deepin Desktop Environment,如今已经被从 SUSE 和 Fedora 的官方仓库中移除。文章认为,长期存在的安全与隐私争议,最终迫使这两个大型发行版停止继续分发它。报道回顾了更早的担忧,包括 Deepin 商店曾向 CNZZ 发送未加密请求,并传输浏览器标识等数据。Deepin 之后修复了该问题,而 Foss Linux 提到的一项取证检查则没有发现 Deepin 核心中存在活跃间谍软件的证据。尽管如此,Deepin 的声誉已经因为反复接受安全审视而受到影响。到了 2025 年,SUSE 表示其在 openSUSE 的 Deepin 打包中发现了政策违规:一名社区打包维护者使用变通方法绕过了正常的 RPM 打包机制,以安装受限制的资源。
SUSE 认为,考虑到与 Deepin 代码审查有关的复杂历史,它将暂时从 openSUSE 发行版中移除这些软件包。随后 Fedora 也采取了相同做法,FESCo 表示这些包应被退役,除非它们再次通过审查。Fedora 还据称尝试联系 Deepin 维护者持续四周,并得出结论认为 DDE 软件包长期处于很差的状态。实际结果是,用户已无法再从 Fedora 或 SUSE 的官方仓库安装 Deepin Desktop,不过仍然可以自行从源码编译。ZDNET 将这一决定视为对所有桌面项目的警示:开源并不意味着可以忽视安全审查、打包规范和持续维护。
ZDNET 提到,Deepin 商店曾向 CNZZ 发送未加密请求,并包含用户的浏览器标识等信息;Deepin 之后修复了该问题。SUSE 表示,一名打包维护者通过变通方式绕过正常的 RPM 安全审查来安装受限资源,而 Fedora FESCo 随后要求退役这些包,除非它们能再次通过审查。