AI 日报

AI 资本狂潮与治理反击:SpaceX IPO、物理 AI 融资与安全风险齐升

今天的核心主题很清晰:AI 进入了“更大、更贵、更像基础设施”的阶段。SpaceX 的历史性 IPO、Prometheus 与 Mistral 的巨额融资,和 OpenAI 的并购、Anthropic 的模型争议一起,显示资本正在继续追逐下一代算力与代理能力;但网络诈骗、自治武器和数据中心抗议也在同步抬高安全、治理与落地成本。

当天导读

从 47 条资讯中筛选出 25 条

今天的核心主题很清晰:AI 进入了“更大、更贵、更像基础设施”的阶段。SpaceX 的历史性 IPO、Prometheus 与 Mistral 的巨额融资,和 OpenAI 的并购、Anthropic 的模型争议一起,显示资本正在继续追逐下一代算力与代理能力;但网络诈骗、自治武器和数据中心抗议也在同步抬高安全、治理与落地成本。

SpaceX 以史上最大 IPO 改写市场预期

SpaceX 融资 750 亿美元并首日大涨,不只是一次上市,更像是对航天、AI 基础设施和超大规模资本市场的重新定价。[2477, 2486, 2497, 2493]

AI 资本继续外溢到物理世界

Prometheus、Mistral、Theker 和 Avataar 的融资与产品推进显示,投资者正在把资金投向工程、制造、机器人和本地化视频生成等“落地型 AI”。[2478, 2488, 2489, 2494]

代理式 AI 加速,但治理缺口也在放大

OpenAI 通过收购 Ona 强化 Codex 持久在线工作能力,而企业界同时警惕代理权限、身份和监控问题,担心生产事故会倒逼降级或弃用。[2475, 2499, 2501]

基础设施扩张正遭遇现实阻力

数据中心项目遭遇抗议、自治武器传闻升温、地理空间数据被重新用于机器人与可能的军事用途,说明 AI 的外部成本正在快速上升。[2480, 2479, 2487]

今日要点

  • 资本继续向 AI 与基础设施集中:SpaceX 以史上最大 IPO 震动市场,Prometheus、Mistral、Theker 等公司也在拿下大额融资或推进扩张。[2477, 2478, 2488, 2489]
  • AI 正从“会回答”走向“会行动”:OpenAI 强化 Codex 持久工作空间,企业代理治理和模型路由争议同时升温。[2475, 2499, 2501, 2484, 2496, 2498]
  • 安全与社会反作用力正在追上技术叙事:Google、OpenAI 反击 AI 滥用,乌克兰自主无人机传闻、Pokémon Go 地理空间数据再利用和数据中心抗议都显示外部成本在上升。[2481, 2476, 2483, 2479, 2487, 2480]

1) 资本市场:SpaceX 把“AI + 太空”推到极致

SpaceX 完成历史性 IPO(融资 750 亿美元),成为有史以来规模最大的上市交易;股价首日大涨,市场也把这次上市视为对航天、卫星互联网和 AI 基础设施叙事的重新定价。[2477]

这次上市还进一步放大了马斯克的财富与影响力叙事,相关报道称他可能成为全球首位万亿富豪。与此同时,TechCrunch 的播客把当前 IPO 回暖总结为从 FAANG 走向 MANGOS,说明市场关注点已明显转向 AI、芯片、云和航天平台。[2497, 2493, 2486]

2) 物理 AI 与机器人:从软件模型走向现实世界

Prometheus 融资 120 亿美元、估值 410 亿美元,押注“人工通用工程师”来自动化复杂物理系统的设计与制造,代表着 AI 资本开始向工程和制造链条深处延伸。[2478]

欧洲和区域市场也在补位:Mistral 正洽谈约 30 亿欧元融资,Theker 则以 8500 万美元 A 轮押注可重构工厂机器人,而 Avataar 推出的 Varya 则试图把更便宜、更本地化的视频 AI 带到印度市场。[2488, 2489, 2494]

3) AI 代理进入生产,但治理正在成为门槛

OpenAI 收购 Ona,给 Codex 增加可持续运行的云工作空间,意味着 AI 编程代理正朝着“长时间自主工作”继续演进。[2475]

但企业端的现实更谨慎:Gartner 预测到 2027 年将有 40% 的企业降级或弃用自主代理,ZDNET 的讨论也强调,代理需要像“实习生”一样被严格管控、限定权限并建立清晰责任边界。[2499, 2501]

4) 安全与滥用:模型能力越强,滥用门槛也越低

Google 已对据称利用 Gemini 生成钓鱼网站和短信诈骗的中国团伙提起诉讼;OpenAI 也封禁了与中国有关的影响行动集群。两家公司都把 AI 滥用视为直接安全威胁,而不是抽象政策问题。[2481, 2476, 2483]

同时,Anthropic 的 Claude Fable 5 既面临“隐性降级”争议,也在基准榜上领先但成本翻倍,显示前沿模型竞争已不只是能力之争,还包括透明度、定价和对开发者信任的争夺。[2498, 2496, 2484, 2492]

5) 现实世界的反作用力:数据中心、自治武器与地理空间数据

数据中心扩张正在遭遇社区组织化反对:研究称,2026 年第一季度至少有 75 个美国数据中心项目被阻止或延迟,涉及 1300 亿美元。[2480]

与此同时,乌克兰无人机测试的“全自主击杀”说法、Pokémon Go 玩家数据被用于地理空间 AI、以及自主系统对现实环境的再利用,都在提醒行业:AI 的边界正从屏幕内延伸到物理世界,而治理、隐私与国际法的摩擦会越来越大。[2479, 2487]

结语

今天的新闻拼图显示,AI 产业的主线已经很明确:资本继续追逐更大规模的模型、代理和基础设施;而与此同时,安全、透明度、监管和社会接受度正在成为决定这些项目能否真正落地的关键变量。[2477, 2478, 2480, 2481, 2499]

当日精选 8 条

01

TechCrunch AI

SpaceX 创下史上最大 IPO

·#spacex

SpaceX 创下史上最大 IPO

SpaceX 将 5.556 亿股定价为每股 135 美元,共融资 750 亿美元,成为历史上规模最大的 IPO。该股在纳斯达克以 150 美元开盘,盘中一度上涨 30%,最终收于 160.95 美元,涨幅为 19%。

这次上市对航天、卫星互联网和公开市场都具有历史意义,因为 SpaceX 是有史以来最具影响力的私营公司之一。此次交易可能重塑市场对超大规模 IPO 的预期,并进一步提升埃隆·马斯克的影响力和财富。

TechCrunch 将 SpaceX 的 IPO 描述为一次前所未有的事件,因为这家公司凭借可重复使用火箭、Starlink 卫星网络以及创始人兼首席执行官埃隆·马斯克,长期以来一直受到媒体和投资者的关注。此次发行将 5.556 亿股定价为每股 135 美元,融资 750 亿美元,成为史上规模最大的 IPO。SpaceX 股份在纳斯达克以 150 美元开盘,较发行价高出 11%,随后继续上涨,最终收于 160.95 美元,较发行价上涨 19%。由于交易异常活跃,Robinhood 表示其平台在 SpaceX 历史性公开市场亮相后的数小时内出现了“破纪录”的流量。

CNBC 采访了首席运营官 Gwynne Shotwell,她提到 SpaceX 与 Tesla 合并可能会让马斯克的生活更轻松。文章还指出,承销银行共获得约 5 亿美元费用,其中 Goldman Sachs 和 Morgan Stanley 是主要受益者。马斯克也在 X 上庆祝这一里程碑,称赞 SpaceX 员工,并转发了一些似乎在暗示“绿鞋机制”的图片。TechCrunch 表示,这是一篇会持续更新的现场报道,后续还会加入更多进展。

公司披露 2025 年亏损 49 亿美元,营收超过 180 亿美元,自成立以来累计亏损已超过 370 亿美元。马斯克拥有约 85.1% 的投票权,而据《纽约时报》报道,约 4400 名员工可能因上市而成为百万富翁。

查看单篇正文查看原文
02

TechCrunch AI

Prometheus 融资120亿美元押注物理 AI 工程

·#ai

Prometheus 融资120亿美元押注物理 AI 工程

由杰夫·贝索斯和维克·巴贾吉共同创办的物理 AI 初创公司 Prometheus 融资120亿美元,估值达到410亿美元。该公司称自己正在打造一种“人工通用工程师”,以自动化复杂物理系统的设计和制造。

这笔融资是物理 AI 领域最重大的单笔押注之一,表明投资者相信 AI 正在从软件走向工程与制造。若其成功,可能重塑航空航天、生物技术和机器人等行业中复杂产品的设计、生产和规模化方式。

Prometheus 是一家物理 AI 初创公司,由杰夫·贝索斯和维克·巴贾吉共同创办。公司宣布已按 410 亿美元估值融资 120 亿美元。此次资金来自贝索斯本人,以及摩根大通、高盛、贝莱德和其他投资者。报道指出,这是 Prometheus 的第二轮大额融资;该公司在去年年底启动时,曾先获得 62 亿美元的初始融资。Prometheus 目前有 150 名员工,分布在旧金山、伦敦和苏黎世。公司称其目标是打造“人工通用工程师”,即一种能够自动化复杂物理系统设计与制造的软件,例如喷气发动机和药物化合物。

贝索斯表示,这项技术的核心价值在于加速推动社会财富增长的“发明循环”。他还认为,AI 带来的生产率提升最终可能导致“劳动力短缺”,也就是对人类劳动力的需求超过供给。贝索斯的说法与一些强调大规模失业风险的 AI 观点不同,但他也承认这项技术会自动化工程师工作的许多环节。贝索斯还表示,公司会把大量资金用于算力,因为这项工作计算密集,而且需要生成新的数据。报道最后指出,Prometheus 已成为估值最高的 AI 初创公司之一,也是物理 AI 领域迄今最大的投资押注之一。

Prometheus 已进行了两轮融资,其中包括在 2025 年底启动后获得的 62 亿美元早期融资,目前在旧金山、伦敦和苏黎世共有 150 名员工。贝索斯表示,新资金中的很大一部分将用于算力,因为这项工作计算密集,并且需要创建大量训练数据。

查看单篇正文查看原文
03

Ars Technica AI

乌克兰据称测试全自主无人机击杀俄军

·#autonomous-drones

乌克兰据称测试全自主无人机击杀俄军

一家乌克兰无人机制造商称,两年前的一次战场测试中,开启人工智能“终结者模式”的全自主四旋翼无人机杀死了俄罗斯士兵。乌克兰无人机公司 Aero Center 首席执行官 Alexander Kokhanovskyy 在伦敦一场乌克兰大使馆活动上接受《新科学家》采访时披露了这一说法。

如果属实,这将成为自主武器系统的重要里程碑,意味着无人机据称已经能够在没有人类介入的情况下发现并攻击目标。这也引发了关于军事 AI、战场责任归属以及当机器做出致命决定时国际人道法如何适用的紧迫问题。

据一家乌克兰无人机制造商称,两年前的一次战场测试中,全自主无人机杀死了俄罗斯士兵。这个说法由 Aero Center 首席执行官 Alexander Kokhanovskyy 在伦敦乌克兰大使馆举办的一场活动上接受《新科学家》采访时披露。Kokhanovskyy 表示,这次测试并不属于他现在所在的公司,而是使用了四旋翼无人机。无人机在预先编程后飞往前线区域,随后切换到一种由 AI 驱动的“终结者模式”。在该模式下,无人机被描述为会在指定区域内寻找并攻击任何目标,而不需要人类操控。

报道同时指出,现场并没有视频画面或其他直接证据来证明无人机具体打击了什么目标。Kokhanovskyy 说,随后派出的人工操控无人机在现场发现了“几个”死亡的俄罗斯士兵,因此推断这些全自主无人机造成了死亡。文章强调,这一说法发生在乌克兰战争推动无人机、机器人和 AI 辅助武器快速发展的背景下。活动上的国防企业代表称,乌克兰政府禁止在目标拦截的最后阶段使用 AI;一名乌克兰军方指挥官也表示,作战系统仍以半自主为主,关键决策必须由人类作出。文章还指出,让无人机在预设区域内自行攻击一切目标,存在误伤友军和平民的风险,也可能受到国际人道法和现实作战限制的约束。

据称这次测试只是一次性实验,而且没有公开视频或其他直接证据证明无人机具体攻击了什么目标。乌克兰国防界代表表示,政府禁止在目标拦截的最后阶段使用 AI,而一名乌克兰指挥官则告诉《新科学家》,实战系统仍然由人类把控关键控制决策。

查看单篇正文查看原文
04

Ars Technica AI

抗议已阻止1300亿美元数据中心项目

·#data-centers

抗议已阻止1300亿美元数据中心项目

人工智能情报公司 10a Labs 的项目 Data Center Watch 研究人员表示,2026 年第一季度,美国至少有 75 个数据中心项目因社区抗议或反对而被阻止或延迟,涉及金额约 1300 亿美元。研究人员称,这是一自 2023 年开始追踪以来三个月内记录到的最高水平。

这些发现表明,对 AI 和数据中心扩张的抵制正变成一种结构性风险,而不只是短期反弹。这可能重塑大型算力和基础设施项目的选址,提高开发商面临的监管不确定性,并影响能源、土地使用和本地成本相关的政治讨论。

《Ars Technica》报道称,社区如今已经掌握了一套有效的办法来阻止数据中心建设。文章援引 NBC News 和 Data Center Watch 的数据指出,2026 年第一季度是有记录以来数据中心项目被阻止或延迟最严重的时期。1 月到 3 月期间,全美至少有 75 个项目被阻止或拖延,涉及总金额约 1300 亿美元。Data Center Watch 由人工智能情报公司 10a Labs 运营,自 2023 年以来一直在追踪美国各地围绕数据中心的冲突。研究人员认为,这种模式不应被理解为短期波动,而是一个结构性转变。

其原因包括社区已经内化了反对策略、州立法机构引入了更多监管不确定性,以及活跃的反对团体数量增加到 49 个州的 833 个。文章还指出,这股反对浪潮正在变得具有政治意义,并可能影响即将到来的中期选举,因为两党对地方反对声音的同情都在上升。文章同时提到社会学家 Tressie McMillan Cottom,她在北卡罗来纳州与组织者接触后改变了对数据中心抵制运动的看法。她写道,人们不仅是在反对噪音、公共事业成本上升、公共健康风险和本地资源浪费,也在学习水权、土地使用和热力学等议题,并借此建立地方政治联盟。

研究人员表示,活跃反对组织数量已翻倍以上,达到覆盖 49 个州的 833 个团体,他们认为这反映的是“结构性转变”,而不是周期性激增。文章还指出,这些抗议带来的政治势头可能影响即将到来的中期选举,而且两党对地方反对的同情都在增加。

查看单篇正文查看原文
05

Ars Technica AI

谷歌起诉滥用 Gemini 的网络诈骗团伙

·#ai-security

谷歌起诉滥用 Gemini 的网络诈骗团伙

谷歌表示,已对一个名为 Outsider Enterprise 的中国团伙提起诉讼,指控其利用 Gemini 帮助生成钓鱼网站和诈骗基础设施。该团伙据称通过 Telegram 传播,并向 Android 用户发送关于账户异常和包裹投递的伪造短信。

这是平台公司就“疑似 AI 参与的网络犯罪”采取法律行动的一个高关注案例,说明生成式 AI 正在降低大规模钓鱼攻击的门槛。它也凸显了运营商、消息拦截和设备端诈骗检测在遏制产业化诈骗网络中的作用。

谷歌宣布起诉一个其称为 Outsider Enterprise 的中国网络犯罪团伙,指控该网络利用 Gemini 自动化并放大诈骗活动。根据谷歌提交的法律文件,该团伙通过 Telegram 运作,并向那些没有足够技术能力自行搭建欺诈基础设施的人提供“网络钓鱼即服务”。谷歌称,该团伙还提供了如何使用 Gemini 创建仿冒 Google、YouTube 以及纽约 E-ZPass 等政府或服务门户网站的说明。该组织据称提供了近 300 个诈骗模板,以便更轻松、更重复地开展钓鱼攻击。谷歌表示,这场活动向 Android 用户发送了超过 250 万条诈骗短信,其中仅上个月某两周内就约有 5.5 万条。

总体而言,谷歌称其已追踪到与该网络相关的 9000 个假网站和 100 万个 URL。常见短信内容会谎称账户出现问题或包裹投递异常,受害者点击链接后会进入伪造页面,个人信息和银行资料因此被盗。谷歌没有估算总共被盗金额,但在博客中表示已有数百人因此蒙受损失。谷歌还称,其与 AT&T、Verizon 和 T-Mobile 合作封堵了许多恶意短信,同时 Google Messages 中的设备端诈骗检测功能也可能帮助减少了成功的钓鱼尝试。谷歌表示,这一功能每月可拦截约 100 亿条诈骗短信。

谷歌称,Outsider Enterprise 提供了近 300 个诈骗模板,并指导用户借助 Gemini 制作仿冒 Google、YouTube 以及纽约 E-ZPass 等机构的网站。谷歌还表示,已追踪到与该网络相关的 9000 个假网站和 100 万个 URL;发往 Android 用户的诈骗短信超过 250 万条,其中上个月有两周内就约 5.5 万条。

查看单篇正文查看原文
06

TechCrunch AI

Google 起诉 AI 驱动的钓鱼网络

·#cybersecurity

Google 起诉 AI 驱动的钓鱼网络

谷歌周五对一个据称名为 Outsider Enterprise 的中国网络犯罪团伙提起诉讼。谷歌表示,该团伙利用 AI 进行钓鱼和短信诈骗,冒充谷歌及其他品牌,窃取密码和信用卡信息。

此案表明,生成式 AI 和自动化工具正在降低大规模诈骗的门槛,让攻击者可以用更少的技术能力实施海量欺诈。它也说明大型平台和运营商正越来越多地协同,去打击跨短信、网站和云基础设施的滥用行为。

谷歌表示,正在通过诉讼摧毁一个据称由 AI 驱动的大型网络犯罪行动背后的基础设施。该诉讼针对谷歌称为 Outsider Enterprise 的团伙,谷歌认为其位于中国,并负责冒充谷歌及其他品牌进行钓鱼和短信诈骗。谷歌称,该团伙利用 AI 帮助生成欺诈网站和诈骗信息,目的是窃取密码、多因素验证码和信用卡信息。公司表示,这场行动已经让“数十万”受害者遭受经济损失,累计损失估计达到数百万美元。谷歌还说,该团伙在两周内部署了 9000 个假网站、100 万个欺诈域名,并向 Android 用户发送了 250 万条短信。

在同一时间段内,Android 用户标记了 5.5 万条垃圾短信,谷歌称这相当于平均每两分钟就有超过两条投诉。谷歌表示,它正在使用 AI 驱动的工具对抗 AI 驱动的诈骗,并称这些系统每月可拦截超过 100 亿条诈骗消息。谷歌还说,正在与 AT&T、T-Mobile、Verizon 以及 FBI 合作,阻止这些诈骗短信并破坏该团伙的运作。FBI 发言人告诉 TechCrunch,在谷歌和 Lumen 的 Black Lotus Labs 协助下,FBI 已查封多个域名,以及用于测试该钓鱼服务的 Shopify 店铺和账户。

谷歌称,Outsider Enterprise 在两周内部署了 9000 个假网站、100 万个欺诈域名,并向 Android 用户发送了 250 万条短信,其中两周内就有 5.5 万条垃圾短信被用户标记。该钓鱼平台据称每周收费 88 美元或每月 200 美元,提供 290 多个模板,可在几分钟内生成假网站,并实时转发被窃数据。

查看单篇正文查看原文
07

The Decoder

谷歌和OpenAI打击中国关联AI滥用

·#cybersecurity

谷歌和OpenAI打击中国关联AI滥用

谷歌于6月12日向纽约南区联邦法院提起诉讼,称这是其首次与FBI联合针对一个名为“Outsider Enterprise”的中国网络犯罪团伙采取法律行动。与此同时,OpenAI表示已封禁两个与中国有关的 ChatGPT 集群,这些集群被用于隐蔽影响行动和政治信息传播。

这一事件表明,主要 AI 公司正将 AI 驱动的诈骗和影响行动视为直接安全威胁,而不仅仅是政策问题。它也说明平台、通信运营商和执法机构之间正在加强协作,以更大规模地打击诈骗基础设施。

谷歌和 OpenAI 在相隔几天内分别采取行动,针对据称与中国有关、利用 AI 进行诈骗和影响行动的网络。6 月 12 日,谷歌在纽约南区联邦法院对一个名为“Outsider Enterprise”的网络犯罪团伙提起诉讼。谷歌表示,该团伙滥用 Gemini AI 系统,针对数十万美国人实施金融诈骗。根据诉状,被告制作了 131 套软件工具包,可以批量生成冒充 Google、YouTube、美国邮政服务以及纽约 E-ZPass 收费系统等机构的假网站。谷歌称,在 5 月的两周内,该网络向 Android 用户发送了 250 万条消息,导向 9000 个假网站和超过 100 万个欺诈性网址,整个行动通过 Telegram 协调。谷歌总法律顾问 Halimah DeLaine Prado 表示,这是公司首次与 FBI 以及 AT&T、T-Mobile、Verizon 等电信运营商联合采取法律行动。谷歌正寻求法院下达限制令,以便公司和执法部门可以共同关闭该网络,例如查封域名或冻结账户。

谷歌表示,具体损失无法精确确定,但规模可能达到数百万美元。与此同时,OpenAI 发布了 2026 年 6 月威胁报告,并称其封禁了两个据称位于中国的 ChatGPT 集群。OpenAI 表示,这些集群试图通过生成英文评论、漫画和编辑图片,影响美国关于 AI 数据中心、关税以及其他技术政策的讨论,内容通常通过看起来不真实的 X 账号传播。一个集群名为“Data Center Bandwagon”,主要宣传 AI 数据中心扩张正在推高普通家庭电价;另一个名为“Tech and Tariffs”,则攻击特朗普的关税政策和美国的技术优势战略。OpenAI 还说,其中一个集群曾试图抹黑 OpenAI 本身,散布 ChatGPT 用户数据被泄露的虚假说法,并向模型询问如何构建一个 AI 监控系统。OpenAI 调查负责人 Ben Nimmo 表示,这些行动并没有制造新的争议,而是借用既有讨论,试图从中国的角度加以引导。OpenAI 说,这两个集群在其 Breakout Scale 上都只有 1 级,说明它们并没有在自身账号之外实现有意义的扩散。

谷歌称,该网络制作了 131 套软件工具包,可批量生成冒充 Google、YouTube、邮政服务以及纽约 E-ZPass 收费系统的假网站。谷歌还说,在 5 月的两周内,该网络向 Android 用户发送了 250 万条消息,导向 9000 个假网站和超过 100 万个欺诈性网址;OpenAI 则表示其封禁的两个集群在 Breakout Scale 上都仅为 1 级,说明它们并未大范围扩散到自身账号之外。

查看单篇正文查看原文
08

The Decoder

Anthropic的平台策略正像微软旧套路

·#ai-industry

Anthropic的平台策略正像微软旧套路

文章称,Anthropic 近期悄悄限制了 Claude Fable 5 在用于训练竞争性 AI 系统时的表现,并在外界反弹后部分让步,表示当提供较弱模型时会通知客户。文章还指出,Anthropic 将 Claude Design 和 Claude Code 等产品扩展到与合作伙伴和客户直接竞争的领域。

如果属实,这反映出 AI 平台格局的一个重大变化:模型提供商不再只是基础设施供应商,而是开始与其生态上的开发者直接竞争。这会给依赖 Anthropic 模型、同时又要面对其自家应用竞争的客户带来反垄断和信任方面的担忧。

文章认为,Anthropic 正在开始表现出与微软和谷歌当年类似的平台策略。文中称,Anthropic 悄悄降低了 Claude Fable 5 在用于训练竞争性 AI 模型时的表现,并且在舆论反弹后只是部分回撤,表示当客户收到较弱模型时会得到通知。报道指出,官方理由是阻止外国对手或竞争实验室利用 Anthropic 的模型提升自身技术。可是,开发者担心这种限制会扩展到普通的 AI 应用功能,并被用来把最强能力留给 Anthropic 自己的产品。文章把这一动作放在更大的关系变化中来看待:合作伙伴可能迅速变成竞争对手。

文中称,Anthropic 曾在推出 Claude Design 之前邀请 Figma 和 Canva 等公司作为合作伙伴,但随后把产品功能扩展到足以直接与这些公司竞争,最终导致 Figma 退出合作。文章还说,更早推出的 Claude Code 已经对 Cursor 等客户构成威胁,并且后来在收入上超过了 Cursor 和 Microsoft 的 GitHub Copilot。文中引用的创业者和投资人担心,如果模型赛道最终只剩一家赢家,这家公司就可能压制自己的客户。文章最后将 Anthropic 的做法与微软、谷歌曾因平台自我优待而引发反垄断诉讼的历史联系起来。

文中将这种限制描述为为了防止外国对手或竞争实验室利用 Anthropic 的模型改进自己的系统,但开发者担心连基础的 AI 应用功能也可能被限制。文章还提到,Anthropic 的年化收入据称飙升至接近 500 亿美元,这加剧了人们对其越来越像是在与曾帮助其壮大的客户竞争的担忧。

查看单篇正文查看原文
09

The Decoder

OpenAI 收购 Ona 强化 Codex 自主工作空间

·#openai

OpenAI 收购 Ona 强化 Codex 自主工作空间

OpenAI 正在收购原名为 Gitpod 的初创公司 Ona,为 Codex 增加安全、持久的云端工作空间。这样一来,Codex 就能在用户合上笔记本电脑后,仍继续执行长达数小时甚至数天的编码任务。

这让 Codex 更接近真正的自主编程代理,可能改变团队分配开发任务和处理长时间软件工作的方式。它也加强了 OpenAI 与 Anthropic 的竞争,因为 Claude Code 被认为是这一领域当前的领先者。

OpenAI 正在收购此前名为 Gitpod 的初创公司 Ona,以增强其 Codex 产品的持久云端工作环境能力。Ona 成立于 2020 年,位于德国基尔,专注于 AI 代理和用于软件开发的安全云端开发环境。OpenAI 表示,Codex 目前每周使用人数已超过 500 万,较年初增长了 400%。整合完成后,Codex 预计可以持续运行长达数小时甚至数天的任务,即使用户合上笔记本电脑也不会中断。相关代理将运行在每个客户自己的云环境中,而 OpenAI 负责提供模型和编排层。

Ona 首席执行官 Johannes Landgraf 表示,代理不仅需要“智能”,还需要一个“可信赖的工作场所”。这笔收购仍然需要通过监管审批。该举措显然是为了更直接地对抗 Anthropic,因为其 Claude Code 被认为是长时间编程任务领域的领先产品。文章还提到,OpenAI 今年 3 月通过收购 Astral,将 Python 工具 uv 和 Ruff 纳入了 Codex 生态。

Ona 成立于 2020 年,地点在德国基尔,主要专注于 AI 代理和安全的云端开发环境。OpenAI 表示,Codex 现在每周用户已超过 500 万,较年初增长 400%,但这笔收购仍需获得监管批准。

查看单篇正文查看原文
10

The Verge AI

SpaceX 巨额 IPO 上市

·#spacex

SpaceX 巨额 IPO 上市

SpaceX 的 IPO 于周五正式启动,公众首次可以购买这家被文章描述为“火箭、AI 和社交媒体”合并后的公司股份。此次上市还被称为让埃隆·马斯克的账面财富足以使他成为全球首位万亿富翁。

SpaceX 变成上市公司后,航空航天、AI 基础设施以及马斯克的整体商业版图都会面临新的定价和监管环境,因为投资者 теперь 可以直接为公司未来估值,而不再只是把它当作一家私人资产。此举也凸显了下一代算力基础设施可能有多么投机性,尤其是如果“把 AI 数据中心送入太空”真的成为 SpaceX 长期叙事的一部分。

SpaceX 的 IPO 于周五启动,这意味着公众第一次可以买到这家公司股票,文章将其描述为一家“火箭、AI 和社交媒体”合并后的公司。报道称,这次发行筹集了足够资金,使埃隆·马斯克在账面上成为全球首位万亿富翁。文章还指出,马斯克的财富已经超过爱尔兰、瑞典以及他的祖国南非等国家的经济规模,并引用 CNN 和国际货币基金组织作为背景说明。整篇报道不断把这次 IPO 与 SpaceX 未来可能把 AI 数据中心送入太空的设想联系起来。

文中还提供了一系列实时更新和相关评论,说明这次上市正在引发高度关注。相关条目包括股价以每股 150 美元开盘、马斯克成为万亿富翁,以及“马斯克本人就是风险因素”等说法。报道还提到 SpaceX 获得了一份价值 40 亿美元的合同,用于建造导弹追踪“Golden Dome”卫星,显示公司业务已不再局限于发射服务。总体来看,这篇报道把 IPO 描绘成一次金融里程碑,也是一场围绕马斯克主导的更大技术版图的押注。

报道把这次 IPO 的叙事与 SpaceX 推动“把 AI 数据中心发射到太空”联系起来,并将其描述为公司未来承诺的核心部分。文章还强调了马斯克财富与各国经济体规模的对比,凸显出这次隐含估值已经大到什么程度。

查看单篇正文查看原文
11

Ars Technica AI

Pokémon Go 数据助力地理空间 AI

·#geospatial-ai

Pokémon Go 数据助力地理空间 AI

Niantic Spatial 于 2025 年 5 月从 Niantic 分拆出来,一直在使用 Pokémon Go 玩家和 Scaniverse 用户拍摄的数十亿张现实世界图像来训练一个“大型地理空间模型”。这个系统现在被定位用于配送机器人,并且也可能与军用无人机导航相关。

这说明消费级 AR 游戏数据可以被重新利用为自主导航基础设施,把普通玩家的日常行为变成一种战略数据资产。它也带来隐私和“双重用途”担忧,因为同样的地理空间 AI 既能帮助机器人在城市中移动,也可能服务于军事系统。

在《Pokémon Go》成为全球现象十年后,这款游戏玩家生成的数据被用于一个完全不同的方向。文章称,Niantic Spatial 正在利用数十亿张现实世界图像训练地理空间 AI,来源是数百万用户拍摄的内容,目标是提升配送机器人导航能力,并且可能也会用于军用无人机。Niantic Spatial 于 2025 年 5 月从原来的 Niantic 分拆出来,随后 Niantic 又将包括《Pokémon Go》在内的授权游戏出售给了由沙特支持的发行商 Scopely。报道指出,在出售之前,Niantic 就公开表示会使用 Pokémon Go 玩家和 Scaniverse 应用的扫描数据来构建“large geospatial model”,也就是一种由带地理位置标记的用户图像训练出来的三维物理世界模型。

Niantic Spatial 发言人表示,地面扫描只是训练现实世界基础模型的一个组成部分,而模型本身并不是扫描数据的副本,也不能直接访问底层扫描内容。文章还提到,分拆后该模型训练使用了 300 亿张图像,其中很多集中在城市地点,这些地点正是游戏玩家被鼓励前往的区域。由于同一地点会在不同角度、不同光照和天气条件下被反复拍摄,这些数据对训练非常有价值,而且图像还包含手机位置和朝向等元数据。Niantic 方面强调,这一扫描功能是可选的,用户只是为公共兴趣点录制短视频,并称公司自 2019 年起就在隐私政策和公开公告中说明这些扫描会帮助改进技术平台。

据报道引用的 MIT Technology Review 说法,Niantic Spatial 用 300 亿张图像训练了该模型,其中许多集中在城市区域,并且来自不同角度、不同光照和天气条件下的拍摄。图像还包含手机位置和朝向等元数据;Niantic 表示这些扫描是可选的、针对公共兴趣点的视频,并称自 2019 年以来一直在隐私政策和公开公告中保持透明。

查看单篇正文查看原文
12

TechCrunch AI

Mistral 传拟以 200 亿欧元估值融资 30 亿欧元

·#mistral

Mistral 传拟以 200 亿欧元估值融资 30 亿欧元

彭博社报道称,法国 AI 初创公司 Mistral AI 正在初步洽谈融资约 30 亿欧元,估值约为 200 亿欧元。若交易达成,这将接近其去年 9 月 C 轮融资后 117 亿欧元估值的两倍。

如此规模的融资将是欧洲最重大的 AI 融资事件之一,也表明投资者仍然把 Mistral 视为有竞争力的前沿模型玩家。它还凸显了在 OpenAI 和 Anthropic 等美国实验室主导的市场中,欧洲本土“主权”替代方案的战略价值。

据彭博社援引匿名消息人士报道,法国 AI 实验室 Mistral AI 正在初步洽谈融资约 30 亿欧元。若交易完成,公司估值将达到约 200 亿欧元,约合 231.5 亿美元。这个数字几乎是其去年 9 月 C 轮融资时 117 亿欧元估值的两倍。Mistral 成立于 2023 年,目标是把前沿 AI 交到每个人手中。与美国竞争对手相比,它采取了更开放的模型开发方式,发布了一些开放权重的基础大语言模型。开放权重意味着用户可以查看并定制模型参数,因此更适合希望获得更大控制权的开发者和机构。

与此同时,Mistral 也提供面向编程、语音克隆、生成和 OCR 等场景的闭源模型。随着欧洲国家减少对美国科技的依赖,Mistral 正将自己定位为更友好、更“主权化”的欧洲本土替代方案。公司正在巴黎附近建设数据中心,并已与法国军队、卢森堡政府以及多家欧洲大型企业建立合作。尽管发展迅速,Mistral 迄今累计融资约 40 亿美元,远低于 OpenAI 和 Anthropic 等美国竞争对手。报道指出,美国实验室在收入、模型采用率和企业需求方面仍然领先明显。Mistral 尚未立即回应置评请求。

Mistral 成立于 2023 年,主张把前沿 AI 交到每个人手中,既提供开放权重模型,也提供面向编程、语音克隆、生成和 OCR 的闭源模型。报道还称,公司迄今累计融资约 40 亿美元,远少于美国竞争对手,但已与法国军队、卢森堡政府以及多家欧洲大型企业建立合作。

查看单篇正文查看原文
13

TechCrunch AI

Theker融资8500万美元打造可重构工厂机器人

·#ai-robotics

Theker融资8500万美元打造可重构工厂机器人

总部位于巴塞罗那的 AI 机器人初创公司 Theker 完成了由 CRV 领投的 8500 万美元 A 轮融资。公司称这轮融资是欧洲有史以来最大规模的机器人 A 轮融资,并将用于扩展欧洲、美国和亚洲业务。

这轮融资表明,投资者看好的是灵活的工业自动化,而不只是人形机器人或单一任务机器人。如果 Theker 的可重构方案奏效,它可能帮助仓库和工厂在任务多变、传统固定用途机器人难以适应的场景中更快实现自动化。

Theker 的押注是:工厂自动化并不需要等到人形机器人真正普及。与其打造只适合单一任务的机器人,不如制造可以按需重构的机器,让它们适配不同的仓库和制造工作。联合创始人 Carla Gómez Cano 表示,现实中的流程远比“把同一种饼干放进同一个盒子里”复杂得多。Theker 的机器人可以根据任务更换手部、手臂和整体形态,因此比许多专用系统更灵活。公司称其已经在零售和物流场景中落地,例如包裹分拣、服装包装,以及搬运瓶装和罐装物品,但其更大的目标是进入工业制造领域。

Inditex(Zara 的母公司)的早期支持,帮助验证了这一方向。该公司如今完成了由 CRV 领投的 8500 万美元 A 轮融资,三星和 Aglaé Ventures 也参与了投资。Theker 表示,这轮融资是欧洲历史上规模最大的机器人 A 轮融资,而且距离其创纪录的种子轮还不到一年。Gómez Cano 说三星目前还不是客户,但双方已在深入洽谈之中,而 Theker 希望三星能同时成为客户、供应商和投资者。Theker 还表示,公司不想花时间做冗长的试点,而是直接面向运营和物流团队推进合作,因为那里的交易更真实、周期也更短。

Theker 的机器人设计允许根据不同任务更换或调整手部、手臂以及整体形态,例如分拣包裹、包装服装,或搬运瓶子和罐头。公司表示其目标不止于零售,还要进入更重的制造业场景;三星目前正与其进行深入洽谈,可能同时成为客户、供应商和投资者。

查看单篇正文查看原文
14

The Decoder

Mistral 寻求30亿欧元加速欧洲AI扩张

·#mistral-ai

Mistral 寻求30亿欧元加速欧洲AI扩张

据报道,Mistral AI 正在洽谈一轮约30亿欧元的新融资,估值接近200亿欧元。相关谈判仍处于早期阶段,如果投资者需求强劲,估值还有可能继续上升。

这轮融资将为 Mistral 扩建欧洲 AI 基础设施和企业业务提供更多资金,也会强化其作为欧洲代表性竞争者、对抗 OpenAI 和 Anthropic 等美国实验室的地位。它还表明,投资者仍然看好欧洲的大规模 AI 基础设施和具备主权属性的 AI 供应商。

法国 AI 初创公司 Mistral AI 据称正在洽谈一轮约30亿欧元的新融资,目标估值约为200亿欧元。彭博社报道称,这些谈判仍处于早期阶段,如果投资者需求强劲,最终估值可能还会进一步上升。Mistral 在9月的估值为117亿欧元,当时 ASML 成为其最大股东,持股比例为11%。Mistral 将自己定位为 OpenAI 和 Anthropic 等美国 AI 供应商的欧洲替代方案,但其用户规模仍明显落后于这些公司。

该公司最近发布了 Mistral Medium 3.5,并将其描述为把聊天、推理和编程能力整合在一起的旗舰模型。它还把聊天机器人从 Le Chat 更名为 Vibe,体现出向自主工作流转型的方向。除面向消费者的产品外,Mistral 的主要业务布局是为欧洲政府和工业客户提供 AI 基础设施,包括 Airbus 和 BMW。为支撑这一战略,该公司在法国和瑞典运营自有云数据中心,并且最近还为巴黎附近的新数据中心获得了8.3亿美元贷款。

Mistral 在9月的估值为117亿欧元,ASML 以11%的持股成为其最大股东。该公司表示,其重点是面向政府和工业客户的 AI 基础设施,并在法国和瑞典运营自有数据中心,同时还为巴黎附近的新数据中心获得了8.3亿美元贷款。

查看单篇正文查看原文
15

The Verge AI

苹果 Siri 终于变好

·#apple

苹果 Siri 终于变好

《The Vergecast》报道称,苹果发布了新版 Siri,而且在早期测试中表现得确实不错。讨论的重点是,Siri AI 在大多数任务上已经足够可靠,足以影响普通 iPhone 用户,尽管它并不显得特别前沿或炫酷。

Siri 是数亿设备上的默认助手,因此哪怕只是质量上的小幅提升,也可能改变人们日常使用手机的方式。如果苹果能让一个主流助手在没有常见聊天机器人问题的情况下依然可靠,这可能会迫使更广泛的 AI 助手市场把实用性放在比新奇性更重要的位置。

《The Vergecast》表示,苹果这次做了一件令人意外的事:它推出了一个看起来真的“好用”的新版 Siri。多年来,Siri 一直徘徊在“偶尔有点用”和“连简单任务都令人沮丧”之间。主持人认为,最新版本并没有带来革命性的变化,也算不上特别新奇,但它确实已经足够稳定和实用。节目里的核心观点是,单靠“可靠”这一点,就足以让 Siri 重新变成一个有意义的产品。

主持人还强调,这不仅影响 iPhone 用户,也可能影响整个 AI 行业,因为一个可靠的内置助手会重新设定消费级 AI 的预期。节目进一步讨论了苹果对助手的设计理念,指出 Siri 被刻意设计得不那么迎合用户,也不追求过度互动。Craig Federighi 说,苹果希望 Siri 帮助用户把事情做完,并了解世界,而不是扮演伴侣或恋爱对象。虽然这期节目还谈到了社交网络的变化,但 Siri 仍然是其中最重要的 AI 话题。

这期节目认为,Siri AI 并没有特别“前沿”,但它的确够好用,而且苹果的设计取向似乎是刻意为之:它更注重帮助用户完成任务,而不是进行无边界闲聊。Craig Federighi 还在采访中表示,Siri 的设计不会讨好用户,也不会像恋爱对象那样互动,这与以互动时长为目标的聊天机器人形成了对比。

查看单篇正文查看原文
16

Simon Willison

Claude Fable 5 的极度主动性

·#llms

Claude Fable 5 的极度主动性

Simon Willison 表示,在使用 Claude Fable 5 两天后,他觉得这个模型“极度主动”,会为了达成目标不断调用各种策略。他用 Datasette Agent 的一个界面滚动条漏洞举例,说明模型会自主检查依赖、创建测试页面,甚至想办法查看浏览器窗口并截取截图。

这个例子说明,LLM 更像一个代理型工具,而不是被动助手:它可以串联工具、提出假设,并在没有逐步指令的情况下持续排查问题。这对软件调试和 AI 辅助开发很重要,因为更主动的工具使用可能加快定位问题,但也会让模型行为更难预测。

在使用 Claude Fable 5 两天后,Simon Willison 认为,最贴切的描述就是“极度主动”。他指出,这个模型掌握了很多技巧,只要有助于实现目标,几乎什么办法都会用上。为了说明这一点,他举了一个在 Datasette Agent 中调试界面问题的例子:他发现跳转菜单的聊天输入框里出现了不该有的横向滚动条。Willison 截下了这个 bug 的截图,并让 Claude 先查看依赖项,帮助分析为什么会出现滚动条。 他当时怀疑问题可能出在 Datasette Agent 的某个依赖里,也许就是 Datasette 本身,因此预期模型会去检查已安装包或本地源码。

后来他离开电脑几分钟,回来时却发现机器自动打开了浏览器窗口,并跳转到了相关对话界面。接着他看到 Claude 继续做实验,甚至打开了 Safari,并执行了一段 Bash 命令,结合 Python、PyObjC Quartz 和 `screencapture`,先找到 Safari 窗口再抓取 PNG 截图。Willison 解释说,模型实际上是自己拼出了一套截图方法:先枚举系统中的窗口,再筛选出名称里包含类似“textarea”字符串的 Safari 窗口,最后用窗口编号来截图。除此之外,模型还在写临时 HTML 页面,尝试复现这个 bug,然后打开这些页面在 Safari 中进行验证。

Willison 怀疑这个滚动条问题来自某个依赖,可能是 Datasette 本身,所以让 Claude 先检查依赖。之后他观察到模型打开浏览器窗口,并通过 Python、PyObjC Quartz API 和 macOS 的 `screencapture` 命令自定义了一套截图流程,按窗口编号捕获 Safari 窗口图像。

查看单篇正文查看原文
17

TechCrunch AI

IPO 市场回暖,MANGOS 取代 FAANG

·#ipo-market

IPO 市场回暖,MANGOS 取代 FAANG

TechCrunch 的 Equity 播客表示,IPO 市场正在回暖,但带头冲刺的公司已经不再是旧的 FAANG 阵营。节目提出了新的“MANGOS”组合——Meta、Anthropic、Nvidia、Google、OpenAI 和 SpaceX,并将这一时点视为对估值和公众科技公司的考验。

如果这一轮上市潮持续下去,AI 和基础设施公司在公开市场上的估值逻辑可能会被重新定义。它也表明,市场力量正在从消费互联网品牌转向基础 AI、芯片、云和航天相关平台。

TechCrunch 的 Equity 播客在这一期中指出,IPO 市场已经回暖,但市场中心已经发生变化。现在不再是 FAANG,而是新的简称 MANGOS,成员包括 Meta、Anthropic、Nvidia、Google、OpenAI 和 SpaceX。节目提到,这个阵营里大约有一半公司会在相近的时间窗口进入公开市场,这让当前时点对定价和投资者预期格外重要。主持人 Kirsten Korosec、Anthony Ha 和 Sean O’Kane 并不把这仅仅看作“更多 IPO”的消息。

相反,他们把它视为对 2026 年公众科技公司形态的一次更大压力测试。节目还讨论了 Apple 在 WWDC 上的展示方式,以及一笔与某个重大公告处理方式相关的 2.5 亿美元和解金。另一个话题是 Waymo 如何把 Apple 放弃的自动驾驶愿景变成自己的测试场,说明自动驾驶赛道即使经历早期项目失败仍在继续演进。节目最后提到,据称 Google 与 SpaceX 之间每月 9.2 亿美元的算力合作,显示 AI 基础设施已经成为竞争焦点。

节目强调,MANGOS 中有一半公司预计会在同一时间窗口进入公开市场,这使得 2026 年成为投资者以及“公众科技公司”定义的一次压力测试。节目还把这一更大的主题与据称每月 9.2 亿美元的 Google-SpaceX 算力合作联系起来。

查看单篇正文查看原文
18

TechCrunch AI

Avataar推出面向印度的低价高速Varya视频AI

·#ai-video-generation

Avataar推出面向印度的低价高速Varya视频AI

Avataar AI推出了Varya,这是一款针对印度文化语境优化的视频生成模型,主打更快、更便宜的部署。公司表示,Varya是基于阿里巴巴公开可用的Wan 2.2模型经过蒸馏而来,并将以开源权重形式发布到印度的AIKosh门户。

这次发布表明,印度AI生态正在尝试构建既能负担得起、又能理解本地文化的模型,以支持大规模应用。如果成功,它可能让消费者、创作者、企业和公共服务更容易使用视频AI,而成本一直是该市场的主要障碍。

印度的AI模型产出一直落后于美国、欧洲和中国,发布模型的初创公司不多,而且大多数集中在大语言模型或语音模型上。为了推动发展,印度政府推出了India AI Mission,这是一个规模约12亿美元的项目,向入选初创公司提供补贴GPU算力,并要求它们公开发布模型。Avataar AI就是入选的12家公司之一。这家获得Peak XV支持、专注于电商视频工具的公司,如今推出了Varya,一款旨在理解印度本地语境的视频模型,能够识别节日、食物、服装等当地视觉元素。Avataar并不是从零开始训练这个模型,而是以阿里巴巴公开发布的Wan 2.2视频模型为基础,使用模型蒸馏技术把能力压缩成更轻量、适合自身场景的版本。公司表示,这种方法把推理步骤从50步降到了4步,使模型运行速度提升约10倍,成本也低得多。

Avataar称,在Nvidia H200 GPU上,Varya生成一段5秒、720p视频只需45秒,而Wan 2.2需要1,230秒。价格也是Varya最突出的卖点之一:Avataar计划在托管服务中按每秒₹0.48、约合半美分收费,远低于Veo、Kling、Luma和Runway等工具通常每秒$0.10或更高的价格。公司还表示,Varya使用精选数据训练,以减少文化盲区,避免输出过于泛化或刻板化的内容。Varya将作为开源权重模型发布到印度的AIKosh门户,并附带训练数据,开发者可以自行托管或按需修改。Avataar也计划向企业客户提供该模型,并表示愿意与Higgsfield和Adobe Firefly等视频工具开展合作。

Varya只需4步运行,而Wan 2.2需要50步,Avataar称这让它的速度提升约10倍,运行成本也大幅降低。在Nvidia H200 GPU上,它生成一段5秒、720p的视频只需45秒,而Wan 2.2需要1,230秒;Avataar计划在托管服务上按每秒₹0.48(约$0.005)收费。

查看单篇正文查看原文
19

The Decoder

美国人担忧AI导致失业和思维依赖

·#ai-adoption

美国人担忧AI导致失业和思维依赖

Anthropic发布了其代表性公众调查系列Anthropic Public Record的首批结果,样本来自5.1993万名16岁及以上的美国人,覆盖50个州、华盛顿特区和波多黎各。调查显示,64%的人担心AI会让自己失业,56%的人担心会因依赖AI而失去独立思考能力。

这项调查提供了美国公众看待AI的大规模样本,显示就业和人的自主思考能力已成为舆论焦点。对于AI在职场中的推广而言,这些态度很重要,因为人们是否接受,明显取决于是否有亲身使用经验。

Anthropic发布了其名为Anthropic Public Record的首批调查结果,这是一项面向普通公众的代表性调查,而不是只面向Claude用户。该在线调查由YouGov在2025年11月至12月间进行,覆盖美国50个州、华盛顿特区和波多黎各的51,993名16岁及以上居民。Anthropic表示,这是其第一次专门针对公众而非产品用户开展的调查。关于AI最受期待的用途,48%的受访者选择了治愈癌症、阿尔茨海默病等严重疾病,这一选项遥遥领先。其次是帮助残障人士,占36%;推动技术进步和让日常生活更轻松并列第三,各占23%。最不受欢迎的愿景是把AI用作心理治疗师或“治愈孤独”的工具。担忧方面,就业损失是最突出的焦虑:64%的人担心AI会让自己失去工作,而且这种担忧在教育程度较高的人群中更强,在每个州都排第一。

第二大担忧是“认知依赖”,也就是失去独立思考能力,占56%,第三是错误信息,占52%。Anthropic指出,只有15%的人信任AI公司会在技术研发和部署上做出正确决定,并认为公众更担心的是人类对AI的滥用,而不是AI本身“失控”。公司还表示,关于认知依赖的担忧往往更偏理论化,因为在担心它的人中,只有约五分之一认为如果明天AI消失,自己会真的难以应对。相反,在并不担心这一问题的人中,大约三分之一表示如果没有AI会感到明显不适。对于具体工作任务,约75%的人认为AI至少和人类一样擅长研究,但多数人仍然不希望AI介入自己的工作,即使是在研究和数据分析这类他们认为AI能力较强的任务上。Anthropic还发现,工作中每天使用AI的人对失业的担忧明显低于完全不用AI的人,这说明亲身接触AI可能会降低公众的恐惧。

让AI帮助治愈癌症和阿尔茨海默病等严重疾病,是最受期待的用途,占48%;只有15%的人表示信任AI公司会在技术研发和部署上做出正确决定。Anthropic还发现,工作中每天使用AI的人比从不使用AI的人更不担心失业,说明实际接触可能会缓解焦虑。

查看单篇正文查看原文
20

The Decoder

Claude Fable 5 登顶基准但价格翻倍

·#ai-models

Claude Fable 5 登顶基准但价格翻倍

Anthropic 的 Claude Fable 5 以 64.9 分登上 Artificial Analysis Intelligence Index 第一名,超过了包括 GPT-5.5 在内的竞争对手。相比 Opus 4.8,它的整体性能提升只有 5.7%,但 token 价格却大约翻了一倍。

这说明基准榜首并不一定意味着更高的成本效率,这对大规模付费的企业用户尤其重要。它也表明,在评估前沿大模型时,定价、安全路由和基准构成正在变得和原始能力同样重要。

Anthropic 的 Claude Fable 5 被视为公司的新旗舰模型,并以 64.9 分登上 Artificial Analysis Intelligence Index 第一名。这个成绩让它比最强的非 Anthropic 模型 GPT-5.5 领先约 5 分,也让 Anthropic 占据了排行榜前两名。该模型在多个单项基准上也刷新了纪录,尤其是在组成该指数的 10 项测试中拿下了 5 项新高。文中提到的项目包括用于知识和幻觉评估的 AA-Omniscience、面向真实知识工作的 GDPval-AA、用于代理式编码的 Terminal-Bench Hard、工具使用测试 Tau2-bench Telecom,以及 Humanity's Last Exam。

AA-Omniscience 上它拿到 40 分,比此前领先的 Gemini 3.1 Pro Preview 高 7 分,但文章指出,这一领先主要来自更高准确率,而不是更低的幻觉率。Humanity's Last Exam 上,它得分 53%,比 Opus 4.8 高出 7 分多。尽管这些结果看起来亮眼,整体提升并没有那么大:Artificial Analysis 认为它相对 Opus 4.8 的总性能增幅只有 5.7%。更关键的是成本,token 价格翻倍后,一次完整基准跑分的费用接近 10,000 美元,大约是 Opus 4.8 的两倍。

Claude Fable 5 在 Intelligence Index 的 10 项基准中有 5 项创下新高,包括 AA-Omniscience、GDPval-AA、Terminal-Bench Hard、Tau2-bench Telecom 和 Humanity's Last Exam。Anthropic 表示,该模型与 Claude Mythos 5 使用相同的基础模型,但针对网络安全、生物、化学和模型蒸馏的安全过滤器会触发回退到 Opus 4.8,这会进一步抬高成本。

查看单篇正文查看原文
21

The Verge AI

马斯克成全球首位万亿富豪

·#elon-musk

马斯克成全球首位万亿富豪

据报道,随着 SpaceX 的 IPO 推高其持股估值,埃隆·马斯克的净资产首次突破 1 万亿美元。报道还称,他的财富包括 48 亿股 SpaceX 股份,以及来自 Tesla 等其他业务的资产。

如果这一消息属实,这将是一个历史性的财富里程碑,说明私募市场估值和上市可以迅速重估创始人的个人财富。它也凸显了 SpaceX 向 AI 和太空基础设施扩张,如何与历史上最大的个人财富之一联系在一起。

据报道,随着 SpaceX 的 IPO 推高其持股价值,埃隆·马斯克的净资产已经突破万亿美元大关。IPO 之前,他的净资产据称大约徘徊在 8000 亿美元左右。这个数字包含他持有的 48 亿股 SpaceX 股票,也包括他在 Tesla 及其他公司的财富。报道指出,SpaceX 股价开盘价为 150 美元,并一直高于 138 美元这一让马斯克跨入 13 位数净资产的关键水平。

SpaceX 今年早些时候把马斯克旗下的火箭、AI 和社交媒体平台整合在一起,并在 S-1 文件中把公司的长期使命描述为建设让生命走向多行星所需的系统与技术。公司还表示,这种组合有望通过可重复使用火箭把 AI 数据中心服务器送入轨道,从而实现“轨道 AI 算力”。报道还称,按账面财富计算,马斯克几乎相当于全球接下来四位最富有者的财富总和,而这四人的总财富刚刚超过 1 万亿美元。文章最后提到,马斯克达到这一里程碑,比约翰·D·洛克菲勒在 1916 年成为全球首位十亿美元富豪晚了 110 年。

报道称,SpaceX 股份开盘价为 150 美元,并持续高于 138 美元这一使马斯克达到 13 位数净资产的关键价位。公司的 S-1 将使命描述为让生命走向多行星,并称这种组合有望通过可重复使用火箭把 AI 数据中心服务器送入太空,从而实现“轨道 AI 算力”。

查看单篇正文查看原文
22

ZDNET AI

Claude Fable 5隐藏限流引发争议

·#ai-safety

Claude Fable 5隐藏限流引发争议

ZDNET 报道称,Anthropic 的 Fable 5 会在某些网络安全和前沿 AI 研究提示上悄悄降级到 Opus 级别输出,但界面并没有清楚告知用户。争议随后爆发,因为研究人员以为自己在测试 Fable 5,实际得到的却是更弱的模型结果。

这一事件凸显了 AI 安全工具中的信任问题:本用于防止滥用的护栏,也可能让研究人员看不清自己到底在测试什么。这对安全团队和 AI 治理都很重要,因为静默模型切换会扭曲评估结果、拖慢防御研究,并使责任界定更复杂。

ZDNET 将 Fable 5 争议描述为透明度问题,而不是纯粹的能力问题。Anthropic 的 Project Glasswing 于 4 月推出,这是一个与多家大型科技组织合作的项目,目标是帮助发现并修复关键互联网基础设施中的漏洞,而底层的 Mythos 模型则被限制使用,因为漏洞发现既可能帮助防御者,也可能帮助攻击者。随后 Anthropic 发布了 Fable,本质上是受限版的 Mythos,并明确禁止某些网络安全、生物和化学领域的高风险用途。对于生物武器这类明显危险的请求,模型会明显从 Fable 降级到 Opus,并告知用户发生了降级。问题出在另一类研究上:据报道,在先进芯片设计和前沿大语言模型等领域,Fable 也会降级,但用户在界面中不会被告知。

ZDNET 指出,这一点只埋在一份 319 页的 Fable 和 Mythos 系统卡里,因此很多用户并不会意识到自己其实没有在测试 Fable。此事引发了广泛反弹,Fortune 和 Wired 都将这种静默降级形容为对 AI 研究人员的“破坏”。文中引用的安全专家提醒说,关于 jailbreak 抵抗能力的说法应当谨慎看待,因为任何一次性的安全评估都会随着攻击者不断适应而迅速过时。SANS Institute 的 Rob T. Lee 认为,同样能阻止恶意使用的控制,也会阻止合法的防御研究,从而限制防御者构建下一代工具的能力。

Anthropic 之前已经说明,Fable 会拒绝网络安全、生物和化学领域的某些高风险研究,并且对于生物武器等明显有害请求,会明确降级到 Opus。争议集中在其他研究领域,例如先进芯片设计和前沿大语言模型,在这些情况下据称不会向用户显示降级,只是在一份 319 页的系统卡中提到。

查看单篇正文查看原文
23

ZDNET AI

企业若缺乏治理可能放弃AI代理

·#ai-agents

企业若缺乏治理可能放弃AI代理

ZDNET报道,Gartner预计到2027年,40%的企业将降级或弃用自主AI代理,因为治理缺口往往要等到生产事故发生后才会暴露。文章还总结了Snowflake Summit上三位企业负责人的部署经验:使用框架、借助专家、以及让数据变现。

AI代理正在从演示走向真实企业流程,而文章强调,治理、评估和明确的业务结果,已经成为决定能否落地的关键。对于构建代理式AI的团队来说,这意味着投资回报不仅取决于模型能力,也取决于控制机制和数据质量。

ZDNET指出,企业对AI代理的热情正在与更现实的问题碰撞:许多部署还没有足够的治理能力,难以真正进入生产环境。文章引用Gartner近期的预测称,到2027年,40%的企业会降级或弃用自主AI代理,因为治理缺口往往要等到生产事故发生后才会被发现。在旧金山举行的 Snowflake Summit 上,三位数字化负责人分享了他们把代理推进生产的做法。文章把这些经验总结为三条:建立框架、依靠专家分析、并让AI工作与可衡量的业务价值挂钩。Whoop的Matt Luizzi表示,公司最初只在一个小型分析团队中测试 Snowflake CoCo,让这些人员快速判断查询结果是否正确,随后再通过更正式的评估框架扩大使用范围。

他说,上下文最终被证明非常关键,因此公司更重视语义层和可重复流程,以便让代理工作负载更容易扩展。Luizzi还提到,公司使用 CoCo 来帮助执行A/B测试、分析结果、提出下一步功能并快速迭代,从而同时提升业务价值和客户价值。Fanatics的Madeleine Want表示,他们发现底层数据越好、治理越完善,LLM就越能有效提炼意义并回答问题。文章把这些案例视为给企业的实操建议,目标是帮助AI代理成功落地,而不是成为又一次失败尝试。

Whoop表示,他们先让分析团队做非正式检查,随后再建立更正式的评估框架,以便扩大 Snowflake CoCo 代理的使用范围;Fanatics则表示,更好的底层数据和治理让LLM更容易有效回答问题。文章还提到,集中化数据和结构化语义层帮助这些组织更快理解代理所需的上下文。

查看单篇正文查看原文
24

ZDNET AI

简单调整路由器天线可改善 Wi-Fi

·#wi-fi

简单调整路由器天线可改善 Wi-Fi

ZDNET 报道称,调整路由器天线的角度可以明显改善 Wi-Fi 表现,尤其是在多层住宅中。文章指出,将天线大约调到 30 度,并把路由器放在居中位置,有助于增强楼层之间的覆盖。

这是一个成本很低、可以立刻尝试的调整,很多家庭在更换新设备或改用 mesh 网络前都能先试一试。对于存在信号死角、覆盖不均或多层住宅信号分布不佳的用户来说,这一点尤其有价值。

ZDNET 的文章认为,即使在今天,路由器天线的摆放方式仍然很重要。作者先用老式显像管电视需要不断调整“兔耳朵”天线来类比,说明很多人以为 Wi-Fi 只要连上就行,但实际上并不是如此。文章指出,单纯把路由器插上电、随便放在家里某个地方,往往不足以获得稳定的覆盖。作者强调,需要结合房屋结构、周围障碍物以及天线朝向来判断最佳摆法。对于公寓或单层住宅,TP-Link 建议让所有天线保持垂直,这样信号可以更均匀地向平面空间扩散。

对于两层住宅,文章提到把天线调到大约 30 度,可能有助于改善楼层之间的覆盖。对于更大或更开放的空间,Optimum 建议天线角度大约为 45 度;而在更复杂的住宅环境中,甚至可以尝试把路由器横放,并让不同天线朝向不同方向,以尽量分散信号。作者还建议使用路由器配套应用实时查看 dBm 信号强度,并指出大约 -33 dBm 属于非常好的信号,数值越接近 0,连接越强。如果不想折腾天线,文章也提到可以考虑 mesh 系统来扩展覆盖,不过成本更高。最后,文章建议把路由器放在居中且略微抬高的位置,并避开壁橱、大型家具、金属物体和地板,以减少对信号的干扰。

文章指出,最佳天线摆放方式取决于住宅布局:公寓或单层住宅适合让天线保持垂直,而两层住宅则建议大约 30 度。文章还强调可以用路由器配套应用查看 dBm 信号强度,数值越接近 0 表示连接越强。

查看单篇正文查看原文
25

ZDNET AI

把AI代理当作需要严管的实习生

·#ai-agents

把AI代理当作需要严管的实习生

ZDNET 报道了在 Snowflake Summit 上的一场讨论,安全和 AI 领域的嘉宾认为,AI 代理应该像热情但容易跑偏的实习生一样被管理。讨论重点是为代理设置严格权限、明确目标,并在人类监督下让它们访问应用和数据。

随着企业把 AI 从聊天机器人推进到可以直接执行操作的代理,风险已经从“回答错误”扩大到“做错事”,包括数据泄露和未经授权的变更。文章反映出更广泛的治理趋势:企业希望获得自主性的生产力收益,但又不能失去对安全、合规和责任归属的控制。

ZDNET 指出,AI 代理正在从简单的聊天机器人演变为能够直接操作应用和企业数据的“数字员工”。在旧金山举行的 Snowflake Summit 相关讨论中,来自 AI 安全公司的专家认为,这类代理应该像热情但容易犯错的实习生一样被管理。嘉宾们的核心观点是:在真正把代理交给重要工作之前,必须给它明确指令、持续监督,并设计好严格的边界。Resolve AI 的创始人兼 CTO Mayank Agarwal 表示,管理者必须非常谨慎地决定代理拥有哪些权限,并为它能做的事情设置“铁一般的约束”。1Password 的 CTO Nancy Wang 也强调,不仅要知道代理被设计来做什么,还要弄清它是在谁的授权下行动,以及它接触到的数据会被如何处理。

讨论还指出,代理式系统与过去的软件模式不同;以前工程师通常能精确预测 API 之间如何调用、按什么顺序执行。如今,代理会为了完成目标临时选择工具和路径,这带来了新的安全问题,比如数据外泄或把信息写到不该去的地方。Tenable 的 Jason Merrick 提醒说,组织很容易看不清幕后到底发生了什么,尤其是在多个代理实例、API 数据源、源代码和聊天工具相互连接时。文章最后强调,企业需要在“过度限制”和“过度放权”之间找到平衡,既不能把代理完全锁死,也不能让它们失去治理。

嘉宾强调,代理的权限必须被严格限制,因为它可能以不可预测的方式串联工具,从一个地方读取数据,再把数据写到不该去的地方。讨论还警告了“影子 AI”和身份模糊问题:有时很难判断一次操作究竟是人、服务账户还是拥有类似人类权限的代理执行的。

查看单篇正文查看原文