推理芯片与算力架构成为新战场
OpenAI/博通、IBM 和 Databricks 前高管系创业公司都在押注更高能效的硬件路径,说明AI竞争已从模型参数扩展到算力底层与功耗约束。[2747, 2749, 2751]
AI 日报
今天的报道集中在两个相互强化的方向:一边是AI基础设施继续加码,从定制芯片、超大规模数据中心到更高效的推理架构;另一边是AI系统开始更深入地进入工作流、内容治理和安全边界。与此同时,模型提取争议、人才争夺和产品路线分化显示,前沿AI竞争已不只是比模型能力,更是在比基础设施、组织能力和监管承受力。
Overview
从 64 条资讯中筛选出 24 条
今天的报道集中在两个相互强化的方向:一边是AI基础设施继续加码,从定制芯片、超大规模数据中心到更高效的推理架构;另一边是AI系统开始更深入地进入工作流、内容治理和安全边界。与此同时,模型提取争议、人才争夺和产品路线分化显示,前沿AI竞争已不只是比模型能力,更是在比基础设施、组织能力和监管承受力。
OpenAI/博通、IBM 和 Databricks 前高管系创业公司都在押注更高能效的硬件路径,说明AI竞争已从模型参数扩展到算力底层与功耗约束。[2747, 2749, 2751]
Google 将 Computer Use 直接集成到 Gemini Flash,OpenAI 强调智能体重塑工作,Patronus 与 General Intuition 则分别从评估和训练数据切入,围绕“能否可靠执行任务”展开商业化。[2754, 2756, 2750, 2758]
亚马逊追加 130 亿美元押注印度,Netris 也在为新云自动化融资,显示算力供应链和数据中心上线速度仍是产业扩张的关键瓶颈。[2753, 2759]
Anthropic 对阿里巴巴的指控、Meta 的审核自动化争议以及 AI 检测器的误报问题,共同说明前沿 AI 已进入“能力扩张与治理成本并行上升”的阶段。[2746, 2762, 2768]
Adobe 收购 Topaz Labs、Claude 在消费市场加速追赶,而 Grok 被指转向成人内容,反映出各家在功能整合、订阅增长和内容边界上的路线分化。[2752, 2757, 2767]
谷歌持续流失顶尖研究员、高通被传进入数据中心处理器市场、欧洲反对美国芯片限制,都表明AI竞争不只在实验室,也在人才流动和半导体地缘政治上展开。[2763, 2769, 2760]
AI产业正在从“模型竞争”转向“系统竞争”。芯片、数据中心、代理工作流、评估体系和内容治理同时成为核心战场,而这也让成本、能效、安全与合规问题被推到台前。
Anthropic 指控与阿里巴巴有关联的操作者大规模提取 Claude 能力,令模型盗取、API 滥用和跨境竞争问题再度升温。[2746] 同时,欧洲正在反对美国进一步收紧芯片设备出口的提案,显示半导体管制正在从技术问题演变为地缘政治与产业利益的正面冲突。[2760]
Adobe 收购 Topaz Labs,继续加厚创意 AI 生态;Claude 在消费级付费市场继续追赶 ChatGPT;Hang Ten Systems 则试图用 AI 重塑 IT 服务交付方式。[2752, 2757, 2761] 这些消息共同说明,AI 商业化正在从“卖模型”扩展到“卖工作流、卖工具链、卖行业服务”。
Meta 正在推进内容审核自动化,但员工担心节奏过快;AI 检测器对人类写作的误判也再次暴露工具边界。[2762, 2768] 另一方面,Grok 被指更深地滑向成人内容,模型政治倾向测试显示多数主流聊天机器人仍偏左,这两则报道都在提醒:AI 产品的“默认价值观”和“默认边界”正成为竞争的一部分。[2767, 2766]
机器人、汽车与企业软件都在重新校准 AI 的角色:中国押注人形机器人以应对劳动力下滑,福特则因过度自动化而重新召回资深工程师修正问题;高通也被指将进入数据中心处理器市场。[2755, 2770, 2769]
Stories
Ars Technica AI

OpenAI与博通宣布推出Jalapeño,这是一款从零开始打造、专为数据中心大语言模型推理设计的定制ASIC。双方表示,这只是一个长期芯片项目的第一代产品,而且博通称该芯片的设计和生产只用了九个月。
如果这款芯片的表现符合预期,它可能降低大规模提供大语言模型服务的成本和功耗,而这正是AI基础设施提供商最关心的问题之一。这也表明领先的AI公司正越来越多地从现成GPU转向为自身模型路线图量身定制的专用芯片。
OpenAI与博通宣布推出Jalapeño,这是一款专门为数据中心中的大语言模型推理设计的新芯片。OpenAI最为人熟知的产品是ChatGPT和Codex,而博通则是成熟的芯片供应商。双方表示,这款芯片计划部署在大型数据中心中,而且只是一个更长期项目的第一代产品。博通将Jalapeño描述为一款从零开始设计的ASIC,而不是对通用加速器进行改造。博通称,这项设计来自与OpenAI研究人员的深入交流,并参考了OpenAI未来模型和产品路线图。
双方表示,这款芯片从设计到生产只用了九个月。OpenAI表示,其目标是让推理系统比当前数据中心常见的硬件更贴合LLM的实际需求。OpenAI还称,早期测试显示Jalapeño的每瓦性能将显著优于当前最先进系统,但测试仍在继续。OpenAI表示,未来几个月将发布一份详细的技术报告。
博通表示,Jalapeño的设计来源于与OpenAI研究人员的深入交流,以及OpenAI未来模型和产品路线图的指导。OpenAI称,早期测试显示其每瓦性能明显优于当前最先进水平,但它还没有完成全部测量,并计划在未来几个月发布详细技术报告。
Ars Technica AI

Anthropic 表示,它掌握了新的机密证据,称与阿里巴巴有关联的操作者发起了其迄今测得规模最大的非法提取 Claude 能力的行动。Anthropic 说,这一活动发生在 4 月 22 日至 6 月 5 日之间,涉及近 25,000 个欺诈账户、超过 2,880 万次交互。
如果属实,这将成为针对前沿 AI 系统的一次重大模型提取案例,对 AI 安全、知识产权以及中美实验室之间的竞争都具有影响。它也会提高外界对 API 滥用、代理网络使用以及跨境 AI 能力转移的政策审查力度。
Anthropic 指控阿里巴巴发起了其所称“迄今最大的” Claude 能力克隆尝试。该指控出自一封 6 月 10 日致参议员 Tim Scott 和 Elizabeth Warren 的信件,而这封信是在参议院“AI and the American Dream”听证会前一天发出的。Anthropic 在信中表示,它掌握了“新的、机密的证据”,证明发生了一场其测得规模最大的非法提取 Claude 能力的行动。Anthropic 说,这次活动发生在 4 月 22 日至 6 月 5 日之间,涉及与 Alibaba 及其 AI 实验室 Alibaba Qwen 有关联的操作者。根据 Anthropic 的说法,这些操作者通过近 25,000 个欺诈账户与 Claude 进行了超过 2,880 万次交互。Anthropic 认为,这种行为违反了 Claude 的服务条款和访问限制,并且重点针对代理式推理、软件工程和长时程任务等最有价值的能力。
Anthropic 还称,相关操作者使用了混淆技术和代理网络来规避检测。Anthropic 将此事描述为更广泛趋势的一部分,即中国 AI 实验室试图在不承担完整训练和研发成本的情况下提取前沿模型能力。它还警告说,这类攻击正在变得普遍,并正在形成一种“规避经济”,可能为未来更多蒸馏攻击提供支持。报道提到,Anthropic 之前已经指控 DeepSeek、Moonshot 和 MiniMax 使用过类似手法,而且 OpenAI 和 Google 也发布过关于类似攻击的研究发现。Anthropic 还强调,这起事件发生在 Donald Trump 采取措施遏制此类非法蒸馏攻击、并保护美国国家安全之后。需要注意的是,本文报道的是 Anthropic 的指控,并非独立核实后的结论。
Anthropic 表示,这次行动重点针对的是代理式推理、软件工程和长时程任务等高价值能力,而且操作者使用了混淆技术和代理网络来规避检测。该指控来自一封在参议院听证会前发给 Tim Scott 和 Elizabeth Warren 的信,Anthropic 还将其与更广泛的“规避经济”联系起来,用于支撑蒸馏攻击。
Ars Technica AI

IBM 表示,它已经开发出其所称的全球首个亚 1 纳米芯片技术,面向 AI 数据中心。该公司称,这项新的 0.7 纳米、也就是 7 埃节点,能够在指甲盖大小的芯片上实现几乎翻倍的晶体管密度。
如果 IBM 的说法成立,这项技术有望为 AI 基础设施带来显著的算力提升和能效改善,而电力消耗正是该领域日益突出的瓶颈。这将影响数据中心、芯片设计者以及希望在不成比例增加用电的情况下获得更高性能的云服务提供商。
IBM 发布了一种新的芯片架构,声称可以在大约指甲盖大小的芯片上集成近 1000 亿个晶体管。按照公司的说法,这比其上一代芯片技术的晶体管密度几乎翻了一倍。IBM 表示,这会带来更高的计算性能和更好的能效,并且特别适用于 AI 数据中心。IBM Research 主管、IBM Fellow Jay Gambetta 在提前媒体简报中表示,这不是“渐进式的一步”,而是“意义重大的跃迁”。他还说,这项技术指向一种未来:计算能力会显著增强,而能耗不会同步大幅上升。
文章同时提醒,所谓“全球首个亚 1 纳米芯片技术”需要谨慎理解。IBM 实际上是在宣称一种 0.7 纳米的工艺节点,也就是它称作 7 埃节点,而不是说芯片的真实物理结构真的小于 1 纳米。报道解释说,现代工艺节点名称早已不再像几十年前那样直接对应实际尺寸。文章还指出,IBM 在这里扮演的是研究和技术开发角色,而不是商业芯片制造商。因此,这更像是一项重要的技术里程碑和路线图信号,而不是面向终端用户的产品发布。
IBM 在介绍中强调,“亚 1 纳米”并不意味着芯片的物理结构真的小于 1 纳米;它指的是工艺节点和一种新的“nanostack”架构。文章还指出,IBM 是一家研究公司,并不直接制造最终进入 AI 数据中心或消费设备的商业芯片。
TechCrunch AI

Patronus AI 宣布完成由 Greenfield Partners 领投的 5000 万美元 B 轮融资,用于构建模拟“数字世界”来测试 AI 智能体。此次融资后,这家位于旧金山的初创公司累计融资达到 7000 万美元。
随着 AI 智能体从回答问题转向自主完成多步骤任务,可靠的评估正成为关键瓶颈。Patronus 试图填补这一空白,帮助前沿 AI 实验室和创业公司判断智能体是否能在真实条件下正确执行任务。
AI 智能体正在变得越来越强大,正从简单问答转向自主完成复杂的多步骤任务。随着这种变化,模型开发者面临一个更难的问题:如何验证智能体在承担真实工作时是否可靠,例如代用户预订行程或做金融分析。Patronus AI 认为,传统基准测试还不够,因为即使智能体在基准上得分很高,也不能证明它能稳定、正确地完成现实中的工作。Patronus 成立于 2023 年,由前 Meta AI 研究员 Anand Kannappan 和 Rebecca Qian 创立,这家公司正在构建模拟数字环境来评估智能体行为。
它会复刻网站和内部系统,让智能体在多种场景下接受测试,其中也包括一些不可预测的情况。Patronus 还表示,这些模拟环境在训练后阶段尤其有用,因为可以通过强化学习对成功完成任务的行为给予奖励,并对错误进行惩罚。公司在周四宣布完成 5000 万美元 B 轮融资,由 Greenfield Partners 领投,Notable Capital、Lightspeed、Datadog 和 Samsung 参投,使累计融资达到 7000 万美元。公司称过去一年的收入增长了 15 倍,而一位投资者表示,来自前沿 AI 实验室和其他初创公司的需求几乎是“难以满足”的。
Patronus 表示,其“数字世界模型”会复刻网站和内部系统,并在训练后通过强化学习对智能体进行压力测试。该公司称目前主要聚焦软件工程和金融等可验证场景,并认为其主要竞争对手是 AI 实验室内部的评估团队,而不是人类数据公司。
TechCrunch AI

Databricks前AI负责人Naveen Rao公布了 Unconventional AI 的首个模型 Un-0,这是一个图像生成系统,用来展示基于振荡器的新型计算架构。该公司称,这种方法最终有望把 AI 推理的功耗降低多达 1,000 倍,目前已经通过对拟议芯片的软件模拟展示了该模型的可用性。
如果这一设想成立,它可能大幅降低大规模运行 AI 的电力和基础设施成本,尤其是需要持续响应用户请求的推理负载。随着 AI 部署扩张并受到供电约束,这将影响云厂商、AI 初创公司和企业用户。
由前 Databricks AI 负责人 Naveen Rao 领导的 Unconventional AI 表示,它正试图从零开始重构计算架构,以让 AI 推理变得高得多的能效。该公司在周四发布了首个模型 Un-0,这是一个图像生成系统,旨在证明其技术可以复现传统 AI 模型的行为。公司还公布了一篇研究论文,说明它如何利用振荡器芯片的软件模拟来构建这个模型。Rao 表示,这个演示相当于一种“新型计算机的 hello world”。据称,该模型的输出质量与 Stable Diffusion 和 OpenAI 的 GPT Image 1 等图像生成器相近。
真正的区别在于底层硬件理念:系统不再依赖标准数字逻辑,而是采用振荡器架构,公司认为这可能把功耗最多降低 1,000 倍。就目前而言,硬件仍在开发中,现有模型只是在模拟环境里运行。Unconventional 说它很快会发布真实芯片的原理图,并最终构建完整的推理平台,通过网络接收提示并返回结果。Rao 认为,未来几年能源将成为 AI 扩展的主要硬约束,因此高能效推理是必须解决的关键问题。
这种架构被描述为基于振荡器,且与传统计算机和现代大语言模型基础设施所使用的晶体管数字逻辑根本不同。Un-0 目前还没有在真实芯片上运行,而是通过软件模拟演示;公司表示很快会公布芯片原理图,然后再构建完整的推理栈。
TechCrunch AI

Adobe 周四表示将收购 Topaz Labs,这家公司专注于图像和视频增强的 AI 模型。Adobe 计划把 Topaz 的技术整合进 Firefly 以及其他 Creative Cloud 产品,同时继续通过其网站提供独立服务。
这笔交易强化了 Adobe 在创意 AI 领域的地位,而它正面临来自 Canva 和 Blackmagic Design 的激烈竞争。对于已经使用 Adobe 生态的摄影师、视频编辑和企业创意团队来说,这可能会让高级增强工具更快、更易用。
Adobe 周四宣布将收购 Topaz Labs,并把这家公司纳入其创意业务。Topaz Labs 以 AI 图像和视频增强工具闻名,在市场上已经深耕二十多年。该公司去年还因其制作技术获得了艾美奖,这说明它在专业媒体工作流中具有很强的可信度。近些年,Topaz 先后推出了自家的 AI 模型,包括用于视频放大的 Astra,以及用于图像润饰和增强的 Wonder。它还在开发一项技术,目标是让大型视频模型更容易在消费级 GPU 上运行。
Adobe 表示,自己已经在 Creative Cloud 中提供了部分 Topaz 工具,但这次收购后会把 Topaz 模型更深入地整合进 Firefly 以及其他图像和视频编辑产品。Adobe 同时称,Topaz 的产品仍会以独立服务的形式通过其网站继续提供。Adobe Creative Cloud 产品营销副总裁 Deepa Subramaniam 表示,这些工具可用于锐化细节、降低噪声和修复档案素材,尤其适合需要把真实拍摄画面与 AI 生成片段结合起来的专业用户。Adobe 还把这笔收购视为留住创作者、增强生态黏性的举措,以应对 Canva 和 Blackmagic Design 等竞争对手。Adobe 表示,这笔交易预计将在 2026 年下半年完成。
Topaz Labs 已经存在二十多年,并在去年因其制作技术获得艾美奖。它近期推出的模型包括用于 AI 视频放大的 Astra 和用于图像润饰与增强的 Wonder,同时还在开发让大型视频模型能在消费级 GPU 上运行的技术。
TechCrunch AI

亚马逊表示,将在2030年前追加投资130亿美元,用于扩大其在印度的AI和云业务布局。这笔资金将用于扩建AWS在孟买和海得拉巴的数据中心容量,使亚马逊在印度的累计承诺达到480亿美元。
这进一步表明,印度正从大型消费市场转变为AI和云基础设施的关键枢纽。如此大规模的投入,可能会加强AWS在这一快速增长地区的竞争地位,而微软、谷歌以及本土财团也都在加码布局。
亚马逊于周四宣布,将在2030年前追加投资130亿美元,用于扩大其在印度的AI和云基础设施。该承诺是在首席执行官安迪·贾西在新德里会见印度总理莫迪之后公布的。亚马逊表示,这笔资金将用于扩建AWS在孟买和海得拉巴的数据中心容量。随着这一次追加承诺,亚马逊在印度的累计投资承诺已达到480亿美元。
公司没有说明这480亿美元将如何在印度各项业务之间分配。亚马逊还指出,这类长期承诺通常既包括资本支出,也包括运营支出,而不只是新增基础设施投入。此次宣布也是亚马逊在过去三年里对印度作出的第三次重大承诺,此前分别是在2023年承诺投资150亿美元,以及在2025年12月承诺投入超过350亿美元。此举反映出全球科技公司正竞相在印度建设计算基础设施,以支撑AI工作负载、云服务和数据中心扩张。
亚马逊没有披露480亿美元总额中有多少属于资本支出、多少属于运营支出,因此这不是单纯的新建基础设施数字。该公告发布于首席执行官安迪·贾西在新德里会见印度总理莫迪之后,并且延续了2023年和2025年12月的前两轮印度投资承诺。
The Decoder

Google 已将 Computer Use 直接集成到 Gemini 3.5 Flash 中,使模型能够在电脑、浏览器和移动设备上观察并操作屏幕。此前,这一能力只作为独立的 Gemini 2.5 模型提供。
这让 Gemini Flash 更适合作为代理平台来执行软件测试和办公自动化等任务,且可与函数调用、Search 和 Maps 结合使用。它也表明,能够跨设备执行操作的实用型 AI 代理正在成为竞争重点,而不只是聊天模型。
Google 已将 Computer Use 直接嵌入 Gemini 3.5 Flash,使屏幕交互成为模型的内建能力,而不再是单独的产品。现在,这个模型可以自主看懂并操作电脑、浏览器和移动设备。报道称,这项能力此前只作为独立的 Gemini 2.5 Computer Use 模型提供。通过把 Computer Use 与现有的函数调用、Search 和 Maps 结合,开发者可以构建能够跨浏览器、桌面和移动端运行的代理。文章提到的典型场景包括软件测试和办公自动化。
由于这类代理式屏幕控制容易受到提示注入攻击,Google 也重点强调了安全性。为降低风险,Google 使用了对抗训练,并提供两项可选的企业级防护措施。其一是在涉及敏感或不可逆操作前要求用户确认,其二是在检测到间接提示注入时自动中止任务。Google 还在最佳实践文档中建议使用沙箱、人工监督和严格访问控制。该功能可通过 Gemini API 和 Gemini Enterprise Agent Platform 使用,同时 Google 还提供了 Browserbase 演示和 GitHub 参考实现。
Google 表示,这项新的 Computer Use 能力可通过 Gemini API 和 Gemini Enterprise Agent Platform 使用。为安全起见,它采用对抗训练,并提供两项可选的企业级防护:一项会在敏感或不可逆操作前要求用户确认,另一项会在检测到间接提示注入时自动停止任务。
Financial Times AI
《金融时报》报道称,中国正在制造全球大部分机器人,而北京正把人形机器人作为缓解劳动力缩减的重要手段。文章指出,到本世纪末,中国劳动力规模预计将降至3亿人。
这表明中国正把机器人技术作为应对人口下降和劳动力短缺的一部分。若人形机器人能够规模化落地,它们可能重塑中国乃至全球的制造业、服务业和产业政策。
《金融时报》分析了中国为何正在加速扩大机器人生产业,尤其聚焦人形机器人。文章将这一趋势与中国的人口前景联系起来,其中包括到本世纪末劳动力预计降至3亿人的判断。北京认为,人形机器人可能成为缩小未来劳动力缺口的一种办法。报道显示,机器人技术正在成为中国长期工业和社会规划的一部分,而不仅仅是工厂自动化的延伸。
文章也强调了人形系统的战略意义,因为它们的设计目标是适应为人类建造的环境。其核心观点是,中国押注这些机器来在劳动力减少的情况下维持产出和生产率。从这个角度看,机器人竞争直接关系到劳动力压力和国家竞争力。
文章重点是人形机器人,这类机器人旨在适应类人的工作环境,并执行有助于弥补劳动力缺口的任务。其核心约束是人口变化:中国面对的是可用劳动力长期下降,而不是短期周期性放缓。
OpenAI News
OpenAI强调了一篇新的研究论文,认为AI智能体能够处理比以往系统更长、更复杂的任务。该公司表示,这些智能体已经在多个工作岗位上提升了生产力。
这之所以重要,是因为它表明AI正在从聊天和辅助工具,走向更自主的工作执行。如果这些结论在实践中成立,员工和组织就可以用智能体分担多步骤任务并提高效率。
OpenAI发布了一篇题为《How agents are transforming work》的文章,用来说明AI智能体可能如何改变人们的工作方式。根据给出的摘要,这家公司引用了一篇新的研究论文,指出智能体能够承担比早期AI系统更长、更复杂的任务。重点不只是回答问题,而是完成跨越多个步骤和决策的工作。
OpenAI还表示,这种能力可以在多种岗位上提升生产力。该文章把智能体定位为AI落地的重要下一阶段,尤其适用于专业和运营类工作流。由于提供的材料没有包含详细实验结果,因此这篇报道的核心信息主要是研究方向,而不是某个具体基准提升。
这则公告是以研究支持的“智能体式”AI观点来呈现的,重点在于长周期任务,而不是单步提示。现有材料没有给出论文的方法、基准或量化的生产力提升数据,因此这更应被视为一则高层次的研究概述,而不是详细的技术结论。
TechCrunch AI

TechCrunch 报道称,Indagari 的信用卡交易分析显示,越来越多消费者开始为 Anthropic 的 Claude 付费,且自 2026 年 1 月以来,消费端收入和付费用户约增长了 75%。这一增长一直持续到 2026 年 5 月 10 日,甚至在 Anthropic 3 月与特朗普政府就模型使用限制发生冲突之后也没有停下。
这些数据表明,Claude 正在突破其开发者和企业客户的传统定位,成为消费级 AI 订阅市场中的真正竞争者,而这个市场长期由 ChatGPT 主导。如果这一趋势持续下去,投资者和竞争对手对 Anthropic 的业务结构以及消费品牌影响力的判断都可能被改写。
TechCrunch 表示,Indagari 的交易数据表明,愿意为 AI 付费的消费者正越来越多地选择 Anthropic 的 Claude。报道认为,这说明 Anthropic 的客户结构比外界通常认为的更广、更健康,而不仅仅是面向企业和使用 Claude Code 的初创开发者。Indagari 的数据覆盖了约 2800 万美国消费者的数十亿笔匿名信用卡交易,因此虽然无法给出 Anthropic 的精确收入或总客户数,但足以观察到明显趋势。根据这份分析,Claude 的付费消费者和消费端收入都在逐月增长,目前比 2026 年 1 月高出约 75%。这种增长甚至延续到了 3 月之后,当时 Anthropic 因拒绝让其模型被特朗普政府用于对美国人进行大规模监控以及用于自主武器而受到关注。
在线教育平台 DataCamp 也表示,消费者对 Claude 的兴趣今年以来大幅上升,其网站上“Claude”已经成为最常搜索的词,甚至超过了“AI”。DataCamp 还称,在自主学习的消费者中,Claude 课程需求比 ChatGPT 高出三倍,且过去 30 天内对 Claude 课程的需求增长了 18 倍。不过,ChatGPT 仍然是消费级 AI 市场的绝对领先者,在各个平台上的付费用户数量都远超 Claude。综合来看,Claude 正在迅速获得市场份额,但距离 OpenAI 的消费订阅业务仍有很大差距。
Indagari 表示,其分析覆盖来自约 2800 万美国消费者的数十亿笔匿名交易,因此这些数据反映的是趋势,而不是精确收入总额。报道还指出,尽管 Claude 今年在消费端收入和认知度上增长更快,但 ChatGPT 的付费用户总量仍然远远领先。
TechCrunch AI

General Intuition 在周四宣布完成 3.2 亿美元融资,投后估值达到 23 亿美元,也证实了 TechCrunch 先前的报道。该公司表示,其智能体可以从电子游戏玩法中学习,并将这些能力迁移到仿真环境和现实世界机器人上。
这项押注直指机器人领域的一个关键瓶颈:收集足够的现实世界数据来训练可用智能体既缓慢又昂贵。若游戏数据真能成为可规模化的捷径,就可能加速自主机器人和其他具身 AI 系统的发展。
在 General Intuition 位于纽约的研发楼层,公司现场演示了一个系统:同一个 AI 模型既驱动着一个类似 Fortnite 的游戏智能体,也驱动着一台在办公室里移动的大型四足机器人。联合创始人兼首席执行官 Pim de Witte 说,这个游戏智能体已经连续运行了 100 个小时,而机器人则通过单摄像头输入在默认的“探索”模式下自主行动。机器人会绕开家具、蹭到椅子腿、撞上杂物,既显示出一定的自主性,也暴露出它对现实物理环境理解仍然有限。
General Intuition 表示,只需要 8 分钟的现实世界机器人数据,就能对四足机器人模型进行微调,而且这些数据是在街道上收集的,不是在办公室演示环境里采集的。公司的核心想法是,一个具身智能体可以从游戏玩法迁移到仿真环境,再进一步迁移到现实世界中的实体行为。General Intuition 是从 Medal 分拆出来的,Medal 是 de Witte 创办的游戏视频剪辑分享公司。
该公司称,Medal 上数亿小时的游戏上传内容,为训练模型进行时空推理提供了初始数据集,也就是理解物体如何在空间和时间中移动的能力。de Witte 强调,关键输入不仅是视频本身,更是剪辑里嵌入的动作标签,即玩家在什么时间按下了什么按键。他认为,很多竞争对手试图只从视频中推断动作,但这还不够。
公司把自己的世界模型定位为训练环境,而不是最终产品,内部把它称作“健身房”。General Intuition 最终想销售的是智能体模型本身,而不是这个模拟环境。de Witte 说,这些动作数据帮助模型区分“自我”和“环境”,从而建立更强的因果理解。
周四,General Intuition 宣布完成 3.2 亿美元融资,投后估值达到 23 亿美元,总披露融资额增至 4.54 亿美元。这个总额还包括公司在去年 10 月成立时获得的 1.34 亿美元融资。公司的主张是,游戏数据可能成为一种可规模化的捷径,用来训练那些原本需要大量且昂贵现实数据的模型。
不过,报道也指出,许多其他团队都在尝试类似方向,而核心难题仍然是这种模型能否在物理世界中稳定、大规模地工作。General Intuition 的演示看起来很有说服力,但公司尚未证明这种方法已经在真实部署中得到广泛验证。
General Intuition 表示,关键不只是游戏视频本身,而是其中嵌入的动作标签,也就是玩家在什么时间按了哪些按键。公司还称,只用了 8 分钟的现实世界机器人数据就能微调其四足机器人模型,该模型使用单摄像头,并且默认以“探索”模式运行。
TechCrunch AI

Netris 从 Andreessen Horowitz 获得了 1500 万美元 A 轮融资,用于扩展面向 AI 新云的网络自动化软件。该公司表示,其平台可以帮助运营商更快完成 GPU 集群的配置、抽象和运维,从而更快上线。
AI 新云运营商在配置昂贵的 GPU 基础设施时常常面临漫长的等待和高成本,因此缩短上市时间的软件可能带来很大的经济价值。此次融资也表明,投资者仍然看好 AI 训练和推理背后的基础设施层,而不只是模型本身。
AI 热潮推动许多公司开始涉足数据中心业务,但把新设施真正上线并不容易。即使已经拿到 GPU、交换机和存储,运营商仍然要完成网络配置、满足客户需求,并把场地准备好以承载 AI 推理和训练工作负载。这个过程可能要花数月时间,昂贵的 GPU 也会因此闲置,成本随之上升。Netris 表示,它的软硬件平台可以为新云(neocloud)解决这一问题,通过自动化部署、配置和持续运维来缩短上线时间。该平台运行在网络交换机上,并与交换机连接,提供网络抽象能力,使硬件配置可以更灵活地调整。它还在硬件层隔离服务器和资源,以支持多租户。
CEO Alex Saroyan 对 TechCrunch 表示,传统的 SDN 在 AI 场景下已经不够用,因为高流量环境需要硬件加速,而不是纯软件方案。他说 Netris 在这个方向上已经做了 8 年,而且其产品保持厂商无关,兼容 Nvidia 和 AMD 服务器所使用的数据中心网络设备和标准。Nvidia 据称在两年前看到演示后就表示认可,并向多位客户推荐了 Netris。Netris 目前已在全球 35 个以上的 GPU 集群中上线,总计约 100 万块 GPU,客户包括 Lightning AI、Foxconn、Visionbay、Hewlett Packard Enterprise、TensorWave 和 Telus。公司现在又从 Andreessen Horowitz 获得了 1500 万美元 A 轮融资,a16z 合伙人 Guido Appenzeller 也将加入董事会。接下来,Netris 计划用这笔资金招聘更多工程师和销售人员,支持更多硬件厂商,并增强其自动化算法的功能。
Netris 表示其软件是硬件加速、厂商无关的,专为服务 AI 负载的数据中心自动化交换机配置和多租户能力而设计。公司称其产品已在全球 35 个以上的 GPU 集群中上线,总计约 100 万块 GPU,客户包括 Lightning AI、Foxconn、Visionbay、Hewlett Packard Enterprise、TensorWave 和 Telus。
TechCrunch AI

荷兰贸易部长斯约尔德·斯约尔兹马本周前往华盛顿,敦促国会和商务部长霍华德·卢特尼克反对 MATCH 法案。该法案将进一步收紧中国获取西方半导体设备的出口限制,并可能对荷兰企业 ASML 造成重大影响。
ASML 是欧洲市值最高的公司,也是全球唯一制造用于先进 AI 芯片生产的高端光刻设备的企业,因此美国若进一步限制出口,可能会波及全球半导体供应链。此事也凸显出美国出口管制目标与欧洲保护本土战略产业之间日益加深的矛盾。
欧洲正在反击美国国会一项新的举措,该举措旨在进一步限制中国获取西方芯片制造设备。荷兰贸易部长斯约尔德·斯约尔兹马本周在华盛顿会见了商务部长霍华德·卢特尼克以及多名国会议员,试图表达对 MATCH 法案的反对意见。他在会后表示,这件事对荷兰来说不同寻常地重要,相关影响可能非常大。该法案将比现有政策覆盖更广的半导体工具,禁止中国芯片制造商接触更多西方设备。此事对荷兰企业 ASML 尤其敏感,因为它是全球唯一生产最先进光刻机的公司。
ASML 的 EUV 设备是制造尖端芯片所必需的,这类芯片也包括用于 AI 硬件的产品。中国目前已经是 ASML 的重要市场,占其净系统销售额的 19%。而 MATCH 法案不仅会继续限制 EUV 设备,还会把深紫外浸没式光刻机纳入禁售范围,这些是 ASML 仍在向中国出售的老一代设备。ASML 首席执行官克里斯托夫·福凯在 5 月曾表示,中国目前能买到的主要是大约十年前推出的工具,而这正是该法案要新增禁止的设备。MATCH 法案于 4 月提出,但尚未在众议院或参议院获得全面表决,彭博社称它很可能需要被并入更大的法案才能通过。
中国占 ASML 净系统销售额的 19%,这意味着拟议限制对公司具有现实的商业影响。MATCH 法案不仅会延续对 ASML 最先进的极紫外(EUV)设备的限制,还会把中国目前仍能购买的深紫外浸没式设备也纳入禁售范围。
TechCrunch AI

印孚瑟斯前首席执行官维沙尔·西卡推出了 Hang Ten Systems,并由 Mayfield 领投完成 3200 万美元种子轮融资。该公司表示,它利用 AI 驱动的开发与自动化,帮助企业持续构建、修改和运营软件。
这笔融资表明,投资者相信 AI 不只是提升企业软件工具,而是可能重塑部分 IT 服务市场。若 Hang Ten 能够规模化,它可能挑战传统服务公司沿用数十年的重人力模式。
几十年来,IT 服务公司通过帮助企业定制、集成和维护软件赚取巨额利润,而随着需求增长,往往也是通过增加人手来扩大规模。曾担任印孚瑟斯首席执行官、并在 SAP 和 Oracle 深耕企业软件多年的维沙尔·西卡,如今押注 AI 可以自动完成其中相当一部分工作。西卡的新创业公司 Hang Ten Systems 于周三宣布完成 3200 万美元种子轮融资,由 Mayfield 领投,阿美风险投资公司提供战略投资,另有天使投资人参与。Yahoo 联合创始人杰里·杨担任公司董事会成员。Hang Ten 表示,它通过 AI 驱动的开发和自动化,帮助企业持续构建、修改和运营软件。公司称,已经在与西门子歌美飒可再生能源、费森尤斯等客户合作,推进 AI 原生项目交付。
Mayfield 管理合伙人纳文·查达表示,公司大约一个月前才刚起步,但已经有了客户。Hang Ten 总部位于湾区,目前正在招聘交付、工程、销售和管理岗位,并计划在全球多个地点扩张,以满足企业需求。该公司进入的正是一个正在快速变化的市场,印孚瑟斯等传统 IT 服务公司也在通过与 Anthropic 和 OpenAI 等公司的合作来适应 AI。随着投资者争论 AI 是会扩大服务市场,还是会从根本上改变企业软件的构建与维护方式,这家初创公司的发布显得尤为引人关注。印孚瑟斯董事长南丹·尼勒卡尼本周表示,AI 可能扩大行业市场;而 Jefferies 分析师今年早些时候则认为,IT 服务可能是最早受到 AI 实质性冲击的行业之一。印孚瑟斯本月也向投资者表示,“AI-first services” 到 2030 年可能形成 3000 亿至 4000 亿美元市场,但该公司股价今年已下跌超过 35%。
Hang Ten 表示,其重点是代理式代码生成、可复用的 AI 技能和行业知识,并且已经拥有包括西门子歌美飒可再生能源和费森尤斯在内的客户。Mayfield 认为,这家公司每做一个项目都会提升杠杆效应,而传统服务公司通常只能随着员工数量线性扩张。
The Decoder

据报道,Meta 在 2025 年已经用大语言模型替代了大约一半的人类审核请求,并计划在年底前把某些内容类型的占比提升到 90% 以上。员工则认为推进速度过快,而 Meta 表示其模型在执行内容政策时比人工犯错更少,也能发现更多违规内容。
这是一场关于 LLM 是否能够安全接管全球平台核心信任与安全工作的重大测试。结果会影响审核质量、创作者和用户体验、外包岗位,以及整个行业推动内容执法自动化的趋势。
Meta 正在快速把内容审核工作从人工转向 AI,2025 年大约一半的审核请求已经由大语言模型处理。根据《金融时报》的报道,公司希望到今年年底,某些内容类型中这一比例超过 90%,而这一变化预计每年可为公司节省数十亿美元。Meta 对“省钱”这种说法并不认同,而是强调质量提升:公司称,自 3 月以来的测试显示,其模型在执行内容政策时比人工少 13% 的错误,并能多识别 10% 的真实违规内容。Meta 还表示,大语言模型比传统的机器学习分类器更擅长理解讽刺、语境细微差别以及多语言内容。 但员工在报道中描绘了不同的情况。
他们认为这次推进速度太快,内部监督没有跟上,系统仍会误删无害内容,甚至对本不该受罚的帖子进行影子封禁。报道称,这种转型也已经带来裁员,尤其影响外部承包商。与此同时,Meta 还在更换底层模型:公司过去在审核和支持任务中使用 Google 的 Gemini,但最近要求员工改用自家的基础模型 Muse Spark。相关模型是根据人类审核员过去的判定结果训练出来的,目的是在大规模场景下复制这些审核判断。
Meta 表示,自 3 月以来的测试显示,这些语言模型在执行内容政策时比人工少 13% 的错误,并能多发现 10% 的真实违规内容,而且相比传统 ML 分类器,它们更擅长理解细微语义和多语言内容。但员工称,模型仍会误删无害内容或进行影子封禁,而且监督机制没有跟上推进速度。
The Decoder

据彭博社报道,谷歌又有几位知名 AI 研究员流向竞争对手,其中 Jonas Adler 和 Alexander Pritzel 据称将加入 Anthropic。文章还提到,诺贝尔奖得主 John Jumper 以及 Gemini 负责人 Noam Shazeer 近期分别转投 Anthropic 和 OpenAI。
这表明谷歌在留住前沿 AI 人才方面正面临越来越大的压力,尤其是与 Gemini 和 Google DeepMind 相关的团队。对整个 AI 行业来说,这也说明资本、股权激励和竞争对手的势头,正在重塑顶尖研究人员的流向。
报道称,谷歌正在持续失去关键的 AI 研究人员,这进一步加剧了外界对其人才留存能力的担忧。彭博社表示,Jonas Adler 和 Alexander Pritzel 正计划加入 Anthropic,而两人都被认为是谷歌 Gemini AI 模型背后的重要人物。Adler 主要从事 AI 编程相关工作,Pritzel 则负责 AI 系统训练。文章还提到,之前已有两位重量级人物离开:诺贝尔奖得主 John Jumper 据称转投 Anthropic,而 Gemini 负责人 Noam Shazeer 则加入了 OpenAI。
报道指出,这些人事变动让投资者感到不安,并拖累了 Alphabet 的股价。文中给出的一个原因是,Anthropic 和 OpenAI 都在接近 IPO,因此能够向员工提供更有吸引力的股权激励。文章还引用了 SignalFire 的分析,称 DeepMind 工程师流向 Anthropic 的频率是反向流动的 11 倍。面对外界对人才流失的担忧,Google DeepMind CEO Demis Hassabis 在戛纳的一场活动上回应称,谷歌仍拥有所有 AI 实验室中最深厚的研究团队储备。
文章称,Adler 负责 AI 编程相关工作,Pritzel 负责 AI 系统训练,因此他们的离开对 Gemini 开发尤其敏感。文中还引用 SignalFire 的分析,称 DeepMind 工程师流向 Anthropic 的频率是反向流动的 11 倍,而 Demis Hassabis 公开表示谷歌仍拥有最深厚的研究人才储备。
Simon Willison
Simon Willison 创建了 simonw/browser-compat-db 项目,将 MDN 的浏览器兼容性数据转换成一个 SQLite 数据库。他还使用 AI 生成脚本和 GitHub Actions,把生成后的数据库发布到普通的 GitHub 仓库分支上,并保留了开放的 CORS 头。
这让一个大型兼容性数据集更容易被查询、分发和复用,尤其适合像 Datasette Lite 这样的浏览器工具。它也展示了一种把 SQLite、GitHub 托管和 AI 辅助自动化结合起来、以 CDN 友好方式打包开发者数据的实用模式。
Simon Willison 介绍了一个规模不大但很实用的基础设施项目,核心是 MDN 的浏览器兼容性数据集。受 Mozilla 新推出的 MDN MCP 服务启发,他决定把 mdn/browser-compat-data 仓库转换成一个 SQLite 数据库。这个仓库里包含一个由 Claude Code for web 生成的构建脚本,用 sqlite-utils 来完成转换。Willison 说生成出来的数据库大约有 66 MB。
为了让这个文件更方便地在浏览器中访问,他希望它能通过 GitHub 并带着开放的 CORS 头提供服务。由于 GitHub Releases 不会提供这种头信息,他改用 Codex Desktop 编写了一个 GitHub Actions 工作流,用来生成数据库并强制推送到名为 db 的孤立分支。最终生成的数据库可以直接从仓库下载,并且因为托管方式允许跨域访问,所以还能在浏览器里通过 Datasette Lite 直接浏览。
底层的 MDN browser-compat-data 项目规模很大,数据集中有超过 15,000 个特性。Willison 说这个数据库大约有 66 MB,而且他选择普通的 GitHub 仓库分支而不是 GitHub Releases,因为仓库文件可以带着开放的 CORS 头提供服务。
TechCrunch AI

Cerebras在上市后的首份财报发布后股价下跌近20%,尽管公司第一季度营收表现好于预期。抛售主要源于公司给出的全年毛利率指引为38%至41%,低于第一季度公布的47%。
这一走势说明,投资者对AI芯片公司利润率变化依然非常敏感,尤其是在增长依赖高成本基础设施扩张的情况下。它也凸显了一个权衡:企业是快速扩容以满足客户需求,还是尽量保住盈利能力。
Cerebras Systems的股价在周三下跌近20%,原因是投资者对公司的利润率前景反应消极。尽管这家AI芯片公司在周二公布的第一季度业绩好于预期,市场仍然选择抛售。作为公司上市后的首份财报,Cerebras预计其核心业务全年毛利率将为38%至41%。这一指引明显低于公司在第一季度报告中的47%毛利率。周三盘中,股价一度创下新低,并且接近公司的IPO发行价。
首席执行官Andrew Feldman对CNBC表示,投资者误解了这项指引。他解释说,Cerebras需要从其最大客户之一那里租回部分设备。在财报电话会上,公司表示,为了更快把更多算力投入市场,它决定在建设并部署自有数据中心容量的同时,临时把自有系统租回给一位现有客户。Cerebras称,这一安排会在今年压缩利润率。不过,公司整体经营表现仍然强劲:季度营收达到1.93亿美元,同比增长94%;净亏损则收窄至1400万美元,而去年同期为2390万美元。
首席执行官Andrew Feldman表示,市场误解了利润率指引,因为Cerebras计划在建设自有数据中心容量期间,临时向其最大客户之一租回部分设备。公司称,这样做可以更快释放可用算力,但也会压低今年的利润率。
The Decoder

《华盛顿邮报》的一项调查发现,大多数主流AI聊天机器人在政治问题上都偏向左翼,即使是一些被宣传为保守派或“反觉醒”的模型也不例外。谷歌的 Gemini 3.1 Pro 是明显例外,在 93% 的案例中都同时呈现了双方观点。
这些结果进一步说明,广泛使用的聊天机器人可能会在不经意间影响用户的政治认知,而不是保持中立的信息工具。对于用户、开发者和政策制定者来说,这很重要,因为 AI 的政治倾向会影响信任、内容治理选择以及公共讨论。
《华盛顿邮报》对六个领先的AI模型进行了政治问题测试,发现大多数模型都明显偏左。报道指出,这种现象延续了早先研究中的结论,即便一些公司和政治人物正在推动所谓的“反觉醒”AI。OpenAI 的 GPT-5.5 在测试中最为偏斜,80% 的回答只给出了左倾论点,而且只出现过一次纯右倾回答。Deepseek 的 V4 Pro 紧随其后,70% 的回答都只包含左倾观点。Anthropic 的 Claude Opus 4.8 相对更平衡,但仍有 43% 的回答只给出左倾立场,另外 57% 的回答同时呈现了双方观点。
xAI 的 Grok 4.3 虽然比其他模型更常给出右倾回答,但总体上仍然是左倾回答更多。Gab 的 Arya 被其开发者描述为“以基督教价值观和保守原则构建”,但在《华盛顿邮报》的测试中,它给出的左倾论点次数是右倾论点的十二倍。Gemini 3.1 Pro 则是最突出的例外,在 93% 的案例中都同时呈现了双方观点,而且从未给出纯右倾回答。报道还指出,某些模型在特定议题上仍可能被定向影响,例如 Grok 在跨性别权利问题上给出了完全右倾的立场,这与马斯克的公开观点一致。《华盛顿邮报》还在 GitHub 上公开了代码和补充分析,同时提醒读者,用简单的“左/右”标签来划分 AI 回答可能过于粗糙,因为一些右倾立场会与科学共识或基本人权发生冲突。
OpenAI 的 GPT-5.5 在 80% 的案例中只给出了左倾观点,Deepseek V4 Pro 则达到了 70%。文章也指出,用“左”或“右”给答案分类并不完美,因为某些右倾立场可能与科学共识或基本权利相冲突。
The Decoder

《The Decoder》援引报道称,两名前 xAI 员工估计,Grok 超过一半的流量都与色情图片、视频、角色扮演聊天或其他成人内容有关。文章还称,尽管此前围绕真实人物色情图像的争议不断,xAI 仍在扩大 Grok 的图像和视频生成功能。
如果属实,这一报道表明 Grok 的产品方向已与主流 AI 助手明显不同,并对内容审核、品牌风险和平台治理带来重要影响。它也反映出生成式 AI 厂商在是否大规模允许成人内容方面可能正在分化。
《The Decoder》报道称,Grok 已经在很大程度上与成人内容绑定,这一判断来自两名前 xAI 员工的估计。两人据称认为,Grok 超过一半的流量都涉及色情图片、视频、角色扮演聊天或其他成人用途。文章还说,连 Grok 的编程模型也经常收到与色情相关的提示,说明这种行为并不局限于某一种功能。报道将这一现象视为 xAI 持续扩展 Grok 图像和视频生成能力的一部分,而 OpenAI、Anthropic 和 Google 在这类内容上则更加谨慎。
文章认为,这种产品空白正在帮助 xAI 进入其他 AI 实验室不愿触碰的内容领域。报道还提到,今年早些时候,X 用户曾连续数周生成真实人物的色情图像。文章称,xAI 其实知道这一情况,但直到监管压力出现后才采取行动。文中还表示,这一事件据称让一些研究人员感到不安,而且公司所有联合创始人后来都已离开,xAI 目前还在把 GPU 资源出租给 Anthropic。
文章称,甚至 Grok 的编程模型也经常收到色情请求,这说明成人用途并不只限于图像生成。文章还称,xAI 对用户生成真实人物色情图像的早期反应是在监管压力之后才采取行动,而且据称这一事件让一些研究人员感到尴尬。
The Decoder

作者公会用十篇发表于2020年至2022年的文章测试了多款AI检测器。Pangram和Grammarly把所有样本都正确识别为人类写作,而Sidekicker把每篇文章都标成了主要由AI生成,ZeroGPT也对这些人类文本给出了不稳定的高AI分数。
这说明把AI检测器单独作为作者身份、合同或内容审核依据是很危险的。对于出版社和作者来说,误报可能在文本本来就是人类写作时,仍然伤害声誉和生计。
作者公会使用十篇发表于2020年至2022年的文章进行了一次小规模测试,这些文章都写在生成式AI普及之前。测试结果显示,Pangram和Grammarly都把全部人类写作样本正确识别为人类。Originality.ai的表现也不错,而Sidekicker的结果最差,它把每篇文章都标成了主要由AI生成,其中两篇甚至被打了100% AI分数。ZeroGPT同样不稳定,对这些人类写作样本有时给出很高的AI比例。作者公会表示,这类误报非常严重,因为它们可能影响作者的合同和声誉。
公会同时警告,即便是表现较好的工具,也不应作为做决定的唯一依据,因为检测器会不断变化,不能被默认长期可靠。Pangram首席执行官Max Spero称他的检测器本质上是黑箱,但他认为语言模型通常会在写作的均匀性和论证结构上暴露自己。作者公会则指出,专业人类文本往往与AI输出共享相似的统计模式,因为模型正是用这类写作训练出来的,这就形成了一个悖论:写得越好的人类文本,越可能看起来像机器生成。文章最后强调,这次测试主要说明这些工具在识别人类写作方面的能力,并不能证明它们同样擅长识别AI写作;它们的价值更可能在于减少误报,而不是保证检测绝对准确。
作者公会警告说,即使表现较好的工具也不应被当作最终结论,因为检测准确率会随时间变化。Pangram首席执行官Max Spero表示,该系统本质上像一个黑箱,作者公会则认为出版社在做决定前应披露方法,并给作者申辩机会。
The Decoder

据报道,高通正在通过一款名为 Dragonfly C1000 的新处理器进一步进入数据中心市场。所给内容只说明该公司在继续推进这一方向,没有提供更多技术细节或发布信息。
高通进入数据中心处理器市场具有意义,因为这可能为由既有服务器 CPU 和 AI 基础设施厂商主导的市场增加新的竞争者。若该产品推进顺利,也可能意味着基于 ARM 的云端和企业计算竞争进一步加剧。
文章称,高通正在借助一款名为 Dragonfly C1000 的新处理器进一步进入数据中心市场。所给文本没有包含任何其他技术规格。文中也没有说明这颗芯片的架构、目标工作负载,或者它是面向通用服务器还是 AI 基础设施。内容同样没有提到合作伙伴、客户或上市时间表。
就目前呈现的信息来看,这条消息只是说明高通正在把处理器业务从传统的移动端和边缘计算进一步扩展到数据中心。由于细节非常有限,读者更应关注其战略方向,而不是具体实现。若要判断其实际影响,还需要后续更详细的报道或官方产品信息。
文中唯一明确提到的产品名称是 Dragonfly C1000,但没有给出架构、性能目标、客户或出货时间表。由于原文非常简短,这更像是一个早期信号,而不是一份完整的产品发布信息。
The Verge AI

·#ai
福特表示,在用于设计和生产的自动化系统出现错误后,公司不得不重新聘请前员工并招回有经验的技术人员来纠正问题。福特还称,已经招聘、晋升或重新聘用了350多名资深工程师,以重建流失的经验层。
这个案例说明,自动化和 AI 虽然能提升规模和速度,但仍然依赖高质量数据和人工经验,否则就可能引发昂贵的缺陷。它对汽车制造尤其重要,因为质量问题很容易演变成召回、延期和品牌受损。
福特借着自己在 JD Power 主流汽车制造商初始质量排名中升至第一的机会,公开说明了近年来质量体系中出现的偏差。公司表示,它在生产和设计中过度依赖自动化系统,后来才发现这些系统并没有想象中那么稳健。福特车辆硬件工程副总裁 Charles Poon 说,公司曾错误地以为,只要引入 AI 并调整设计要求,就能自动产出高质量产品。福特现在承认,AI 的效果取决于训练它的数据质量。与此同时,公司低估了资深工程师的价值,这些工程师在多轮车型开发过程中积累了大量实践经验。
由于这些经验没有在员工离开前完整传入自动化系统,福特不得不招聘、晋升或重新聘用350多名有经验的工程师,重建这层专业知识。部分工程师负责重新训练自动化系统,另一部分则负责指导年轻员工,并改进支撑 AI 的数据采集和训练。福特 COO Kumar Galhotra 表示,公司过去的组织过于碎片化,过度依赖“发现并修复”的思路,而不是提前预防缺陷。福特现在试图把软件开发式的快速迭代,与汽车工程所需的验证和严谨性结合起来。公司还承认,以前软件漏洞常常在流程后期才被发现,因为它没有充分利用快速迭代周期,但汽车行业又不能像消费电子那样“快速推出、随后再修补”。
福特表示,一些资深员工在知识尚未完全传入自动化系统前就离开了公司,因此公司不得不重新训练这些系统,并让他们去指导年轻工程师。高管还表示,福特正在从被动的“发现并修复”模式转向更早预防问题,同时让软件、硬件、制造和供应链团队更紧密协作。