韩国把芯片和 AI 基建上升为国家产业战略
三星、SK 海力士及其他巨头承诺在存储芯片、HBM 封装和 AI 数据中心上投入超大规模资金,目标直指 AI 内存短缺与产业重心再平衡。相关计划还延伸到人形机器人商业部署,显示韩国想同时掌控算力底座与下一代硬件形态。[2821, 2823]
AI 日报
今天的主线是“基础设施与控制权”:韩国以超万亿美元级别投资押注存储芯片、HBM 和 AI 数据中心,试图缓解 AI 驱动的内存短缺并巩固产业地位。与此同时,AI 代理、编码工具和数据处理流程的安全、隐私与治理问题也在快速升温,显示 AI 竞争已从模型能力扩展到供应链、商业模式和制度边界。
Overview
从 43 条资讯中筛选出 19 条
今天的主线是“基础设施与控制权”:韩国以超万亿美元级别投资押注存储芯片、HBM 和 AI 数据中心,试图缓解 AI 驱动的内存短缺并巩固产业地位。与此同时,AI 代理、编码工具和数据处理流程的安全、隐私与治理问题也在快速升温,显示 AI 竞争已从模型能力扩展到供应链、商业模式和制度边界。
三星、SK 海力士及其他巨头承诺在存储芯片、HBM 封装和 AI 数据中心上投入超大规模资金,目标直指 AI 内存短缺与产业重心再平衡。相关计划还延伸到人形机器人商业部署,显示韩国想同时掌控算力底座与下一代硬件形态。[2821, 2823]
研究人员发现,Claude Code 可能被伪装正常的 GitHub 仓库诱导执行隐藏恶意代码,攻击链结合间接提示注入和运行时取回载荷,足以获取反向 Shell。与此同时,Cursor 把编码代理搬到手机上,进一步说明代理工作流正在普及,但权限与执行安全必须同步升级。[2827, 2838]
Arena 的年化收入达到 1 亿美元,说明模型评估已从社区工具演化为商业基础设施;Meta 则限制 Claude Code 和 Codex,以避免竞争对手模型输出进入自己的训练数据。亚马逊据称也在蒸馏 Anthropic 模型来压低 token 成本,显示大厂正在围绕“谁的数据、谁的成本”重新布防。[2825, 2835, 2833]
美国拟扩大健康与位置数据保护法,覆盖用户输入到聊天机器人的敏感信息;欧洲则在美国限制前沿模型访问后加速讨论 AI 主权。OpenAI 的欧盟就业报告和 Deloitte 对按小时计费模式的警告,则显示 AI 影响正在从技术扩散到劳动力与商业模式。[2828, 2834, 2837, 2836]
NVIDIA 的 ENPIRE 试图让机器人在闭环中自我改进,Proception 则在灵巧手上融资并解决人形机器人最难的硬件问题;TIDAL 则直接切断纯 AI 音乐变现,转向保护创作者收益。它们共同说明,AI 的下一阶段不只是生成,更是约束、反馈和分配。[2830, 2832, 2839]
AI 正从“模型竞赛”转向“系统竞赛”:谁能掌控芯片、数据中心、工具链、评估和规则,谁就更接近下一轮产业主导权。今天最突出的信号来自韩国的大规模半导体与 AI 投资,同时,AI 安全、隐私监管和企业内部控制也在同步收紧。
韩国的两则重磅投资消息几乎定义了当天的宏观情绪:一边是面向存储芯片、HBM 封装和 AI 数据中心的超大额资本开支,另一边则把人形机器人纳入国家产业路线。无论最终执行节奏如何,这都说明 AI 供给侧的核心瓶颈仍然是算力、内存和制造能力,而不是单纯的模型参数规模。[2821, 2823]
Ornith-1.0 继续扩充开源智能编程模型选择,Cursor 则把编码代理带上手机,表明“人监督代理”的开发范式正在成型。但同一天的安全研究提醒我们,代理越自主,供应链与执行权限风险越高;AI 编程工具并不天然安全,尤其当它们默认执行仓库安装步骤时。[2824, 2838, 2827]
Arena 证明了 AI 评估可以是一门规模化生意,Meta 则限制 Claude Code 和 Codex 进入内部工作流,以防竞争对手输出污染训练数据。亚马逊据称也在蒸馏 Anthropic 模型,以应对按 token 计费时代的成本压力;而 Deloitte 的判断更直白:AI 正在侵蚀咨询业最核心的按小时收费逻辑。[2825, 2835, 2833, 2836]
美国立法者希望阻止健康和位置数据流向数据经纪人,尤其是用户在 AI 聊天机器人中共享的敏感信息;OpenAI 则发布欧盟就业影响图谱,反映监管和劳动力政策正在围绕 AI 重新布局。与此同时,欧洲对前沿模型访问受限的担忧,正在把“AI 主权”从口号推向政策议程。[2828, 2837, 2834]
NVIDIA 的 ENPIRE 框架尝试把“自我改进”带入实体机器人闭环,Proception 则在灵巧手这一人形机器人关键部件上继续融资和商业化。两条线都指向同一个趋势:机器人竞赛正在从演示走向可持续训练、可规模化部署和可买卖的关键模块。[2830, 2832]
TIDAL 开始禁止纯 AI 音乐变现,并为相关曲目标注徽标,说明主流平台不再只满足于“标记 AI”,而是开始主动限制其经济激励。这可能成为其他音乐与内容平台的参考模板。[2839]
今天的新闻组合显示,AI 已进入“基础设施、权限与规则”三线并进的阶段:上游要争芯片和数据中心,中间要争评估、代理和成本结构,下游则要争隐私、主权和创作者收益。真正决定下一阶段格局的,可能不只是哪个模型更强,而是谁能把整个 AI 系统更安全、更便宜、更可控地跑起来。[2821, 2827, 2825, 2828]
Stories
TechCrunch AI

韩国公布了一项全国性投资计划,三星、SK海力士、SK集团及其他科技巨头承诺在半导体、HBM封装和AI数据中心方面投入超过9000亿美元。该计划包括在西南地区建设四座新的存储芯片工厂,投资5180亿美元;建设一个HBM封装中心,投资520亿美元;以及到2035年为AI数据中心再投入3560亿美元。
这表明韩国正在认真应对被称为“RAMageddon”的AI驱动内存短缺,这一趋势已经推高了三星、SK海力士和美光等公司的芯片需求。如果这些项目顺利落地,将有助于增强全球存储芯片供应,扩大韩国在AI基础设施中的地位,并把更多投资从首尔周边带到其他地区。
韩国最大的科技公司正在芯片和AI基础设施上押下重注,因为全球存储需求正在飙升。韩国政府在周一的一场总统简报会上公布了这项投资计划,三星和SK海力士的董事长都出席了会议。根据计划,全球两大存储芯片公司将投资5180亿美元,在韩国西南部建设四座新的存储芯片工厂,而这一地区过去几乎没有获得多少半导体投资。计划还包括在中部地区建设一个HBM封装中心,投资520亿美元。第三部分则是由SK、GS、Naver等韩国科技和能源企业在2035年前投入3560亿美元建设AI数据中心。韩国科技公司合计承诺的投资超过9000亿美元。
李在明总统表示,韩国希望成为“不可替代”的产业强国,并把半导体、实体AI和AI数据中心称为下一产业时代的核心。他还说,龙仁和平泽现有的芯片基地已经接近极限,因此敦促企业加快向西南地区投资。李在明同时回击了外界关于政府向企业施压的报道,称这些决定是企业自主做出的,而政府的职责是创造条件,让企业能够更安心地投资、降低亏损风险。三星还单独宣布未来十年投资2655万亿韩元,其中包括对湖南地区的重点投入,以及在光州新建半导体工厂、在海南建设AI数据中心。SK集团也公布了2100万亿韩元的中长期路线图,其中1100万亿韩元用于扩大半导体产能,1000万亿韩元用于全国范围内的AI数据中心建设。文章指出,这一规模虽然巨大,但与美国超大规模云厂商今年在AI基础设施上的总支出相比并非完全离谱,同时也提醒说,执行仍然存在很大不确定性,因为晶圆厂建设周期很长,而需求在产能投产前可能已经发生变化。
李在明总统表示,半导体、实体AI和AI数据中心是韩国下一产业时代的“三大轴心”,并称龙仁和平泽现有设施已接近极限。三星还单独宣布未来十年投资2655万亿韩元,其中425万亿韩元投向湖南地区;SK集团则公布了2100万亿韩元路线图,其中SK电讯将主导建设15000兆瓦的AI数据中心容量。
Ars Technica AI

韩国宣布了一项在政府支持下、总额约1万亿美元的投资计划,三星、SK海力士和现代等大型企业都参与其中。该计划旨在扩大存储芯片产能、建设AI数据中心,并推动人形机器人在2028年前实现商业部署。
这一举措可能重塑全球存储芯片供应,而AI需求正在推高价格并挤压供给。它也表明韩国希望不仅在半导体领域领先,还要在更广泛的AI硬件和机器人产业链中占据主导地位。
韩国政府和国内最大的科技公司正在推进一项总额约1万亿美元的投资计划。该计划旨在扩大存储芯片产能、建设新的AI数据中心,并推动人形机器人在2028年前实现商业化部署。此举反映出半导体已经成为韩国经济和全球AI供应链中的核心环节。韩国总统李在明在6月29日的电视讲话中表示,韩国必须比任何国家都更快地掌握AI的核心要素。他把半导体、具身AI和AI数据中心称为国家跃升的“三大轴心”。
其中规模最大的部分涉及三星和SK海力士投入5850亿美元,用于新建晶圆厂和扩大半导体建设,重点覆盖西南地区以及首都圈。政府的目标是在五年内把DRAM产量翻一番。由于AI需求激增,韩国芯片企业近期创下历史性利润和股价涨幅,但这也带来了供应紧张和消费电子价格上涨。与此同时,现代汽车正推动由Boston Dynamics开发的人形机器人量产,希望它们能在汽车工厂和其他工作场所接手一些高强度劳动任务。该计划出台之际,韩国社会也在讨论芯片企业是否应分享暴利,工会则对机器人进入就业市场表示担忧。
路透社称,三星和SK海力士将投入5850亿美元,用于新建晶圆厂、扩展首都圈半导体建设和相关设施,而政府的目标是在五年内将DRAM产量翻倍。文章还指出,三星和SK海力士合计控制着接近80%的全球高带宽存储器市场,这对AI工作负载至关重要。
Simon Willison

·#llm
DeepReinforce 发布了 Ornith-1.0,这是一个采用 MIT 许可的开源权重智能编程模型家族。该系列包含 9B Dense、31B Dense、35B MoE 和 397B MoE 等多个版本,基于预训练的 Gemma 4 和 Qwen 3.5 构建。
这次发布为智能编程这一快速发展的领域增加了一个采用宽松许可的选择,开发者希望模型能够处理多步工具调用和代码库导航。如果其基准表现经得起验证,Ornith-1.0 可能会对本地部署以及需要高编码能力开源模型的团队很有价值。
Ornith-1.0 被介绍为 DeepReinforce 的首个模型发布,是一个面向智能编程的开源权重、MIT 许可模型家族。公告称,这个家族包含 9B Dense、31B Dense、35B MoE 和 397B MoE 等多个版本。DeepReinforce 表示,这些模型建立在预训练的 Gemma 4 和 Qwen 3.5 之上,并且在同等规模的开源模型中,编码基准成绩达到了最先进水平。Simon Willison 指出,底层模型的许可看起来适合这种用法,因为 Gemma 4 和 Qwen 3.5 都采用 Apache 2.0 许可。
Willison 还在本地用 LM Studio 运行了 35B 的 GGUF 构建版本,并通过 Pi 接入测试,认为它可以较为熟练地执行包含多次工具调用的代理任务。在一个针对 Datasette 的终端会话中,它成功找到了与解码 actor cookie 以及在按钮点击时打开插入对话框相关的代码路径。他另外让模型画了一只鹈鹕,结果虽然有些失真,但仍然清楚可辨,并且输出速度达到了每秒 103 个 token。Willison 还提到,他几乎没有找到 DeepReinforce 的更多背景信息,只能查到他们在 2025 年 6 月发表的一篇较早论文《CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning》。
Simon Willison 提到该模型提供了 GGUF 构建版本,尤其是 35B 的 Q4_K_M 文件,他将其在 LM Studio 中接入 Pi 进行运行。他还指出,底层的 Gemma 4 和 Qwen 3.5 看起来都采用兼容的 Apache 2.0 许可,并观察到该模型在多次工具调用中表现良好,在一次测试中输出速度达到每秒 103 个 token。
TechCrunch AI

Arena 这项最初源自加州大学伯克利分校研究项目的众包 AI 模型排行榜,称其在推出商业服务仅八个月后,年化运行收入已达到 1 亿美元。公司于 9 月推出的商业产品 AI Evaluations 面向模型实验室和企业提供深度性能分析,并开始带来收入。
这一里程碑表明,AI 基准测试和评估已经不只是研究或社区活动,而是形成了有实际规模的商业市场。它也说明,模型实验室和企业愿意为基于人工反馈的分析付费,以提升后训练效果并更有效地比较模型。
Arena 表示,在推出商业业务仅八个月后,公司已经达到 1 亿美元的年化运行收入。Arena 最广为人知的产品是其众包 AI 模型排行榜,这个排行榜基于超过 1000 万次用户评测生成。用户在消费端网站上输入一个提示词后,系统会把同一提示发给两个模型,再由用户选择哪个回答更好。公开排行榜本身仍然免费,但公司从 9 月开始通过名为 AI Evaluations 的产品开始商业化。该服务面向模型实验室和企业,提供基于社区真实反馈的更深入性能分析。首席执行官 Anastasios Angelopoulos 表示,很多人仍把 Arena 当成开源项目,因此并不知道它已经在产生可观收入。
他还解释说,公司所谓的 ARR 是按使用量计费的结果,并不是传统订阅模式下的经常性收入。Arena 说自己没有直接竞争对手,因为另一家众包模型选择初创公司 Yupp 已在 3 月关闭。Angelopoulos 认为,Arena 实际上是在与 Mercor、Surge 和 Scale AI 等人工标注公司争夺同一笔预算,这些公司帮助模型开发者在后训练阶段提升模型表现。除了文本和代码,Arena 还覆盖视觉、图像生成以及通过 Agent Mode 实现的更复杂长流程任务。Arena 由 Anastasios Angelopoulos 和同为加州大学伯克利分校博士后的 Wei-Lin Chiang 共同创办,Ion Stoica 在公司于 2025 年 4 月注册成立前一直提供顾问支持。公司迄今已融资 2.5 亿美元,投资方包括 Felicis、Andreessen Horowitz、The House Fund、LDVP、Kleiner Perkins、Lightspeed Venture Partners、Laude Ventures 和 UC Investments。
Arena 的公开排行榜仍然免费,数据来自超过 1000 万次用户评测;用户会把两个模型并排比较,然后选择表现更好的一个。公司表示其收费方式是按使用量计费,而不是传统意义上的可重复订阅型 ARR,因此它现在与 Mercor、Surge、Scale AI 等人工标注公司争夺同一类预算。
The Decoder

《洛杉矶时报》的一项调查发现,美国对伊朗一所学校的导弹打击与 AI 赋能的定目标系统有关,而一名分析员早先写下“该地点已变成学校”的关键备注却从未进入官方目标数据库。报道还称,美军此前已将 Anthropic 的 Claude 接入 Palantir 的 Maven Smart System,并在行动第一天帮助建议了大约 1,000 个目标。
这一案例表明,AI 可以加快致命决策,但并不能自动修复底层数据问题;当军方数据库陈旧或彼此不连通时,风险会被进一步放大。它也让人必须重新审视人工监督、目标审查以及防务 AI 系统是否能够被用于生死攸关的行动。
《洛杉矶时报》的一篇报道指出,美国军方在 2 月底对伊朗一所学校的导弹打击,暴露出目标情报处理流程中非常严重的缺陷。此次袭击造成约 120 名儿童死亡,而调查人员认为,一条被遗漏的分析员备注和彼此不连通的数据库,是这次失败的核心原因。几年前,美国一名分析员注意到伊朗东南部米纳布的一处建筑发生变化;这处建筑此前被列为伊朗海军军事设施,但到那时已经变成一所小学。该分析员在 2019 年使用一个数字情报工具记录了这一变化,但这个工具并未接入军方用于生成打击目标的官方数据库,因此信息从未传到指挥官那里。该建筑随后被多次审查,但始终没有人更新权威记录。报道还称,审查时使用的影像已有七年之久,而且至少有两个情报数据库至今仍未与目标数据库连接。
这个名为 MIDB 的数据库起源于 20 世纪 80 年代,仍然高度依赖人工录入,而其替代系统 MARS 又比计划晚了很多年。与这种陈旧基础设施形成鲜明对比的是 AI 赋能定目标的速度,包括据称将 Anthropic 的 Claude 接入 Palantir 的 Maven Smart System,并在战役最初几天帮助建议了数千个目标。文章认为,AI 被用来解决的是底层数据系统碎片化和失灵的问题,但这些问题本身并没有被修复。报道还提到,一些专家希望通过更多自动化来减少错误,例如把公共服务如 Google Maps 纳入交叉核对;而在这篇报道发表后,五角大楼也推进了新的 agentic AI 计划。按照现行作战原则,指挥官必须区分军事目标和民用对象,此外还有一个可选的目标审查流程,用来核实底层情报是否准确,但目前尚不清楚在对伊朗的打击前是否启动了这一流程。报道最后引述了退役空军三星中将 Jack Shanahan 的批评,他曾主导 Project Maven 和后来的联合人工智能中心,这意味着连军事 AI 采纳的推动者之一,也在对当前系统的失效发出警告。
调查人员将这次失误追溯到至少两个情报数据库,它们从未与权威目标数据库 MIDB 连接,而 MIDB 仍高度依赖人工录入,原本计划由严重延期的 MARS 系统取代。报道还称,用于审查的影像据说已有七年之久,美国政府问责局早在 2020 年就已就这些缺陷发出过长期警告。
The Decoder

Mozilla 的 GenAI 漏洞赏金平台 0DIN 的研究人员发现,一个看起来正常的 GitHub 仓库,只要被 Claude Code 这类 AI 编程工具打开,就可能入侵开发者的机器。该攻击结合了间接提示注入和在运行时从 DNS 获取并执行命令的安装脚本,使恶意代码不出现在仓库中也能拿到反向 Shell。
这说明 AI 编程代理不只是提效工具,也可能成为新的攻击面,尤其是在它们会自动执行来自不受信任仓库的安装指令时。其影响很严重,因为它可能泄露 API 密钥、登录凭据,并让攻击者获得长期控制权。
Mozilla 的 GenAI 漏洞赏金平台 0DIN 的安全研究人员发现了一种针对使用 AI 编程工具的开发者的新攻击方式。攻击从一个看起来很普通的 GitHub 仓库开始,其中包含了会被代理信任的安装说明。Claude Code 在安装过程中遇到常见错误后,会自动运行仓库里的脚本,而不会先要求人工确认。这个脚本随后会在运行时从一个 DNS 记录中取回命令并执行,因此恶意载荷并不直接存在于仓库中。
研究人员表示,这会在受害者机器上建立反向 Shell,让攻击者直接进入系统。随后,攻击者可以窃取 API 密钥、登录凭据,并保持持续访问。文章指出,只要在招聘信息、教程或 Slack 消息里发一个仓库链接,就可能足以让任何用 AI 编程工具打开它的人中招。研究人员给出的防御建议很直接:AI 代理在执行安装脚本前应先展示脚本内容,而开发者也应把第三方仓库的安装说明视为不可信代码。
恶意行为被隐藏在多层跳转之后:Claude Code 遇到常见错误后会自动运行仓库的安装脚本,而脚本又会在运行时从 DNS 记录中取回命令。由于载荷根本不存放在仓库里,扫描器、代码审查和 AI 代理在执行前都可能看不到它。
The Verge AI

参议员伊丽莎白·沃伦和众议员玛丽·盖·斯坎伦计划在未来几周推出更新版《健康和位置数据保护法》。修订后的法案将禁止公司把美国人的健康和位置信息出售给数据经纪人,其中也包括人们输入到 ChatGPT 或 Claude 等 AI 聊天机器人里的敏感数据。
这项提案出台之际,AI 产品正鼓励用户上传病历等高度私密的信息,因此它将强化隐私保护。若法案通过,可能会重塑 AI 公司、数据经纪人以及医疗类工具在收集、保存和变现敏感数据方面的做法。
美国立法者正准备推出《健康和位置数据保护法》的新版本,以更好地适应 AI 时代。该法案由参议员伊丽莎白·沃伦和众议员玛丽·盖·斯坎伦牵头,参议员罗恩·怀登和伯尼·桑德斯也是共同发起人。根据提案,公司将被禁止把美国人的健康和位置信息出售给数据经纪人。法案还明确把人们向 ChatGPT 或 Claude 等 AI 系统透露的信息纳入管辖范围。新版法案是在 2022 年版本基础上扩展而来,旧版主要针对数据经纪人收集和出售健康、位置数据的行为。新的做法还覆盖了向数据经纪人出售此类数据的其他公司,这反映出 AI 产品现在越来越多地鼓励用户提交敏感医疗信息。
报道指出,这一时点正值一波 AI 医疗相关产品推出之后,包括埃隆·马斯克公开呼吁用户把病历上传到 Grok,以及 OpenAI 推出 ChatGPT Health 和 ChatGPT for Healthcare。Anthropic 也推出了 Claude for Healthcare,并称其对个人、医疗提供者和医院“符合 HIPAA 要求”。文章提到,用户目前在很大程度上依赖公司在隐私政策和服务条款中的承诺,而美国至今仍缺乏全面的联邦隐私框架。按照该法案,FTC 必须在 180 天内制定实施规则,FTC、州总检察长以及受影响个人都可以执法起诉。提案还计划在未来 10 年为 FTC 提供 10 亿美元,用于执法支持。沃伦表示,数据经纪人从出售美国人最敏感的信息中攫取巨额利润,因此有必要阻止这些健康数据被最高出价者利用。
2022 年的旧版法案主要针对数据经纪人,禁止其收集和出售健康与位置信息,而新版则把限制范围扩大到向数据经纪人出售此类数据的其他公司。法案还要求 FTC 在 180 天内制定规则,并允许 FTC、州总检察长和受影响个人提起诉讼,同时在 10 年内为 FTC 提供 10 亿美元执法资金。
Hugging Face Blog

AllenAI 提出了 DiScoFormer,这是一种 transformer 模型,只需一次前向传播就能从一组数据点中同时估计密度和 score。文章称,该模型可以跨不同分布工作,利用交叉注意力在任意位置查询,并且能够在推理时借助无标签的一致性损失进行自适应。
这很重要,因为密度和 score 估计是 diffusion 模型、贝叶斯采样以及科学粒子模拟的核心基础。一个同时处理两者的统一模型,可能降低重新训练成本,并提升高维生成任务和科学计算任务的灵活性。
这篇文章把密度估计描述为机器学习和科学计算中的一个通用问题:给定一批样本,重建它们来自的分布。文中解释了密度表示某个区域有多常见,而 score 是对 log-density 求梯度后的结果,它会指向更可能的区域。这样的概念是 diffusion 生成模型的核心,因为这类模型会通过不断沿着 score 方向移动,把随机噪声逐步变成真实样本;它们也用于贝叶斯采样和粒子模拟。文章对比了两类现有方法:kernel density estimation(KDE)实现简单、对分布类型几乎不设限制,但在高维空间里效果会迅速变差;神经网络式的 score-matching 模型在高维下更稳,但通常每遇到一个新分布都要重新训练。DiScoFormer 被提出为一种统一方案:它是一个 transformer,可以在一次前向传播中同时估计密度和 score,而且不需要为不同分布重新训练。
模型使用多层 transformer block 和 cross-attention,因此既能对已有样本位置做估计,也能对任意查询点进行评估。由于密度和 score 之间存在数学关系,作者让两个输出头共享 backbone,并把两者之间的差异作为一种无标签的一致性损失。推理阶段,模型还能在保持上下文不变的情况下,对这个一致性损失做几步梯度更新,从而对分布外输入进行即时适配。文章还指出,attention 在数学上与 KDE 有紧密联系,单个 attention head 就能近似高斯核,因此 KDE 可以看作这种 transformer 形式的特例。训练时,作者为每个 batch 采样一个新的 Gaussian Mixture Model,以便同时获得精确的密度和 score 监督,并让模型接触到近乎无限多的目标分布。
文章认为,attention 可以推广 kernel density estimation,甚至从理论上说明单个 attention head 能近似高斯核。DiScoFormer 采用共享的 transformer 主干和两个输出头——一个预测密度,一个预测 score——并使用 Gaussian Mixture Models 训练,因为它们能提供精确的密度与 score 监督信号。
Import AI

Import AI 463 重点介绍了 ENPIRE,这是 NVIDIA 提出的一个研究框架,让实体机器人能够运行实验、评估、重置和策略改进的闭环。该通讯还提到了一些灵巧操作任务测试,前沿编码智能体据称在多个真实机器人基准上取得了很高的成功率。
这一想法很重要,因为它把类似 AI 智能体的自我改进机制从软件带到了物理世界,让机器人能够通过自身试验不断学习。如果这种方法能够扩展,它可能减少机器人训练中的人工劳动,并加速通用机器人操作能力的发展。
Import AI 463 将 NVIDIA 的 ENPIRE 描述为一种尝试,把 AI 智能体的自主实验闭环带入机器人领域。该框架被呈现为一个协调实体机器人反复试验、评估、重置和改进的支架系统。文章称,ENPIRE 由四个部分组成:Environment、Policy Improvement、Rollout 和 Evolution。Environment 负责自动重置和验证,Policy Improvement 启动策略优化,Rollout 使用一个或多个机器人并行评估策略,而 Evolution 则让编码智能体检查日志、查阅文献,并改进训练基础设施和代码。通讯指出,这种结构把机器人学习转化为一种可控的优化过程,从而减少人工投入,并允许对不同训练方案和智能体变体进行公平对比。
文章还强调,自动评分和自动场景重置至关重要,因为这两项工作过去通常都需要大量人工参与。从硬件上看,该系统使用两只固定双臂配置的 YAM 机械臂、多个摄像头,以及一台运行站点代理、FastAPI 服务器、策略推理和 NVIDIA RTX 5090 的工作站。文章称,前沿编码智能体已经能够在多个灵巧操作任务上自主达到 99% 的成功率,包括 PushT、把针整理进针盒,以及用切刀切断扎带,并且还提到一个把 GPU 插入主板的任务作为额外测试。文章同时报告说,更大的多智能体配置往往能更快找到高分方案,有时最终得分也高于单智能体配置,但不同模型家族之间的能力差异仍然明显。文章最后指出,系统仍面临一个重要挑战:当智能体阅读日志、编写代码、调试或等待语言模型后端时,机器人硬件经常无法得到充分利用。
ENPIRE 被描述为包含四个模块:Environment 用于自动重置和验证,Policy Improvement 用于改进策略,Rollout 用于用单个或多个机器人并行评估策略,Evolution 用于通过代码和文献分析来改进系统。该系统使用两只 YAM 机械臂、摄像头和一台搭载 NVIDIA RTX 5090 的工作站,但文章也指出,自动评估和自动重置仍然是限制系统可处理任务复杂度的关键瓶颈。
MIT Technology Review AI

《MIT Technology Review》指出,把AI代理称为“同事”或“员工”会扭曲人们对它们的使用方式。文章引用波士顿大学教授Emma Wiles的研究称,当同样的工作被描述为来自“AI员工”而不是聊天机器人时,参与者发现的错误少了18%。
这篇文章指出了一个实际的UX和职场设计风险:拟人化表述会削弱人的监督,而这恰恰是AI系统最需要监督的时候。随着公司把AI代理部署到办公场景和关键行业,工具的呈现方式会影响责任归属、错误发现和信任水平。
这篇文章警告说,硅谷正在形成一种越来越明显的趋势:把AI代理当作人类同事来对待。文章先举了一个虚构例子,假设公司里来了一个名叫Alex的AI助手,被包装成有职位和职责的“员工”,并追问人们是否会因此改变协作方式。波士顿大学商学院教授Emma Wiles的研究表明,答案是会,而且结果并不好。她发现,当同样的工作被描述为来自一个具备行动能力的“AI员工”而不是聊天机器人时,人们发现的错误少了18%。
文章认为,这不仅是命名问题,更是一种品牌叙事,会改变人们如何判断系统。研究还显示,当参与者认为AI是“员工”时,他们会觉得自己对结果的责任更小,也更可能把可疑输出上报给经理,而不是先自己修正。文章把这一发现放到更大的行业背景中讨论,指出Microsoft、OpenAI、Anthropic和Google最近都推出了面向AI代理团队管理的新工具,而Nvidia首席执行官Jensen Huang等人也谈到过“数字人类”的工作场景。文章最后强调,尽管agentic AI在更复杂任务上确实更强了,但把它称为同事夸大了它的能力,最终可能让人类员工把本该由自己承担的工作做得更差。
Wiles的研究发现,把代理框定为员工会让参与者觉得自己对其输出的责任更小,而且他们将可疑结果上报给经理的概率高出44%,而不是自己先修正。文章还提到,在调查的1,261名经理中,近三分之一表示公司已经把AI代理当作员工来包装,其中23%甚至把它们放进了组织架构图。
TechCrunch AI

由前特斯拉Optimus技术负责人Jay Li创办的机器人手部初创公司Proception,已经与特斯拉就商业秘密诉讼达成和解,相关案件也在本月早些时候被撤销。与此同时,公司宣布完成1100万美元种子轮融资,由First Round Capital领投,Y Combinator和BoxGroup参投。
这笔和解消除了这家专注于人形机器人核心硬件的初创公司面临的重大法律风险,而这一领域正受到投资人和工业客户的高度关注。它也凸显出机器人灵巧手仍然极具难度,尽管各家公司都在竞速推动人形系统商业化。
Jay Li曾担任特斯拉Optimus人形机器人项目的技术负责人。他表示,自己并不建议在创业时被特斯拉起诉,但也认为这段经历让Proception变得更有韧性。去年,特斯拉指控他带走商业秘密以创办这家公司,双方随后经历了数月的法律交锋。最终,双方达成和解,特斯拉在本月早些时候撤回了诉讼,不过特斯拉没有对该报道置评。摆脱这场争议后,Li希望把精力集中在一个更难的工程问题上:让机器人手更像人手一样工作。
周一,Proception宣布完成1100万美元种子轮融资,由First Round Capital领投,Y Combinator和BoxGroup参投。公司同时表示,已经开始向研究人员和机器人公司发运首批高灵巧度机器人手,并向更广泛客户开放订单。Li的目标是让Proception成为其他不愿投入大量时间和资源自研“灵巧操作”的公司所依赖的手部供应商。他认为,当前机器人领域的资金和关注过多流向整机人形系统,而对真正让机械手接近人类手部能力的投入还不够。Proception的方案核心是一种带传感器的手套,它可以在不让机器人参与流程的情况下采集人手交互数据,而且同一手套还会作为其机械手的传感器“皮肤”。
Proception表示,其机械手具有22个自由度,每根手指都有多个关节,目前正向研究人员和机器人公司发运首批高灵巧度机器人手。Li认为,公司带传感器的手套可以在不把机器人放进流程中的情况下采集人手交互数据,他称这比依赖遥操作的数据收集方式更具可扩展性。
The Decoder

据报道,亚马逊工程师正在把 Anthropic 的模型蒸馏成更小的内部模型,以便在明年新的按 token 计费方案生效前降低成本。报道称,亚马逊拥有这样做的权限,同时公司也在探索 OpenAI 和自家的 Nova 模型等替代方案。
这表明一家大型 AI 采购方正在在计费方式从按算力小时转向按 token 之后,努力控制推理成本,因为这会显著改变大规模使用大模型的费用。它也说明模型蒸馏正成为云厂商和企业用户的一种现实策略:在不承担前沿模型高昂价格的情况下,尽量获得接近的能力。
据报道,亚马逊正在推进一项计划:把 Anthropic 的模型蒸馏成更小、成本更低的内部系统,以应对双方合作关系中的计费变化。The Information 称,一些亚马逊工程师已经在做这件事,因为他们担心新的安排会让成本上升。模型蒸馏的意思是让小模型学习大模型的输出,从而在尽量保留能力的同时降低推理成本。知情人士表示,亚马逊拥有把 Anthropic 模型用于这一目的的权利,这种安排被拿来类比苹果与 Google Gemini 的合作。亚马逊确实在 Bedrock 云平台上提供蒸馏服务,但 Claude 并不在该平台上开放,目前只支持亚马逊自己的 Nova 模型和 Meta 的 Llama 模型。
报道称,这项工作与亚马逊和 Anthropic 之间的合作重新谈判有关,从明年开始,亚马逊将按处理的 token 数量付费,而不是按算力小时付费。这样的变化在使用量上升时可能会显著推高成本,尽管亚马逊发言人表示,扩大的合作不会增加成本。Anthropic 则强调,其模型的定价与性能表现相比仍然更具吸引力。报道还说,亚马逊正在考虑 OpenAI 和自家的 Nova 模型等替代方案,而且今年亚马逊对 Anthropic 和 OpenAI 的投资分别最高可达 250 亿美元和 500 亿美元。
据报道,亚马逊拥有蒸馏 Anthropic 模型的权利,这一点类似于苹果与 Google Gemini 的安排。Bedrock 提供蒸馏服务,但 Anthropic 的 Claude 模型并不在该平台上提供;目前仅支持亚马逊自家的 Nova 模型和 Meta 的 Llama 模型。
The Decoder

文章称,美国已经阻止或延迟了欧洲用户获取 OpenAI 和 Anthropic 最新 AI 模型的权限,这加剧了欧洲对美国政策决定的依赖担忧。奥地利数字化国务秘书 Alexander Pröll 随后提出,应该把 Anthropic 的总部迁到欧盟。
这则消息凸显了欧洲获取前沿 AI 的能力可能被华盛顿的决定所左右,从而引发对主权、竞争和数字韧性的担忧。它关系到依赖这些模型开展产品、研究和基础设施规划的欧洲政府与企业。
文章认为,欧洲对美国 AI 供应商的依赖在美国政府阻止或延迟部分 OpenAI 和 Anthropic 最新模型向外国人开放后变得更加明显。作者指出,这件事说明,欧洲获取最前沿 AI 的能力,可能取决于华盛顿少数几位政策制定者的决定。奥地利数字化国务秘书 Alexander Pröll 随后致信欧盟技术主权事务专员 Henna Virkkunen,称欧盟 4.5 亿人口的单一市场在一夜之间被切断了前沿创新。Pröll 还在 LinkedIn 和媒体引用的信件中提出,欧洲应通过提供法律确定性、市场准入和资本来吸引 Anthropic,并把这一设想建立在欧洲价值观之上。文章说,他尤其看重 Anthropic 对 AI 安全的强调,认为这家公司在欧洲会“获得自由”。
不过,文章也把这一设想描述为不现实,并认为欧盟委员会不太可能真正推进。文章进一步指出,欧洲的依赖并不是最近才形成的,而是多年数字政策失误累积的结果。除了 Anthropic 方案,文章还提到中国模型可能被视为替代选项,但这只会把一种依赖换成另一种依赖。文中引用 AI 投资人 Xiaoyin Qu 的观点称,欧洲公司可以把中国模型部署在自己的 GPU 上,并用自己的数据进行微调,但她也警告说,如果中国开源模型不断扩大市场份额,并针对华为芯片而非 Nvidia 优化,可能会带来更广泛的战略后果。
Pröll 认为,自己不生产、只能经许可使用的技术就是一种依赖,并表示欧洲应向 Anthropic 提供法律确定性、市场准入和资本。文章还指出,这一提议不太可能被欧盟委员会采纳,而且改用中国模型也只是把一种依赖换成另一种依赖。
The Decoder

Meta 已经限制工程师使用 Anthropic 的 Claude Code 和 OpenAI 的 Codex,防止这些工具的输出进入 Meta 自己的训练数据。根据《The Information》引用的内部文件,Meta 甚至曾暂时停止使用这些模型开展部分工作。
这表明大型 AI 实验室正在把训练数据污染和模型蒸馏风险视为严肃的竞争威胁。它也说明 Meta 正在推动减少对外部 AI 系统的依赖,同时打造自己的编程助手并控制成本。
Meta 正在限制工程师使用 Anthropic 的 Claude Code 和 OpenAI 的 Codex,以防这些竞争对手模型的输出进入自己的训练数据。根据《The Information》披露的内部文件,Meta 甚至曾暂时停止涉及这些系统的部分工作。公司担心的是“蒸馏”,也就是通过模型输出或衍生数据,把一个模型的能力未经授权地转移到另一个模型中。内部备忘录警告说,如果合作方模型的输出泄漏进 Meta 的训练数据,可能会引发与这些公司的严重争端。
此举与 Meta 正在打造自己的编程助手 MetaCode 有关,公司希望减少对外部 AI 工具的依赖。另一个原因是成本压力:一份内部备忘录称,Meta 今年仅内部 AI 使用就可能花费数十亿美元。Meta 的政策禁止工程师使用 AI 输出来生成测试任务或进行代码分析,并且仍然要求人工审核。更大的背景是,模型蒸馏正在整个行业引发摩擦,例如 Anthropic 曾指责 Alibaba 进行大规模蒸馏攻击,而 Elon Musk 也承认 xAI 曾部分蒸馏 OpenAI 的模型。
据报道,Meta 的政策禁止工程师使用 AI 输出来创建测试任务或进行代码分析,而且仍然需要人工审核。其核心担忧是,竞争对手模型的输出可能泄露到 Meta 的数据中,从而引发有关未经授权蒸馏的争议。
The Decoder

据报道,德勤在一次内部全员大会上告诉顾问,AI将严重侵蚀传统的按小时计费模式。德勤美国公共部门咨询业务负责人Jason Manstof展示了一张预测图,显示到2035年,按工时收费的咨询工作将大幅萎缩,而AI agent在专业服务中的占比会显著上升。
这直接表明,AI正在冲击咨询业最核心的商业模式之一,而不仅仅是工作流程。若行业转向固定价格或按结果付费,客户、咨询顾问和竞争对手都将面临新的激励机制、利润结构和风险分担方式。
据报道,德勤一次内部全员大会向顾问们传递了一个明确的信息:AI正在对传统的“按工时收费”模式形成巨大压力。消息核心来自德勤美国公共部门咨询业务负责人Jason Manstof,他展示了一张预测图,显示到2035年,按小时计费的咨询工作将大幅缩水。按照这份预测,AI agent会快速增长,并在不断扩大的专业服务市场中占据大多数份额。这个前景让部分员工感到不安,一名顾问对《华尔街日报》表示,公司的模式“基本没救了”,大家几乎是在被机器人取代。德勤则回应称,公司正在进行大规模投入,以引领行业向“人类主导、AI驱动”的转型。
更大的行业背景是,咨询公司正在尝试摆脱纯时间计费,转向固定价格、订阅制和按结果付费等模式。文章指出,这种转型并不容易,因为项目一旦超时,咨询公司就可能自行承担成本,而且“结果”如何定义也容易引发争议。麦肯锡和波士顿咨询公司也在更积极地推进按结果付费模式,而《华尔街日报》报道称,麦肯锡全球收入中已有30%以上来自这类模式。AI咨询平台Catalant的CEO Pat Petitti则把这种变化描述为一场生存层面的收入模式竞赛,并称AI正在摧毁咨询业的商业模式。
据《华尔街日报》转述,Manstof的核心意思是,到了2035年,按小时计费的工作仍会存在,但只会成为市场中更小的一部分,而AI agent将成为增长的主导力量。文章还指出,按结果付费在理论上很有吸引力,但执行风险很高,例如项目超时、现金流不稳定,以及对“成功”标准的争议。
OpenAI News
OpenAI 发布了一份报告,分析 AI 可能如何重塑欧盟各地的工作岗位。报告区分了更可能被自动化、扩张或通过 AI 工作流发生变化的职业。
这份报告有助于政策制定者、雇主和劳动者理解 AI 普及可能给劳动力市场带来的压力点。它尤其适用于欧盟在技能再培训、岗位转换和行业层面的劳动力规划。
OpenAI 发布了一份新报告,分析 AI 可能如何影响欧盟范围内的就业。报告把职位分成几类:更可能被自动化的岗位、可能扩张的岗位,以及会因 AI 工作流而改变任务内容的岗位。它并不是一次新模型发布,也不是技术基准测试结果,而是一份劳动力市场分析。报告的目标是帮助人们识别 AI 普及后哪些工作领域最容易发生变化。
对于欧盟的政策制定者、雇主和劳动者来说,这类信息有助于理解潜在的岗位转型压力和机会。随着 AI 越来越多地嵌入日常业务流程,这种分析也能为再培训和岗位调整提供参考。整体来看,这份报告延续了关于自动化、技能重塑以及 AI 对不同职业影响不均衡的更广泛讨论。
这份内容更像是职业影响映射与分析报告,而不是产品发布或技术模型更新。它关注的是职业对 AI 工作流的暴露程度,因此价值主要在于劳动力市场解读,而不是基准测试或新模型能力。
TechCrunch AI

Cursor 于周一发布了 Cursor Mobile,这是一款允许用户通过手机启动和管理编码代理的新应用。它接入了 Cursor 在 10 月推出的 2.0 版本代理工作流,用户可以创建新的代理,也可以继续与桌面端发起的代理互动。
这次发布表明 Cursor 正在顺应向“代理驱动”软件开发转变的趋势,开发者越来越多地转为监督代码编写系统,而不是亲自逐行编写。它也让 Cursor 跟上了 Anthropic 和 OpenAI 已经采用的移动交互方式,使开发者离开办公桌时也能继续使用 AI 编码工具。
Cursor 发布了 Cursor Mobile,这是一款让用户可以通过手机与编码代理交互的新应用。公司在周一宣布了这一消息,并将其定位为对 10 月推出的 Cursor 2.0 变化的延伸,而这些变化已经把产品方向转向独立编码代理。借助这款移动应用,用户既可以直接启动新的代理,也可以继续与桌面客户端中已经发起的代理对话。此次更新紧跟 Anthropic 和 OpenAI 之后,这两家公司也都已经提供了在移动端使用其编码工具的方式。
Cursor 的这一动作也反映出 AI 辅助开发领域的更大趋势,即工具越来越强调对代码编写代理的监督,而不是直接手工编辑代码。文章指出,很多开发者已经不再需要整天盯着大型代码库,因为他们可以通过手机持续与远程代理保持对话。正是这种变化,让移动端成为 AI 编码工作流中的实用入口。Anthropic 的 Claude Code 负责人 Boris Cherny 也提到,他现在大部分编码工作都是在手机上完成的,这说明开发习惯正在快速改变。
Cursor Mobile 的设计重点是提示和管理独立编码代理,而不是在小屏幕上进行传统的手动代码编辑。文章还指出,整个行业正在从大型桌面工作环境转向依赖远程代理,开发者可以通过手机持续对话并进行监督。
TechCrunch AI

TIDAL推出了一项新政策,禁止完全由AI生成的音乐在其平台上获得收益。它还将使用自动化工具移除那些冒充某位艺人或团体的曲目,并从2026年7月15日起为AI生成曲目标注“AI”徽标。
这一举措表明,主流流媒体平台正在从单纯标注AI音乐,转向主动限制其经济激励。这可能影响AI音乐在创作者经济中的扩散,尤其有助于保护艺人免受冒名顶替和收入被稀释的影响。
TIDAL宣布推出一项针对AI生成音乐的新政策,这使它成为又一家收紧合成内容规则的流媒体服务。根据这项政策,完全由AI生成的曲目将不再允许在平台上获得收益。TIDAL还将部署自动化工具,识别并移除那些试图冒充艺人或团体的AI生成音乐。此外,平台会为完全AI生成的曲目标注“AI”徽标,让听众能够看出自己正在播放的内容。
公司表示,这类曲目将无资格获得版税,也不能进行直接面向粉丝的销售。TIDAL的执行副总裁兼主编Tony Gervino表示,公司的目标是保护并奖励“有机创造力”,而不是反对技术本身。他还提到,许多订阅用户并不希望接触到,或被推荐去听,纯AI生成的音乐。TIDAL将这项政策称为“活文档”,说明它会随着环境变化不断调整,并表示新规则将于2026年7月15日生效。
TIDAL表示,被认定为100%由AI生成的曲目将无法获得变现、版税或直接面向粉丝销售的资格。该公司还把这项政策称为“活文档”,意味着它会随着AI音乐工具和滥用模式的变化而调整。
TechCrunch AI

Omen AI 表示已完成由 Nava Ventures 领投的 3100 万美元 A 轮融资,用于扩展其面向数据中心液冷系统的微型光谱仪监测方案。该设备可实时发现细菌增长等冷却液异常,帮助避免机架停机。
随着 AI 基础设施推动数据中心向更高功率密度和更高温度运行,冷却液健康状况已经直接影响可用性和成本。更好的实时监测有望减少昂贵的清洗操作、避免停机,并让运营方更清楚地了解这个常常“黑盒化”的环节。
Omen AI 正在试图解决 AI 热潮带来的一个运维问题:液冷数据中心希望让芯片跑得更热、更密集,但这会增加冷却回路中的污染风险。液冷介质通常是水和抑菌添加剂的混合物,把水的比例调高可以提升吸热能力,但也更容易滋生细菌。等污染严重后,运营方往往需要冲洗系统,而这可能导致一个机架停机五到六个小时,代价高达数百万美元。为了解决这个问题,Omen 设计了一种微型光谱仪,可以连续监测流体健康,而不是依赖周期性的实验室检测。首席执行官兼创始人 Zach Laberge 表示,其目标是通过让运营方直接看到系统内部的化学变化,来避免高昂的停机损失。公司宣布完成 3100 万美元 A 轮融资,由 Nava Ventures 领投,CRV、Vanderbilt University、Mann+Hummel、Starhill Holdings、Hard Launch Capital,以及来自 Bridgestone、GM、Johnson Controls 和 TensorWave 的高管个人投资共同参与。
Omen 自 2024 年成立以来累计融资已达 4000 万美元,目前已与大约十几家数据中心客户合作,其中包括正在用 AMD 芯片建设 AI 计算云的 TensorWave。Laberge 最初是在另一家面向工程机械传感器的创业项目之后创办 Omen 的,而团队发现同样的流体监测思路不仅能识别细菌增长,还能通过铜、铬和硅等信号判断泵、部件或密封件是否磨损。Omen 早期的客户线索来自 Caterpillar 经销商,这也让团队意识到建筑和数据中心里存在大量可监测的流体系统。与此同时,Omen 并不是唯一进入这一领域的公司,Pyxis 也在最近推出了面向数据中心冷却液的监测产品。TechCrunch 指出,近期光学硬件和信号处理软件的进步,让这种本地化分析在规模化部署上变得更可行。
Omen 表示,该系统可帮助运营方调整液冷系统中的水和添加剂配比,同时避免细菌污染造成流道堵塞。该公司还会监测铜、铬和硅等 संकेत物,用于判断泵、泵部件或密封件是否出现磨损;自 2024 年成立以来累计融资已达 4000 万美元。