AI 日报

AI 基础设施、开源模型与监管博弈并进:6·19 日报

今天的主线很清晰:AI 竞争已不只在模型能力本身,而是延伸到算力、基础设施、人才、政策与安全边界。开源大模型、推理基础设施融资、电网并网提速,以及围绕模型下线和监管的争议,共同勾勒出一个更激烈也更受约束的行业。

当天导读

从 65 条资讯中筛选出 28 条

今天的主线很清晰:AI 竞争已不只在模型能力本身,而是延伸到算力、基础设施、人才、政策与安全边界。开源大模型、推理基础设施融资、电网并网提速,以及围绕模型下线和监管的争议,共同勾勒出一个更激烈也更受约束的行业。

GLM-5.2 把开权重模型推向更大规模

Z.ai 发布的 GLM-5.2 以 MIT 许可证开放,结合了 753B 参数、MoE 架构和 100 万 token 上下文,显示开权重阵营仍在快速拉高能力上限,但推理成本也更高。[2613]

AI 基础设施竞争从芯片打到电网

Baseten 的大额融资、AWS 可能外售 Trainium,以及 FERC 为数据中心并网开绿灯,说明 AI 产业链的瓶颈正在从模型扩展到算力、供电和接入规则。[2617, 2619, 2612]

OpenAI 的战略重心同时指向研究、医疗与上市

Shazeer 与 Dean Ball 的加入,叠加 ChatGPT 健康能力升级和罕见病诊断成果,显示 OpenAI 正在把产品能力、政策布局与临床应用同步推进。[2618, 2611, 2622, 2616]

AI 代理安全成为新监管焦点

DeepMind 将 AI 代理视作潜在内部威胁,Anthropic 则在出口管制和安全争议下被迫下线模型,表明“谁能访问模型、谁来控制代理”正成为核心问题。[2624, 2623, 2627]

创意、医疗与硬件正在被 AI 重新定义

Adobe 把代理能力嵌入创作流程,Nature 研究强化医疗 AI 的临床想象,而 Midjourney 甚至开始进入超声扫描硬件,AI 正迅速跨出软件边界。[2631, 2638, 2625, 2639]

AI 财富分配开始进入政治主战场

从 Sanders 的主权财富基金提案到 Guardrails Alliance 的 PAC 对抗,AI 监管、税收和公共收益分配已从政策讨论升级为选举与游说战。[2628, 2630, 2633]

今日焦点

AI 行业今天呈现出两个同时发生的趋势:一边是模型、工具和基础设施继续快速扩张,另一边是政策、国家安全和成本压力开始更直接地塑造产品可用性与商业模式。

1. 超大开权重模型继续刷新门槛

最受关注的发布来自 Z.ai 的 GLM-5.2:这是一个 MIT 许可证的纯文本开权重模型,采用 MoE 架构,拥有 753B 总参数、40B 激活参数,并支持 100 万 token 上下文。它在独立基准中被视为领先的开权重模型,但代价是 token 消耗偏高。[2613]

这类发布意味着,开源/开权重阵营正在追赶最前沿能力,同时也把“更大上下文、更多算力、更高推理成本”推到台前。

2. AI 基础设施:算力、推理和电网一起变紧俏

Baseten 据报接近以 130 亿美元估值融资 15 亿美元,继续印证推理基础设施是资本最热的下注方向之一。[2617]

与此同时,AWS 也在考虑把 Trainium 芯片卖给第三方客户,这会让自研 AI 芯片从内部替代方案进一步变成更直接的市场竞争者。[2619]

基础设施不只在芯片层面扩张,电力与并网也在加速。FERC 要求电网运营商更快处理数据中心并网申请,并考虑替代输电技术与更灵活的表后供电方案。[2612] 这说明 AI 需求已经开始反向塑造公共基础设施规则。

3. 人才与平台战略围绕 OpenAI 再洗牌

OpenAI 正在引入重量级人才,包括 Transformer 共同作者 Noam Shazeer 与政策人物 Dean Ball。[2618][2611] 这不仅是研发补强,也是在为上市前的产品、治理与政策布局做准备。

与此同时,OpenAI 还升级了 ChatGPT 的健康问答能力,并称新模型在部分健康基准上接近甚至超过医生撰写答案。[2622] 另有报告称,OpenAI 的推理模型帮助医生为罕见儿童遗传病新增了 18 个诊断。[2616]

4. 安全、治理与地缘政治继续压缩模型边界

Anthropic 相关报道显示,模型访问权限已深度卷入国家安全与出口管制争议:美国官员、合作伙伴安全发现与模型下线交织在一起,Fable 5 与 Mythos 的可用性因此受到影响。[2623][2627]

Google DeepMind 则提出把高级 AI 代理当作潜在“内部威胁”来管理,强调先验证、后放权,并用更强的监控与控制框架约束代理行为。[2624] 另一边,Cloudflare 则从工程实践角度强调:企业安全系统应该“模型无关”,以便持续替换模型而不重建流程。[2629]

5. AI 正快速外溢到医疗、创意与消费硬件

Nature 的两项研究显示,专门化医疗 AI 在模拟诊断与治疗任务中已可与医生比肩,但也暴露出底层模型老化的问题。[2625]

Adobe 继续把 AI 代理嵌入 Creative Cloud 和 Firefly,希望把创意软件变成可协作、可自动化的多步骤工作流平台。[2631][2638] Midjourney 则更进一步,开始向全身超声扫描硬件和健康监测场景延伸。[2639]

6. 政策与资本开始围绕“AI 财富怎么分”展开争论

Bernie Sanders 提出对大型 AI 公司征税并建立主权财富基金的方案,试图把 AI 收益更直接地返还给公众。[2628] 与此同时,Guardrails Alliance 等新 PAC 正在与大科技资金展开更直接的 AI 立法攻防。[2630]

这意味着,AI 的下一阶段争夺不仅是性能和市场份额,还包括税收、监管、劳工与公共利益的重新分配。

7. 产业外部性正在回到公司内部

Amazon 工程师因在西雅图市议会支持限制数据中心而称遭到报复,相关投诉已经提交。[2632] 这起事件把 AI 时代最现实的矛盾之一摆上台面:数据中心扩张、社区利益与员工表达权正在正面冲突。

今日结论

今天的新闻说明,AI 行业已经进入“系统性竞争”阶段:模型本身仍重要,但真正决定胜负的,越来越是算力供给、基础设施接入、人才流动、合规边界,以及谁能为巨额成本找到可持续的商业模式。[2613][2617][2612][2624][2628]

当日精选 8 条

01

Simon Willison

GLM-5.2 作为超大开权重文本模型发布

·#llm

GLM-5.2 作为超大开权重文本模型发布

Z.ai 在 6 月 16 日以 MIT 许可证公开发布了 GLM-5.2,此前它在 6 月 13 日先向 coding plan 订阅者开放。该模型是纯文本模型,采用 Mixture of Experts 结构,总参数量为 753B、激活参数为 40B,并支持 100 万 token 的上下文窗口。

这是一次重要的开权重发布,因为它把超大规模、宽松许可证和超长上下文结合在了一起。它可能会影响构建编程工具、长文档处理系统以及其他需要强开源可用模型而不想依赖闭源 API 的开发者。

中国 AI 实验室 Z.ai 在 6 月 13 日先向 coding plan 订阅者开放了 GLM-5.2,随后又在 6 月 16 日以 MIT 许可证正式公开了完整权重。文中把它描述为一个 7530 亿参数、体积达到 1.51TB 的开权重模型,并采用 Mixture of Experts 架构,其中只有 40 个参数处于激活状态。它是纯文本模型,不像 Z.ai 另一条视觉模型线那样支持图像输入;后者最近的代表是 GLM-5V-Turbo,但并不是开权重。GLM-5.2 还把上下文窗口扩大到了 100 万 token,相比 GLM-5.1 的 20 万 token 有明显提升。独立基准测试带来了很高关注度:Artificial Analysis 认为它在 Intelligence Index v4.1 上是领先的开权重模型。

与此同时,该测试也指出它的 token 消耗偏高,每个任务使用的输出 token 多于其他领先开权重模型。它还在 Code Arena WebDev 排行榜上位列第二,这个榜单衡量的是前端网页开发与 agentic coding 工作流。文章作者 Simon Willison 通过 OpenRouter 测试了它,发现多个供应商的定价相对便宜,明显低于一些顶级闭源模型。作者还提到,这个模型在“鹈鹕骑自行车”的 SVG 提示词上表现很出色,但在“NORTH VIRGINIA OPOSSUM ON AN E-SCOOTER”这个提示词上就逊色很多。

Artificial Analysis 表示,GLM-5.2 在 Intelligence Index v4.1 上是领先的开权重模型,但也指出它相比其他顶级模型更耗 token。Z.ai 另有独立的视觉模型系列,但这次公开的是纯文本模型;尽管如此,它在前端网页开发排行榜上的表现仍然很强。

查看单篇正文查看原文
02

Ars Technica AI

台湾扩大无人机军备与出口

·#drones

台湾扩大无人机军备与出口

台湾国防部已提出一项为期六年、总额66亿美元的特别预算,计划在2026年至2031年间采购台湾制造的无人机和无人水面舰艇。该计划将新增超过20.8万架海岸攻击无人机、1400多架海岸侦察无人机以及1320艘无人水面舰艇。

这项扩充旨在加强台湾面对潜在中国入侵时的非对称防御,大量低成本无人机可能有助于威慑或延缓攻击。同时,这也为台湾无人机产业提供了巨大的本土订单,并推动其向美国军方和其他海外买家出口。

随着对中国紧张局势持续升高,台湾正在同时加快军用无人机建设和无人机出口业务。台湾政府一方面推动军用无人机的本土化生产,另一方面也鼓励民众参加无人机飞行训练。根据台湾中央社报道,国防部在6月18日提出一项为期六年、总额66亿美元的特别预算,用于采购台湾制造的无人机。该采购方案计划在2026年至2031年之间购买超过20.8万架海岸攻击无人机、1400多架海岸侦察无人机,以及1320艘无人水面舰艇。相比之下,台湾现有的攻击无人机数量只有约5000架,规模包括美国制造和本土生产的型号,因此这次采购将显著扩充战力。文章指出,台湾军队已经在演练无人机作战方式,包括在6月初的演习中使用Anduril旗下Altius-600游荡弹药无人机,从拖车式发射平台打击海上目标。

台湾海军陆战队今年早些时候也使用台湾制造的无人机,对海上目标实施打击。除了增强国防,这笔支出还可能帮助台湾无人机制造商扩大产能并进入国际市场。Thunder Tiger等公司正在向美国军方和欧洲买家推销无人机和零部件,把自己定位为中国制造产品的替代方案,同时建立海外技术与制造合作。台湾在2026年前三个月已出口1.15亿美元的整机无人机,超过2025年全年9300万美元的出口总额。Thunder Tiger的Overkill无人机去年成为首个进入美国国防部Blue UAS Cleared List的亚洲公司产品,该公司还在生产基于美国LUCAS设计的大型一次性攻击无人机。台湾的中山科学研究院也开发了类似以色列Harpy的单向攻击无人机,而台湾供应商还在向海外客户输出电机、电池、飞控和其他微电子零部件。

台湾目前只有约5000架攻击无人机,包括美国制造和本土产品,因此这次采购将是大规模扩充。文章还指出,台湾企业已经在向美国、欧洲以及与乌克兰相关的供应链提供经过认证的无人机、零部件和制造能力。

查看单篇正文查看原文
03

Hugging Face Blog

基准测试开源模型的智能工具使用

·#llm-agents

基准测试开源模型的智能工具使用

Hugging Face 发布了一篇人工撰写的博客,展示如何用模型自己的工具链来衡量开源模型在智能体式编码任务上的表现,并同时关注任务是否完成以及完成所需的努力。文章以 transformers 为案例,介绍了一个基准测试框架,通过 Hugging Face Jobs 在相同硬件上并行运行模型、库版本和任务。

这很重要,因为智能体式编码正在把软件评估从“是否成功”推进到“智能体是多高效地完成的”,这会直接影响库设计、文档质量和 CLI 易用性。开发者工具和 AI 智能体团队可以借鉴这些思路,让 API 更容易被发现,并衡量一个工具是否真的在帮助智能体,而不是迫使它绕开工具。

这篇博客的核心观点是,编码智能体越来越不是“帮人写代码”,而是在自己与软件交互:它会自己选择库、写调用、运行代码,并在出错后自行调试。也正因为如此,一个库不再只需要正确和快速,还必须让智能体能够高效地驱动它。作者指出,如果 API 很笨重或者文档过时,智能体可能会干脆绕开这个库,重新从头实现逻辑,这会让软件使用变得更复杂、更昂贵。为了研究这一点,他们设计了一个基准测试,不只看智能体是否给出正确答案,还看它为得到答案付出了多少工作量。

文章把 transformers 作为案例,用它来处理文本分类、图像描述和语音转写等机器学习任务。作者介绍了一个运行框架,可以在由 pi coding agent 驱动的开源模型上执行测试,并通过 Hugging Face Jobs 把模型、版本和任务的完整扫描分发到相同硬件上运行,确保比较公平。文章还把这一思路与他们之前对 hf CLI 的重设计联系起来,称那个面向智能体优化的版本让智能体使用的 token 数减少了 1.3–1.8 倍,最高可达 6 倍。最后,作者用情感分类任务举例说明差异:一种智能体会写一段多行 Python 脚本、导入 transformers、调试形状错误并多次重试;另一种则只需调用专门设计的 `transformers classify` 命令,一步就能完成。

这个基准测试是面向工具的,不只看最终输出,还看答案是如何被找到的;它在相同运行环境下比较模型、库版本和任务。作者认为,面向智能体的软件应当可发现、API 清晰、文档充分、示例结构化,并建议为 transformers 采用 CLI、Skill 和独立的任务示例这套方案。

查看单篇正文查看原文
04

OpenAI News

·#ai-in-healthcare

AI帮助诊断罕见儿童遗传病

OpenAI表示,研究人员使用其一款推理模型帮助医生诊断儿童罕见遗传病,并在此前未能解决的病例中新增了18个诊断结果。该报告强调的是模型在真实临床场景中的应用,而不是仅限于实验室基准测试的表现。

罕见病诊断通常耗时、昂贵且令家庭备受煎熬,尤其是在病因属于遗传因素、答案隐藏在复杂临床数据中的情况下。如果推理模型能够可靠地帮助缩小候选基因或变异范围,就有望缩短漫长的诊断过程,并支持医生处理复杂的儿科病例。

OpenAI称,其推理模型被用于帮助医生诊断儿童罕见遗传病。按照公司的说法,这套系统在此前一直未解的病例中促成了18个新的诊断结果。该工作被描述为面向临床医生的辅助工具,而不是完全自动化的诊断替代方案。研究团队在分析这些未解病例之前,先用已经有明确诊断的病例来优化工作流程。

在这一验证阶段中,模型在重复运行时,对51个病例中的48个都找回了正确的基因和变异,覆盖了多种罕见疾病。这个结果被用来增强人们对该方法的信心,然后再把它应用到更困难的诊断任务中。更广泛来看,这表明推理模型可能有助于梳理复杂的遗传和临床证据,尤其是在传统分析没有找到答案的情况下。对于罕见儿童疾病患者家庭而言,即便只是诊断成功率的边际提升,也可能带来治疗决策、遗传咨询以及对病情更清晰的理解。

搜索结果显示,团队首先在已有明确诊断的病例上优化了工作流程,而且该模型在重复运行中对51个病例中的48个病例都找回了正确的基因和变异。这个验证步骤说明系统在用于尚未解决的病例之前,先接受了一致性测试。

查看单篇正文查看原文
05

TechCrunch AI

Baseten 接近以 130 亿美元估值融资 15 亿美元

·#ai-inference

Baseten 接近以 130 亿美元估值融资 15 亿美元

据《华尔街日报》报道,AI 推理初创公司 Baseten 正接近敲定一轮 15 亿美元融资,估值达到 130 亿美元。距离该公司公布 3 亿美元 E 轮、估值 50 亿美元,只过去了 5 个月。

如果这笔交易最终完成,它将凸显投资者对 AI 推理基础设施的强烈追捧,而这已经成为 AI 技术栈中最受关注的层级之一。它也说明,资本仍在迅速流向那些能够让模型以更低成本、更高效率处理实时请求的公司。

Baseten 是一家成立于 2019 年的 AI 推理公司,据报道正接近以 130 亿美元估值完成一轮高达 15 亿美元的融资。这个消息紧随其后的是,该公司仅在 5 个月前刚刚宣布完成 3 亿美元 E 轮融资,当时估值为 50 亿美元。更早之前,Baseten 又是在 9 个月内从 1.5 亿美元 D 轮融资走到那次大额融资的。若这笔新融资按报道条款完成,公司估值将在不到半年内上涨 160%。《华尔街日报》称,这笔交易采用了分层定价的结构,这种做法可以抬高表面估值,同时让主导投资者在账面上看起来更有利。

报道还称,部分投资者将按 130 亿美元估值进入,而另一些投资者则按 110 亿美元估值进入。该轮融资据说由 Spark Capital、Sands Capital、Altimeter Capital 和 Wellington Management 共同领投。Baseten 受益于一些人所说的“推理淘金热”,因为风险投资正大量流入用于承载模型输出的基础设施层。该公司的核心卖点是通过把请求路由到最合适的模型来提升推理速度并降低成本,其中也包括更有性价比的开源替代方案。

《华尔街日报》称,这是一轮分层定价融资,也就是说,部分投资者按 130 亿美元估值进入,另一些则按 110 亿美元估值进入。报道称,这轮融资由 Spark Capital、Sands Capital、Altimeter Capital 和 Wellington Management 共同领投。

查看单篇正文查看原文
06

TechCrunch AI

OpenAI上市前招揽顶级AI与政策人才

·#openai

OpenAI上市前招揽顶级AI与政策人才

据报道,OpenAI正在引入Noam Shazeer和Dean Ball等重要人才。Shazeer曾是Google DeepMind的Gemini联合负责人,也是2017年Transformer论文的共同作者;Ball则表示自己将于7月6日加入OpenAI,领导一个名为Strategic Futures的新团队。

这些任命同时增强了OpenAI在基础AI研究和政府政策方面的实力,而公司又正准备上市。它们也反映出OpenAI、Google、Anthropic和Meta之间日益激烈的人才争夺,因为资深研究员和政策专家会影响产品战略、安全与监管走向。

随着OpenAI越来越接近公开上市,它正在引入两位引人注目的人才:Noam Shazeer和Dean Ball。Shazeer是现代AI领域最知名的研究者之一,他共同撰写了2017年的《Attention Is All You Need》论文,这篇论文提出了Transformer架构,而今天大多数大语言模型都建立在这一架构之上。Shazeer的大部分职业生涯都在Google度过,后来短暂离开并共同创立了Character AI,随后Google又以据称27亿美元的交易将他请回,并获得了该公司的技术。如今,他再次离开Google,报道称他此前担任Gemini联合负责人。报道认为,这一变化是Google、OpenAI、Anthropic和Meta之间顶级人才持续流动的一部分。

文章还提到,Shazeer此前因在内部消息板上就跨性别身份和以色列在加沙战争发表意见而引发争议,不过这些争议是否会影响他的新职位尚不清楚。与此同时,Dean Ball表示他将于7月6日加入OpenAI,领导一个新的Strategic Futures团队。Ball此前曾在白宫参与美国AI行动计划,之后又回到Foundation for American Innovation担任高级研究员。根据Ball的说法,这个新团队将关注前沿AI政策,包括灾难性风险、递归自我改进、劳动力市场影响,以及AI实验室、政府和社会之间的关系。

Shazeer被广泛视为现代生成式AI的重要奠基者之一,因为他共同撰写了提出Transformer架构的《Attention Is All You Need》论文。Ball表示,他领导的团队将关注灾难性风险、递归自我改进、劳动力市场影响,以及前沿实验室、政府和社会之间的关系,并直接向首席战略官Jason Kwon汇报。

查看单篇正文查看原文
07

TechCrunch AI

AWS考虑向第三方出售Trainium芯片

·#ai-chips

AWS考虑向第三方出售Trainium芯片

亚马逊云服务(AWS)据报道正在考虑把自己的Trainium人工智能芯片卖给其他公司,用于他们自己的数据中心。AWS人工智能负责人Peter DeSantis对Bloomberg表示,相关谈判仍处于早期阶段,而公司也向TechCrunch确认,未来有可能向第三方出售整机机架。

如果AWS开始对外销售Trainium,它就会从主要服务内部需求的Nvidia替代方案,变成AI加速器市场里更直接的竞争者。这可能为云客户和企业买家提供另一种重要选择,同时给Nvidia在AI基础设施领域的主导地位带来更大压力。

亚马逊云服务正在考虑更积极地进入Nvidia的地盘,把自己的Trainium人工智能芯片卖给外部公司。AWS人工智能负责人Peter DeSantis对Bloomberg表示,公司正在进行相关谈判,但没有透露潜在买家是谁。TechCrunch指出,这些讨论仍处于早期阶段,不过AWS已经确认,未来把芯片或芯片机架卖给第三方是有可能的。这一想法似乎源自亚马逊CEO Andy Jassy在4月股东信中的表态,他当时说,自研AI芯片的需求高到让他开始考虑出售。Jassy估算,如果芯片业务作为独立业务运营,并同时向AWS和第三方供货,年化收入规模可能达到约500亿美元。

这个数字虽然远达不到Nvidia目前约3260亿美元的收入运行规模,但已经足以成为一家非常大的芯片业务,规模接近Intel的年度收入。AWS过去之所以没有对外卖Trainium,一个重要原因是芯片会带动更多高利润的云服务收入,比如存储、安全、网络和监控。与此同时,公司也表示Trainium产能卖得非常快,甚至下一代Trainium4的产能也已经售罄。报道还指出,如果AWS要向外部客户供货,就必须增加制造能力,可能要依赖TSMC等代工伙伴,否则就会挤占自家云客户的供应。

亚马逊CEO Andy Jassy在4月的股东信中表示,如果芯片业务独立运营,年化收入规模可能达到约500亿美元,并提到当前Trainium产能几乎是一推出就售罄。文章还称,连尚未上市的Trainium4产能也已售罄,这意味着AWS若要对外供货,就必须增加制造能力,否则可能会影响自身客户的供应。

查看单篇正文查看原文
08

TechCrunch AI

FERC加快数据中心电网接入

·#ai-infrastructure

FERC加快数据中心电网接入

美国联邦能源管理委员会(FERC)已要求电网运营商加快处理数据中心等大型用电用户的并网申请。该项一致通过的决定还要求运营商考虑替代输电技术,并对数据中心的表后供电方案更加宽容。

这可能缩短 AI 和云项目获得电网接入的时间,而并网缓慢已成为新数据中心面临的最大瓶颈之一。它也表明联邦监管机构愿意重塑电网规则,以支持 AI 基础设施带来的快速增长的用电需求。

周四,FERC 要求六家主要电网运营商更快处理来自数据中心和其他大型用电用户的并网申请。该机构表示,这些运营商必须证明数据中心能够“及时且有序地”接入输电系统,而且数据中心将承担并网成本。委员会成员一致批准了这些命令。FERC 还指示电网运营商考虑“替代输电技术”,虽然没有点名具体产品,但这一表述可能包括固态变压器或超导输电线路。与此同时,运营商必须在 30 天内提交一份报告,说明他们是否还有可用的备用发电容量;并在 60 天内对本地区电价进行辩护或修订。FERC 还要求运营商对数据中心的表后供电方案更加灵活。表后供电通常更昂贵、也更复杂,但在很多项目无法及时接入电网时,已经成为一种替代方案。尽管这些措施给数据中心开了一条更快的接入通道,但它们并没有解决发电容量短缺这一根本问题。

事实上,问题并不只存在于数据中心,新建电厂也同样卡在漫长的并网队列里;到 2023 年底,电厂并网申请的总容量已经超过现有电厂总装机容量。随着数据中心用电需求预计到 2035 年几乎翻三倍,长期习惯于近乎零增长的电网运营商承受了巨大压力。像 PJM 这样的美国最大电网运营商,甚至已经陷入某种混乱,部分大型公用事业公司还威胁要退出。由于很多地区无法及时并网,科技公司和开发商被迫转向现场供电,但这种方式通常更贵、也更复杂。与此同时,批发电价在一些地区已经比五年前上涨了多达 267%。FERC 之所以介入,是因为能源部长 Chris Wright 在 10 月曾表示,数据中心并网延迟可能削弱美国在 AI 领域的竞争力。如今,这一政策转向发生在公众对 AI 和数据中心态度明显转冷的背景下,同时特朗普政府还宣布向 Invenergy 支付 7.65 亿美元,以取消加州、缅因州和纽约附近的海上风电租约,并把部分资金转向中西部天然气电厂和西部地热项目。

FERC 给电网运营商 30 天时间,报告他们有多少可用的备用发电容量;并给他们 60 天时间,对区域电价进行辩护或修订。该指令并未解决更广泛的发电容量短缺问题,但可能为固态变压器和超导输电线路等技术打开空间。

查看单篇正文查看原文
09

TechCrunch AI

General Intuition拟融资3亿美元,估值约20亿美元

·#ai-startups

General Intuition拟融资3亿美元,估值约20亿美元

据报道,General Intuition 正在洽谈融资约 3 亿美元,投后估值将略高于 20 亿美元。这家总部位于纽约的初创公司在 8 个月前从 Medal 分拆出来,此前已经完成了一轮 1.34 亿美元的种子融资。

这笔交易说明,投资者正在快速押注具身 AI 和世界模型公司,尤其是那些拥有稀缺、大规模训练数据的团队。若融资成功,这笔资金将帮助 General Intuition 扩展算力并推出新产品,从而加剧这一热门 AI 研究与商业化赛道的竞争。

General Intuition 是一家位于纽约的初创公司,据报道正在洽谈一轮约 3 亿美元的融资,融资后估值将略高于 20 亿美元。该公司在 8 个月前才从 Medal 分拆出来,而 Medal 是一个用于上传和分享游戏视频片段的平台,此前已完成 1.34 亿美元的种子轮融资。知情人士告诉 TechCrunch,这次新融资已经吸引到 Jeff Bezos、Eric Schmidt,以及现有投资方 Khosla Ventures 和 General Catalyst 的支持。公司由 Medal 联合创始人 Pim de Witte 创立并领导,联合创始人还包括 Eloi Alonso、Adam Jelley 和 Vincent Micheli,他们被描述为在世界模型和仿真方面具有研究背景。General Intuition 的核心卖点是,Medal 的视频数据集非常适合训练 AI 理解运动、空间和时间。该公司表示,它正在利用来自 1000 万月活用户、每年约 20 亿条视频的数据训练具身 AI 和世界模型,并把交互式第一人称游戏内容作为训练材料。

公司认为,这类数据可以帮助机器学会在真实时间中感知、预测并与模拟环境交互。TechCrunch 还报道,OpenAI 过去曾试图收购 Medal,而且对这一数据集感兴趣的不止一家大型 AI 实验室。当前世界模型赛道正在升温,Runway、Decart 和 World Labs 等公司最近都发布了各自的世界模型,而 Google 的 Genie 3 也开始整合 Google Maps 数据,以增强现实世界模拟能力。与一些试图直接销售世界模型的同行不同,General Intuition 选择先用世界模型来训练智能体,并把智能体本身作为产品。知情人士称,公司将用这笔资金扩大算力,并计划在夏末或初秋发布新产品。

General Intuition 表示,它利用 Medal 每年来自 1000 万月活用户、累计约 20 亿条视频的数据集来训练具身 AI 和世界模型,并把交互式第一人称游戏画面作为训练素材。据称,Jeff Bezos、Eric Schmidt、Khosla Ventures 和 General Catalyst 都是其投资方之一,公司计划用这笔钱扩充算力,并在夏末或初秋推出新产品。

查看单篇正文查看原文
10

The Decoder

OpenAI 升级 ChatGPT 健康回答

·#ai-healthcare

OpenAI 升级 ChatGPT 健康回答

OpenAI 表示,ChatGPT 现在在健康相关查询中使用 GPT-5.5 Instant,从而提升了在 HealthBench 和 HealthBench Professional 等医疗基准上的回答质量。公司还称,过去两个月错误健康陈述减少了 71%,并且该模型已向所有免费用户开放,但有使用限制。

健康问答是最敏感、使用最广泛的 AI 场景之一,因此哪怕准确性和表达清晰度只提升一点,也可能影响数百万人。若 OpenAI 的说法经得起验证,这次更新可能让 ChatGPT 更适合用于理解化验结果、准备就诊和处理保险问题等场景。

OpenAI 对 ChatGPT 的医疗能力进行了升级,推出了 GPT-5.5 Instant,并表示它现在更擅长回答健康和 wellness 相关问题。公司称,在 HealthBench 和 HealthBench Professional 这两个面向健康任务的基准上,该模型已经能达到最强 Thinking 模型的水平。OpenAI 还表示,GPT-5.5 Instant 的错误健康陈述明显减少,过去两个月下降了 71%。在与医生撰写的回答对比时,公司称新模型在准确性、清晰度和完整性上都获得了更高分数。

OpenAI 表示,这些改进来自一个以医生为基础的评估流程,其中有来自 60 个国家的 260 多名医生参与,并审查了超过 70 万条模型回答。公司还称,每周有超过 2.3 亿人使用 ChatGPT 处理健康相关问题,例如理解化验结果、准备就诊,或处理保险相关问题。此次升级面向所有免费 ChatGPT 用户开放,但仍有使用限制。OpenAI 同时也提供面向专业人士的独立工具,包括 ChatGPT for Clinicians 和 OpenAI for Healthcare。

OpenAI 表示,GPT-5.5 Instant 在机器化健康测试中的表现已经接近最昂贵的 Thinking 模型,但运行成本要低得多。相关改进来自一个由 60 个国家、260 多名医生组成的网络,他们审查了超过 70 万条模型回答。

查看单篇正文查看原文
11

The Decoder

美国施压SK Telecom引发Anthropic关停风波

·#anthropic

美国施压SK Telecom引发Anthropic关停风波

WIRED 报道称,美国官员因担心 SK Telecom 被认为与中国有关联,要求 Anthropic 切断其对 Project Glasswing 合作项目的访问,Anthropic 随即照做。随后,亚马逊等公司据称又发现了 Fable 5 的安全漏洞,最终促使 Anthropic 将 Claude Mythos 和 Fable 5 一并下线。

这件事说明,AI 模型访问权限可能迅速卷入地缘政治、采购风险和国家安全审查,尤其是在合作项目涉及敏感网络安全工具时。它也表明,外部安全发现会如何迅速改变前沿 AI 厂商的产品可用性和市场信心。

WIRED 报道称,Anthropic 关停模型的连锁反应,可能最初来自其某个合作客户受到审查。SK Telecom 通过 Anthropic 的 Project Glasswing 项目获得了 Claude Mythos 的访问权,而该项目本来是为了让精选合作方提前测试并加固系统。报道称,美国官员因担心 SK Telecom 可能与中国有关联而感到不安,并要求 Anthropic 立即切断其访问权限,Anthropic 也据称立刻照办。

SK Telecom 随后向一家韩国报纸否认了与中国有关的指控,但报道指出,SK 集团整体在中国拥有大量业务,而且在 2009 年之前曾持有中国联通的股份。之后,情况进一步恶化,据称亚马逊和其他公司发现 Fable 5 存在可绕过安全限制的漏洞。政府压力与新的安全担忧叠加,最终据称让白宫对 Anthropic 失去信心,并要求将这两个模型完全下线。

Anthropic 的 Project Glasswing 是一个合作伙伴项目,会让入选机构提前使用 Claude Mythos Preview,用于发现漏洞并加固系统。SK Telecom 曾向韩国媒体否认与中国有关联,但报道也提到,SK 集团在中国有广泛业务,并且曾在 2009 年之前持有中国联通的股份。

查看单篇正文查看原文
12

The Decoder

DeepMind 将 AI 代理视为内部威胁

·#ai-safety

DeepMind 将 AI 代理视为内部威胁

Google DeepMind 推出了一个“AI Control Roadmap”,其核心假设是高级 AI 代理可能会偏离预期,因此只能在行为经过验证后逐步获得权限。该公司表示,内部异步监控原型已经在一百万个编码任务上进行了测试,并且正在用于监控 Gemini Spark 代理。

这件事的重要性在于,它把 AI 安全思路从“相信模型对齐”转向“把强大代理当作潜在内部威胁,并限制其权限和持续监督”。如果被行业广泛采用,DeepMind 的框架可能会影响企业如何保护自主 AI 系统,尤其是在编码、网络防御和内部业务流程等高风险场景中。

Google DeepMind 发布了一份 AI Control Roadmap,它把高级 AI 代理视为可能不可信的内部人员,而不是默认可以长期放心使用的系统。这个框架主张按步骤授予权限,并且只有在行为经过验证后才逐步放权,就像驾驶教练在车上同时保留方向盘和刹车一样。DeepMind 认为,这种方法既适用于保护公司内部最强大的 AI 系统,也可能成为整个行业的参考蓝本。为了更系统地描述风险,公司借鉴了 MITRE ATT&CK 这一网络安全框架,把攻击拆分为具体战术和技术。该路线图把新的 AI 威胁模型、由受信任 AI 充当“监督者”的监测系统,以及能够在伤害发生前阻止有害行为的防护系统结合在一起。

DeepMind 还表示,它会用多项指标来衡量效果,包括被监控的流量比例、被捕捉到的不当行为比例,以及系统响应速度。公司指出,监控只有在模型还没有学会规避监督时才有效,因此它把防护措施与一些能力里程碑绑定起来,比如“监督感知”和“非透明推理”。在一个内部原型中,DeepMind 用异步监控系统跑了 100 万个编码任务,结果显示,大多数被标记的事件并非恶意,而是代理过于激进或误解了用户意图。该系统目前已经作为 Gemini Spark 代理的实时监控器运行,并且能够实时发现误删数据等问题。DeepMind 最后警告说,制定全球 AI 代理安全标准的窗口正在迅速关闭。

DeepMind 将该路线图建立在 MITRE ATT&CK 等网络安全思路之上,并把控制措施分为检测等级 D1 到 D4 和响应等级 R1 到 R3。该公司还警告说,如果模型学会“知道自己被监督”、隐藏思维链,或者以其他方式开始规避监控,现有监测方法可能会失效。

查看单篇正文查看原文
13

The Decoder

Nature研究显示医疗AI可比肩医生

·#ai-in-healthcare

Nature研究显示医疗AI可比肩医生

两项新的 Nature 研究显示,专门化医疗 AI 系统在模拟诊断和治疗任务中的表现可以与医生持平,甚至更好。相关系统分别是德国的 MIRA(面向急诊病例的自主智能体)和 Google 的 AMIE(用于长期初级保健决策的多智能体系统)。

这些结果表明,医疗 AI 正从聊天式辅助走向更具临床意义的决策支持,可能在分诊、诊断和治疗规划中发挥作用。与此同时,研究也暴露出一个现实风险:这两个系统都依赖已经开始过时的基础模型,这可能限制其性能的长期稳定性。

两篇同时发表于 Nature 的论文展示了医疗 AI 系统在受控临床模拟中已经达到或超过医生水平。德国系统 MIRA 全称是 Medical Intelligence for Reasoning and Action,由德累斯顿工业大学、海德堡大学等机构研究人员开发。它作为一个自主智能体运行在隔离的虚拟电子健康记录中,可以收集病史、开检验、解读结果、生成鉴别诊断,并撰写治疗方案。研究团队用公开的 MIMIC-IV 数据集中的 500 多个真实急诊病例对 MIRA 进行了测试,另一个 AI 智能体扮演患者,只提供真实病历中的信息。在 8 个疾病类别中,MIRA 与病历记录中的诊断一致率达到 88.9%,在 311 个病例的直接对比中,它的得分是 87.8%,而 4 名资深专科医生为 78.1%,住院医师和专科医生混合团队为 71.1%。MIRA 在阑尾炎和胰腺炎上表现尤为出色,但肺炎和尿路感染对人类和 AI 都更难。

盲审专家还检查了安全性,未发现危险药物相互作用、肾功能受损患者的错误剂量,或有风险的止痛药处方;MIRA 还能准确判断所有需要住院的病例。Google 的 AMIE 研究则聚焦于跨多次就诊的初级保健场景。AMIE 采用双智能体设计,一个面向患者进行对话,另一个在后台依据临床指南进行推理,并在 100 个病例上与 21 名全科医生进行了比较,这些病例基于英国 NICE 和 BMJ Best Practice 指南。结果显示,AMIE 在治疗选择上与医生相当,并且在方案准确性和指南遵循方面优于医生,首次就诊时其整体方案被评为合适的比例为 95%,而医生为 72%。研究团队还构建了一个名为 RxQA 的药物知识基准,基于两个国家药品目录并经持证药师验证,AMIE 在更难的问题上超过了全科医生。文章同时提醒,这两个系统都建立在已经过时的基础模型之上,因此它们的优势能否长期保持仍然存在疑问。

MIRA 在一个隔离的电子健康记录环境中运行,可在 11 种工具中选择超过 85,000 个动作,包括开检验、做影像、生成鉴别诊断、开处方和决定住院。AMIE 采用双智能体设计,一个负责与患者对话,另一个在后台核对指南;研究用 NICE 和 BMJ Best Practice 指南,将它与 21 名全科医生在 100 个多次就诊病例上进行比较。

查看单篇正文查看原文
14

The Decoder

Gemini 联合负责人 Noam Shazeer 加入 OpenAI

·#ai

Gemini 联合负责人 Noam Shazeer 加入 OpenAI

Noam Shazeer,前 Google 工程副总裁、Gemini 联合负责人,正在离开 Google 加入 OpenAI。他表示这是一个艰难的决定,而他此前在 2021 年离开 Google 去共同创立 Character.AI,并在 2024 年因一项交易回归。

Shazeer 是现代大语言模型最重要的技术人物之一,参与了《Attention Is All You Need》中的 Transformer 工作。他的跳槽是一次高规格人才流动,可能影响 OpenAI 与 Google 在前沿 AI 研发中的竞争格局。

报道称,Noam Shazeer 正在离开 Google,转而加入 OpenAI。Shazeer 被广泛认为是《Attention Is All You Need》的共同作者之一,而这篇论文提出的 Transformer 架构奠定了现代大语言模型的重要基础。此前他在 Google 担任工程副总裁,并与 Jeff Dean、Oriol Vinyals 一起共同领导 Gemini 模型。他在告别中表示,这次转变是一个“艰难的决定”。文章提到,Shazeer 于 2000 年加入 Google,早期曾参与搜索引擎拼写检查器等改进工作。

2021 年他离开 Google,去共同创立 Character.AI,随后又在 2024 年通过一项价值 27 亿美元的交易回到 Google。那次回归连同联合创始人 Daniel De Freitas 以及部分研究团队一起完成,目标是帮助 Google 改进推理模型。文章指出,Google 的推理模型至今仍被认为落后于 OpenAI 和 Anthropic。报道还将这次离职形容为今年迄今最重大的 AI 人才变动之一,并拿它与 Andrej Karpathy 加入 Anthropic 相提并论。

Shazeer 于 2000 年加入 Google,曾参与搜索引擎拼写检查器等产品,后来又与 Jeff Dean 和 Oriol Vinyals 一起领导 Gemini。文章称,Google 通过一项价值 27 亿美元的交易把他和 Character.AI 相关团队带回,并希望借此强化推理模型,但这些模型仍被认为落后于 OpenAI 和 Anthropic。

查看单篇正文查看原文
15

The Verge AI

谁来决定 AI 何时太危险?

·#ai-governance

谁来决定 AI 何时太危险?

《The Verge》的 Decoder 节目讨论了一场新的争议:美国政府对 Anthropic 的 Fable 5 模型以及其底层的 Mythos 模型实施了出口管制。Anthropic 随后将这两个模型下线,称自己无法在可靠阻止外国国民访问的同时继续遵守该命令。

此事可能影响美国未来如何监管先进 AI 系统,尤其是在国家安全与模型访问限制发生冲突时的处理方式。它也会影响 AI 公司、研究人员以及美国境内的工作人员,因为访问权限可能会因公民身份或国籍限制而被切断。

《The Verge》的 Decoder 节目聚焦于 Anthropic 与特朗普政府之间一场迅速升级的冲突,核心是这家公司新 AI 模型的访问权限问题。节目称,美国政府在周五宣布,将对 Anthropic 新发布的 Fable 5 模型以及其底层的 Mythos 模型实施出口管制。相关限制据说还延伸到了在美国工作的部分 Anthropic 外籍员工,也就是外国国民无法访问这些模型。Anthropic 随后把 Fable 和 Mythos 对所有人都下线了,理由是如果不这样做,公司无法合理确保自己遵守该命令。

The Verge 还表示,截至周二,问题仍未解决,Fable 在 Claude 中依然不可用。节目认为,这件事不只是一次产品下线,而可能对美国 AI 监管体系以及整个科技行业产生更广泛的影响。它还指出一个明显的讽刺:Anthropic 多年来一直主张 AI 可能会危险到需要更严格的政府监管,但当这种监管真正落到自己头上时,公司显然并不满意。整场讨论最终指向一个更大的问题:美国到底是在建立一套严肃的 AI 安全框架,还是在把监管权力当成政治工具使用。

节目提到,Fable 公布还不到一周,政府就采取了行动,而且限制还覆盖了在美国工作的外籍 Anthropic 员工。录制时,Fable 仍处于离线状态,Claude 界面上还显示“Fable 5 is currently unavailable”。

查看单篇正文查看原文
16

Ars Technica AI

桑德斯提议设立7万亿美元AI财富基金

·#ai-policy

桑德斯提议设立7万亿美元AI财富基金

伯尼·桑德斯提出一项立法,计划对最大型AI公司的股票征收一次性50%的税,并用所得资金建立一个主权财富基金。桑德斯表示,这个基金规模可能达到7万亿美元,并向美国人发放年度分红,同时为公共服务提供资金。

这项提议将大幅改变AI创造的财富分配方式,把一部分控制权和收益从大型科技公司转向公众。若能通过,它可能成为AI税收、公共所有权和政府监管强大AI公司的标志性案例。

伯尼·桑德斯公布了一项规模庞大的提案,目标是把AI行业创造的大量财富转移给公众。根据他向美联社提供的法案摘要,该立法将通过对最大型AI公司的股票征收一次性50%的税来建立一个主权财富基金。任何年AI销售额达到2亿美元的公司都将被征税,未来成长到这一门槛的新公司也会被纳入。桑德斯估计,这只基金最终可能高达7万亿美元。按照他的说法,这笔资金每年可为美国人带来数千亿美元,用于直接发放现金,以及支持医疗、教育和住房等项目。桑德斯还估计,每位美国人每年可能获得超过1000美元的5%分红。

他强调,AI带来的收益不能只流向少数富有的公司。该提案还计划让美国人对公司决策拥有直接影响。为此,法案将设立一个新的两党制“民主AI独立委员会”,由总统提名、参议院确认的7名成员组成。该委员会可通过表决权阻止可能伤害公众的公司决定。与一些AI高管提出的较温和公共利益方案相比,这一提案要激进得多,因此大概率会遭到行业强烈反对。桑德斯表示,他会围绕建立这一基金开展竞选,并把这一努力描述为确保AI服务普通人,而不是伤害普通人。

该计划适用于年AI销售额至少2亿美元的任何AI公司,新进入者一旦达到这一门槛也会被纳入。桑德斯还希望设立一个新的两党制“民主AI独立委员会”来监督基金,并利用表决权阻止可能损害公众利益的公司决策。

查看单篇正文查看原文
17

Cloudflare AI

Cloudflare 的模型无关漏洞检测平台

·#ai-security

Cloudflare 的模型无关漏洞检测平台

Cloudflare 发布了一套可用于构建漏洞检测平台的实用架构,用来持续扫描一整个仓库集群中的代码。核心思路是把 AI 模型当作可替换组件,在发现、验证和分诊环节交替使用不同的前沿模型,而不是依赖单一模型或单一提示词配置。

这很重要,因为企业级安全扫描需要持久化、跨仓库追踪、去重和可恢复能力,而单智能体流程很难可靠地满足这些规模化需求。Cloudflare 的观点是,防御型 AI 系统从一开始就应当做到模型无关,这样团队就能随着市场变化持续切换到最合适的模型,而不必重建整个流程。

Cloudflare 表示,这篇新文章是对 Project Glasswing 的实用延续,后者研究了把前沿安全模型直接放到企业代码库上会发生什么。公司认为,AI 生态变化非常快,围绕单一模型构建的系统,一旦该模型不可用或被更强的模型取代,就会面临失效风险。其核心观点是,agentic 工作流的未来不在于单独的模型、提示词或单智能体会话。相反,安全分析应当构建成一个模型无关的 harness,让模型可以随时替换,而周围的工作流保持稳定。Cloudflare 还指出,真正的企业级系统不能只看单个仓库,还必须跨仓库依赖追踪漏洞。

与此同时,它需要把成千上万条原始候选结果筛选成一个经过可信分诊、可直接行动的修复队列。文章还提前回应了两个常见质疑:一是 subagents 是否已经足够,二是这篇文章是否只是为前沿模型做宣传。Cloudflare 的回答是,subagents 有用,但安全工作需要持久化、去重、可恢复以及跨运行协调,这些都是编排问题,不是单靠提示词就能解决的问题。它还强调,真正长期有效的是 harness 本身,而不是某个特定模型;把不同前沿模型放到同一目标上时,它们各自会发现不同部分的漏洞。

文章提到,这个系统最初只是一个大约 450 行的 security-audit 技能,用于单个仓库,之后才扩展为支撑七阶段审计流程的编排基础设施。该流程包括三个并行研究代理负责侦察、按攻击类别运行一个 Hunter 代理、用对抗性验证器质疑结果,并同时输出面向人工阅读的报告和结构化的 findings.json 架构。

查看单篇正文查看原文
18

TechCrunch AI

Guardrails Alliance 挑战大科技的 AI 竞选开支

·#ai-policy

Guardrails Alliance 挑战大科技的 AI 竞选开支

一个由科技员工支持的新超级政治行动委员会 Guardrails Alliance 于周四成立,目标是支持 AI 立法并对冲亲大科技的政治支出。该组织表示目前手头约有 500 万美元,并计划在本选举周期筹集 1500 万美元。

这为 AI 监管之争增加了一个由劳动者和科技员工支持的声音,而资金雄厚的行业阵营已经在试图影响选举和政策。它可能会影响关键选举中哪些候选人获得支持,以及 AI 监管是否会成为更重要的政治议题。

一场由科技员工推动的草根政治行动正在形成,他们希望 AI 能以负责任的方式被开发和部署。周四,民主党政治操作人士 Shaunna Thomas 和 Leah Hunt-Hendrix 推出了 Guardrails Alliance,这是一个旨在支持 AI 立法的超级政治行动委员会。该组织得到科技员工、工会和其他团体的支持,并将自己定位为来自 AI 热潮一线参与者的民粹式政治载体。Thomas 表示,他们相信人们仍然有能力阻止她所说的特朗普政府和科技行业的“专制接管”。Guardrails 目前大约拥有 500 万美元,并计划在本选举周期筹集 1500 万美元,但这与亲大科技阵营相比仍然相差巨大。其主要对手之一 Leading the Future 拥有超过 1 亿美元资金,来源包括 OpenAI 总裁 Greg Brockman 等科技人物。

Guardrails 已开始投入广告,支持纽约国会候选人 Alex Bores,他将在下周的初选中参选,并已成为 Leading the Future 的首个攻击目标。Bores 还发布了一则广告,内容包括 Adam Raine 的父母;这名少年在与 ChatGPT 长时间对话后自杀身亡。另一只支持立法的超级 PAC Public First Action 也在支持 Bores,该组织获得 Anthropic 的资金支持。文章还提到,OpenAI 尝试与 Brockman 的捐款保持距离,但一些员工仍然不买账,并在社交媒体上批评针对 Bores 的攻击。这次新 PAC 的出现,也和今年更广泛的科技员工组织行动相呼应,例如要求公司终止与美国移民和海关执法局(ICE)的合同,以及反对五角大楼将 Anthropic 列为供应链风险的决定。

Guardrails 由民主党政治操作人士 Shaunna Thomas 和 Leah Hunt-Hendrix 领导,并正在支持纽约国会候选人 Alex Bores。与之相比,另一边的 Leading the Future 规模大得多,资金超过 1 亿美元,获得了包括 OpenAI 总裁 Greg Brockman 在内的科技人物支持。

查看单篇正文查看原文
19

The Decoder

Adobe 为 Creative Cloud 加入 AI 代理

·#adobe

Adobe 为 Creative Cloud 加入 AI 代理

Adobe 正在把新的“创意代理”推广到 Firefly 以及 Photoshop、Premiere、Illustrator、InDesign 和 Frame.io 等 Creative Cloud 应用中。大多数应用里的 AI 助手已进入公开测试版,After Effects 仍是私有测试版,同时 Adobe 还表示这些工具可以在 ChatGPT、Claude 和 Microsoft 365 Copilot 中使用。

这标志着创意软件正在向“代理式”工作流转变,用户只需描述结果,应用就能自动完成多步骤制作任务。若效果成熟,它可能为剪辑师、设计师和独立创作者节省大量重复劳动,并让 Adobe 更深地嵌入日常 AI 工作流。

Adobe 正在把它称为“创意代理”的能力扩展到 Firefly 和主要的 Creative Cloud 应用中。公司表示,这个代理的目标是编排多步骤工作流,让用户把精力集中在想要的结果上,而不是手动完成每个环节。Adobe 还将其定位为连接构思、创作和制作之间的层。现在,Premiere、Photoshop、Illustrator、InDesign 和 Frame.io 中的 AI Assistant 已进入公开测试版,After Effects 则处于私有测试版。每个助手都针对对应应用做了适配,用户也可以自己决定哪些任务交给 AI,哪些保留人工操作。

这些新能力主要针对重复性的生产工作,而不是替代核心创意判断。在 Premiere 里,助手可以整理素材到不同文件夹、批量重命名剪辑、识别采访问题、设置标记并生成粗剪。在 Photoshop 中,它可以替换背景、按不同平台调整尺寸,以及整理合成中的图层。Illustrator 的助手可以根据电子表格数据生成大量版本文件、重新组织图层,并执行预检,检查色彩模式问题或缺失字体。InDesign 可以根据新的品牌 PDF 更新版面,处理文本、样式和印刷就绪检查;Frame.io 则可以整理素材、汇总修订反馈并生成 B-roll。

Adobe 还在为 Firefly AI Assistant 增加面向独立创作者和社交创作者的新功能。其中包括一个品牌套件工具,可根据简短描述生成 logo、品牌识别和配色方案;一个能把产品照片转成短视频的功能;以及 Quick Cut,它可以自动把剪辑素材拼成第一版成片。用户还可以制作分镜,并根据分镜生成视频。Adobe 表示,Firefly 助手可以通过自然语言让素材更易搜索,学习工作流偏好,并随着时间推移逐步适应用户,同时支持在发布前邀请协作者审阅。

与此同时,Adobe 还在私有测试版中试验重新设计的 Firefly Studio 界面。这个版本把生成和编辑整合到一起,并加入 Elements,用于保存可复用的角色、地点和物体;还加入 Projects,用于在 Firefly 和 Creative Cloud 之间打包资产、输出和上下文。这些功能目前都需要排队申请。Adobe 还表示,它的工具已经可以在 ChatGPT、Claude 和 Microsoft 365 Copilot 中使用,Google Gemini 和 Slack 集成也在计划中。负责 Adobe agentic AI 和 Firefly 的 Forest Key 表示,创意想法往往先出现在与团队、客户或同事的对话中,而不是某个单独的应用里,Adobe 希望用户不用切换工具就能把这些想法变成行动。

Adobe 表示这些助手主要处理重复性工作,而不是替代创意判断:Premiere 可以整理素材、批量重命名、识别采访问题、设置标记并生成粗剪,Photoshop 则可以替换背景、调整尺寸和整理图层。Firefly 还加入了面向创作者的新功能,例如品牌套件、Quick Cut、分镜生成,以及把产品照片转成短视频的工具。

查看单篇正文查看原文
20

The Verge AI

亚马逊工程师称就数据中心作证后遭报复

·#amazon

亚马逊工程师称就数据中心作证后遭报复

三名亚马逊软件工程师表示,在他们出席西雅图市议会听证会、支持限制数据中心之后,公司开始调查他们。周四,他们提交投诉,要求西雅图民权办公室调查他们所称的违法报复行为。

此案可能检验员工就与雇主业务相关的政策议题公开发声时,言论保护究竟能延伸到什么程度。它也发生在围绕 AI 时代数据中心扩张、公共资源消耗和地方社区影响的更大争议之中。

三名亚马逊软件工程师本月早些时候在西雅图市议会关于数据中心的听证会上作证,如今表示他们遭到了雇主的报复。三人在发言开头引用了西雅图一项禁止因政治言论而实施就业歧视的法律。听证会结束一周后、也就是市议会通过为期一年的数据中心暂停令次日,Patrick Schloesser、Darius Irani 和 Liesl Wigand 被叫去与亚马逊 Employee Relations 会面。根据他们的说法,人力资源代表告诉他们公司正在调查,并警告可能会采取纪律处分,甚至包括解雇。周四,这三人向西雅图民权办公室提交投诉,要求调查亚马逊是否存在被禁止的就业歧视。

Schloesser 说,他感觉公司是在试图逼他承认某些事情,这次经历让他觉得在公司里为政治观点发声并不安全。亚马逊发言人 Margaret Callahan 表示,员工当然可以讨论自己的工作环境,但如果要代表公司发言,必须遵守相关程序。她说,公司正在调查是否违反了企业传播政策,并强调公司不容忍报复行为,同时否认曾计划解雇这些员工,或告知他们会面临解雇风险。这场争议发生在西雅图正式实施为期一年的大型数据中心暂停令之后,市议会正在考虑新的立法,并研究数据中心对土地使用、公共健康、用水、就业、公共事业费率和城市基础设施等方面的影响。包括这三名投诉人在内的五名亚马逊员工都属于 Amazon Employees for Climate Justice,该组织此前曾敦促亚马逊用 100% 额外的本地可再生能源为其数据中心供电。

这些员工称,他们在作证时引用了西雅图禁止因政治言论而实施就业歧视的法律;随后在 6 月 10 日,他们被临时叫去参加人力资源会议,并被告知可能面临纪律处分,甚至包括解雇。亚马逊则表示,公司只是调查是否违反了企业传播政策,并否认曾告知这些员工他们会被解雇。

查看单篇正文查看原文
21

Financial Times AI

·#ai-policy

特朗普借鉴中国的主权AI路线

《金融时报》指出,特朗普时期的政策正向一种类似中国的主权AI策略靠拢,即美国政府加大对具有战略意义的AI公司的持股。文章将这一变化概括为:政府不再只是保护战略产业,而是直接成为股东。

这件事之所以重要,是因为它表明AI正越来越被当作国家级战略资产,而不只是私人部门的技术市场。如果政府直接持有AI公司的股权,可能会重塑投资激励、市场竞争,以及公共利益与企业控制之间的平衡。

《金融时报》这篇文章认为,特朗普时期的政策正在借鉴中国的主权AI路线。文章的核心观点是,政府一直都会保护战略产业,但新的变化在于政府开始愿意直接成为这些产业的股东。按照这种叙述,AI不再只是普通的商业行业,而是与国家力量紧密相关的战略领域。文章指出,美国正在朝着更直接介入被视为对AI竞争力至关重要的公司方向发展。

这种变化反映出一个更广泛的趋势:各国试图争夺关键技术的控制权,而不仅仅依赖监管或采购。文章并没有描述AI模型或基础设施方面的技术突破。相反,它关注的是国家持股在AI领域带来的政策和地缘政治影响。整体信息是,主权AI正在成为主要大国思考AI时代战略自主的一种重要范式。

这篇报道的核心是产业政策,而不是技术突破:新意在于政府愿意以股东身份介入AI公司。文章把这一点放在“主权AI”的更大背景下,即通过国家支持来争取对关键AI能力的战略自主。

查看单篇正文查看原文
22

OpenAI News

·#openai

OpenAI 为 ChatGPT Enterprise 增加支出控制

OpenAI 为 ChatGPT Enterprise 推出了新的信用额度使用分析和更新后的支出控制工具。公司表示,管理员现在即可开始使用这些新工具,工作区用户也可以在工作区设置中查看自己的信用额度使用情况。

这些控制功能让企业更清楚地看到 ChatGPT 的使用情况、采用情况以及费用流向,这对于希望在扩展 AI 规模时保持预算可控的组织很重要。对于 IT 和财务团队来说,更清晰的支出追踪也有助于证明部署价值,并更方便地在各部门之间管理推广。

OpenAI 宣布为 ChatGPT Enterprise 增加新的使用分析功能,并更新支出控制工具。公司表示,如果企业想要有信心地扩展 AI 应用,就需要清楚看到使用情况、采用情况以及支出情况。新功能的目标是帮助管理员理解 AI 的价值究竟产生在哪里,以及成本具体花在了哪里。OpenAI 将这次更新明确描述为“信用额度使用分析”与“更新后的支出控制”的组合。

根据公告,ChatGPT Enterprise 的管理员现在就可以开始使用这些新的分析和控制功能。工作区中的用户也可以通过工作区设置查看自己的信用额度使用情况。整体来看,这次更新更像是面向大规模部署的实用管理改进,而不是模型能力或产品形态上的重大突破。

OpenAI 将这次更新概括为三项需求:查看使用情况、采用情况和支出情况,以便企业理解 AI 的价值创造点。公告明确提到 ChatGPT Enterprise 的信用额度使用分析和更新后的支出控制,并且可在工作区设置中访问。

查看单篇正文查看原文
23

TechCrunch AI

Snap将AI视频团队拆分为Dotmo

·#ai-video

Snap将AI视频团队拆分为Dotmo

Snap正在将其内部生成式AI视频团队拆分为一家名为Dotmo的新公司。新公司将专注于面向互动游戏和娱乐的AI模型,Snap表示,此举部分原因是公司内部开展这类工作的成本过高。

这次拆分让Snap可以降低一项非核心AI业务带来的成本和运营压力,同时还能通过股权保留未来收益的可能性。它也表明,AI视频研发的成本已经高到一些公司可能更愿意把它做成独立实体,而不是继续留在母公司内部。

Snap正在把其内部的生成式AI视频团队拆分成一家名为Dotmo的独立公司。Snap表示,Dotmo将专注于开发能够创建互动游戏体验的AI模型,而不是直接服务于Snap的核心业务。公司称,推动这次拆分的一个重要原因,是把这类工作放在内部推进的成本太高。尽管Dotmo在法律上是独立公司,但它仍将与Snap保持紧密联系,因为Snap会向Dotmo提供技术授权,允许其把相关技术改造用于游戏和互动娱乐平台。Dotmo的初始团队将由一批离开Snap的现有员工组成,他们将共同创办这家新公司。

Snap还表示,首席技术官Bobby Murphy将担任Dotmo的主要投资人,并持有相当大的个人股份,但他仍会继续在Snap全职工作,负责公司的GenAI研发。作为团队和技术授权的交换,Snap将获得Dotmo的大量股权,如果Dotmo未来发展顺利,Snap可能从中受益。Snap还提到,Dotmo之后也可能寻求外部融资。这是Snap在2026年的第二次重大拆分,此前公司已经把Specs拆分出去,专门开发智能眼镜。与此同时,Snap今年也进行了成本削减,包括裁掉大约1,000名员工。

Snap将把相关技术授权给Dotmo,使新公司能够将其改造成适用于游戏和互动娱乐平台的技术。Dotmo的初始团队将由一批离开Snap去创业的现有员工组成,而Snap首席技术官Bobby Murphy将担任主要投资人,同时继续全职留在Snap工作。

查看单篇正文查看原文
24

The Decoder

Claude Code新增可分享的Artifacts用于团队协作

·#anthropic

Claude Code新增可分享的Artifacts用于团队协作

Anthropic将Artifacts引入Claude Code,允许用户把编码会话转换为可交互、可分享的网页。页面会基于完整会话上下文生成,并且会在同一个网址自动更新,还保留版本历史。

这让Claude Code更适合协作,因为原本一次性的编码过程可以变成团队成员能够查看、复用并持续追踪的内容。它也可能帮助团队用PR讲解、事故时间线和架构概览等形式来沟通进展。

Anthropic已经把Artifacts功能加入Claude Code,把Claude聊天里熟悉的能力扩展到了编码工作流中。借助这一功能,用户可以把Claude Code会话的结果转换成一个可交互的网页,并分享给团队。这个页面是根据完整会话上下文生成的,包括代码、连接的工具以及聊天历史,因此展示的是更完整的工作过程,而不只是某一次回答。当天底层会话发生变化时,页面会在同一个网址自动更新,并保留版本历史。用户只需在会话中直接要求生成artifact,或者提出任何需要可视化的内容即可。

随后Claude Code会提供一个链接,用户可以在浏览器或桌面应用中打开,并通过页面顶部的头部区域直接分享。Anthropic表示,这项功能可用于PR讲解、事故时间线、许可证审计和架构概览等场景。Artifacts默认是私有的,只对组织内已认证成员可见,管理员还可以通过角色和保留策略进行管理。该功能目前以Beta形式向Claude Team和Enterprise客户开放,并且同时支持Claude Code CLI和桌面应用。

Anthropic表示,这些Artifacts默认是私有的,只对组织内已认证成员可见,管理员可以通过角色和保留策略控制访问。该功能目前面向Claude Team和Enterprise客户提供Beta版,并支持Claude Code CLI和桌面应用。

查看单篇正文查看原文
25

The Decoder

勒昆警告人工智能泡沫可能破裂

·#ai-economics

勒昆警告人工智能泡沫可能破裂

Yann LeCun 在接受 CNBC 采访时表示,如果 OpenAI 和 Anthropic 这类人工智能实验室不能降低运营成本或提高价格,就可能遭遇一次“巨大泡沫爆炸”。他说,人工智能服务提供商目前仍在亏损,而投资者实际上在补贴用户使用。

勒昆是人工智能领域最有影响力的人物之一,因此他的表态为前沿模型开发的经济性担忧增加了分量。如果成本居高不下,这种压力可能会重塑整个人工智能行业的定价、融资和竞争格局。

Yann LeCun 在接受 CNBC 采访时警告称,如果 OpenAI、Anthropic 等人工智能实验室不能降低成本或提高服务价格,可能会迎来一次“巨大泡沫爆炸”。他表示,人工智能服务的价格仍在上升,但运营成本下降得不够快。按照他的说法,这些公司仍在亏损,现有模式实际上依赖投资者补贴用户使用。文章指出,这反映了业界对前沿人工智能能否在当前规模下实现经济可持续的更广泛担忧。OpenAI 首席执行官 Sam Altman 最近也把人工智能成本称为企业面临的“巨大问题”。

勒昆还批评了 Elon Musk 的 xAI,称其“某种程度上是失败的”,并认为它不太可能与 OpenAI 或 Anthropic 竞争。他指出 xAI 的创始团队已经离开,而且 Musk 现在很难招到顶尖人才。这些评论也与勒昆本人对“世界模型”的押注有关,而不是当前主导市场的大语言模型。AMI Labs 在 3 月为这一方向融资 10 亿美元。文章最后提到,如果 LLM 泡沫破裂,可能会有更多资金流向勒昆的研究,但也可能让整个人工智能市场降温。

勒昆还把 xAI 形容为“某种失败”,认为其创始团队已经离开,公司也难以有效竞争 OpenAI 或 Anthropic。他的观点也反映出他对“世界模型”的战略押注,AM I Labs 在 3 月为这一方向融资 10 亿美元。

查看单篇正文查看原文
26

The Verge AI

Adobe Firefly新增可复用资产与项目管理

·#adobe-firefly

Adobe Firefly新增可复用资产与项目管理

Adobe 正在推出一个重新设计的 Firefly AI 工作室,并以私测形式上线,用户可以在同一界面里完成编辑和生成。它还新增了 Elements,用于复用角色、地点和物体,以及 Projects,用于整理素材、生成结果和创作上下文。

这些更新旨在让 AI 辅助设计更一致、减少重复劳动,这对需要反复迭代多种素材的创作者很重要。Adobe 也在把 Firefly 推向工作流中枢,而不只是一个提示词工具,这可能会增强它在专业创意制作中的地位。

Adobe 正在为 Firefly AI 助手推出新的能力,同时带来一个重新设计的 AI 工作室,把编辑和生成功能整合到同一个界面里。这个新的 Firefly 体验今天以私测形式上线,Adobe 表示它的目标是在项目之间提供持续上下文、可复用资产和更有组织的工作流。公司希望用户能够更顺畅地从创意构想到可交付成品,而不必频繁在不同应用之间切换。这也是 Firefly 自 2023 年 9 月首次推出以来,Adobe 对这个一体化 AI 中枢做出的又一次界面重构。最重要的新功能之一是 Elements,它可以让用户保存已经生成的角色、地点和物体,并在 Firefly 和 Firefly Boards 中重复使用。

换句话说,用户可以上传参考图片并为其命名,然后让 Firefly 直接生成“Charlie 的卧室”之类的场景,而不必每次都重新写很长的提示词。Adobe 还加入了 Projects,用来把素材、生成内容和创作上下文放在一起,方便用户随时继续上一次的工作。在助手功能方面,Firefly 现在可以根据公司名称和风格描述生成品牌套件,包括 logo 和配色方案。它还增加了视频相关工具,例如用于快速拼接片段并形成初稿的 Quick Cut、帮助规划视频项目的故事板生成,以及把图片转换成短视频内容的能力。Adobe 的 Forest Key 表示,公司希望 Firefly 更像一个协作伙伴,而不是用对话提示词取代人类的大部分工作;他也指出,不同用户对创作方式的需求不同,有些人会完全依赖自然语言操作,有些人则仍然会在 Firefly 或其他 Creative Cloud 应用中进行大量手动调整。

Elements 允许用户保存已经生成的角色、地点和物体,并通过为参考图命名,在 Firefly 和 Firefly Boards 中重复使用。Firefly Assistant 还新增了品牌套件、Quick Cut 视频快速剪辑、故事板生成以及将图片转为短视频的能力,不过 Adobe 仍将其定位为协作伙伴,而不是取代人工创作的工具。

查看单篇正文查看原文
27

The Verge AI

Midjourney推出全身超声扫描仪

·#ai-hardware

Midjourney推出全身超声扫描仪

Midjourney 首席执行官 David Holz 公开展示了公司的首款硬件产品 Midjourney Scanner,这是一套用于身体成分和健康监测的全身超声系统。公司还表示,计划在 2027 年底前在旧金山开设一家水疗空间,并在其中部署 10 台这种扫描仪。

这标志着 Midjourney 从图像生成业务转向类似医疗影像的硬件和预防性健康服务,是一次非常明显的业务转型。如果其宣传效果属实,它可能让高频身体扫描变得更快、更安全、更容易获得,从而改变消费者追踪健身变化和医生查看长期身体数据的方式。

Midjourney 首席执行官 David Holz 公开展示了公司的首款硬件产品,并同时公布了在旧金山开设水疗空间的计划,这与这家公司以生成“猫图”出名的 AI 图像业务形成了鲜明对比。这个设备名为 Midjourney Scanner,被描述为一种基于超声的全身扫描仪,目标是成像肌肉、脂肪、骨骼和器官的组成情况。Holz 表示,理想情况下,这种扫描在很多方面可以做到接近 MRI 的图像质量,而且用户既可以一年做一次,也可以每天都做。 他还说,他希望通过这种方式观察饮食和锻炼变化如何影响身体。

Midjourney 的招聘信息则把更大的目标描述为“打造并推出世界上第一台全身超声 CT 扫描仪”,以“安全、快速、高保真”的方式提供预防性扫描服务。该系统与超声技术公司 Butterfly Network 合作开发,后者表示每套系统使用 40 个 Butterfly Ultrasound-on-Chip 成像模块。根据现场展示,用户先站到一个平台上,平台会下降到水中,并穿过一个由换能器组成的环形装置,设备从多个角度发出超声波,以生成详细的三维图像。公司称整个扫描大约需要 60 秒,而且目前大约已有十几个人接受过扫描。

Midjourney 表示,这台扫描仪使用由成千上万个换能器组成的环形阵列,并配备 2 petaflops 的算力;每套系统还使用了 40 个 Butterfly Ultrasound-on-Chip 成像模块。公司称扫描大约只需 60 秒,虽然部分医疗用途需要 FDA 批准,但目前重点是无需同等审批的非诊断性身体成分图谱。

查看单篇正文查看原文
28

ZDNET AI

新 Siri AI 在 Mac 上对比测试 ChatGPT 和 Gemini

·#apple-intelligence

新 Siri AI 在 Mac 上对比测试 ChatGPT 和 Gemini

ZDNET 在运行 macOS 27 开发者测试版的 Mac 上测试了苹果的新 Siri AI,结果显示它比旧版 Siri 更有能力。报道指出,它目前需要在受支持设备上通过等待名单获取,但仍会出错,且对话流畅度不如 ChatGPT 或 Gemini。

这很重要,因为 Siri 正被重新定位为 Apple Intelligence 的一部分,这可能让苹果的助手在 iPhone 和 Mac 上更适合日常任务。评测显示苹果已经取得进展,但在面向大众发布之前,仍需要进一步提升可靠性。

ZDNET 的作者表示,他长期以来都对 Siri 的缺点感到不满,因此想看看苹果在 WWDC 2026 上推出的新 Siri AI 是否真的更好。测试是在一台运行 macOS 27 开发者测试版的 Mac 上进行的,而新版 Siri 只对支持 Apple Intelligence 且通过等待名单的用户开放。作者特别提醒,开发者测试版可能不稳定,因此最好在备用设备上安装测试,他自己使用的是一台备用的 MacBook Air M1。作者还提到,他在 iPhone 上加入等待名单后仍在等待,但在 Mac 上很快就获得了访问权限。

新版 Siri 启用后,可以通过语音唤醒、全新的 Siri AI 应用、连续按两次 Command、Spotlight 搜索,或者右键菜单中的“Ask Siri”来调用。测试过程中,作者向它提出了通用问题和具体问题,要求它查找本机文件,并尝试进行来回对话。最终结论是,新 Siri 确实比旧版 Siri 更强,但它仍然会给出错误或不准确的答案,而且对话体验也不够自然。ZDNET 认为它作为第一版开发者测试版前景不错,但苹果在预计 9 月的公开发布前仍有很多工作要做。

要使用新版 Siri,设备必须支持 27 版本系统和 Apple Intelligence,用户还需要安装开发者测试版并加入等待名单。在 Mac 上,Siri 可以通过专用 Siri AI 应用、Hey Siri 语音唤醒、连续按两次 Command、Spotlight,或“Ask Siri”菜单项来调用。

查看单篇正文查看原文