OpenAI 把 GPT-5.6 做成分层产品,并叠加受限预览
Sol、Terra、Luna 三档同时推出,既强调能力差异,也强调成本与缓存优化;但发布路径明显受到政府访问规则和安全审查影响,前沿模型的开放方式正在改变。[2774][2786][2775][2783]
AI 日报
今天的核心主题是:前沿 AI 正从“更强”走向“更受控”。OpenAI 推出 GPT-5.6 系列并同时面对政府审查、能力边界与安全约束;与此同时,开源漏洞防护、提示注入防御、模型成本竞争和法律责任都在加速重塑行业规则。
Overview
从 52 条资讯中筛选出 19 条
今天的核心主题是:前沿 AI 正从“更强”走向“更受控”。OpenAI 推出 GPT-5.6 系列并同时面对政府审查、能力边界与安全约束;与此同时,开源漏洞防护、提示注入防御、模型成本竞争和法律责任都在加速重塑行业规则。
Sol、Terra、Luna 三档同时推出,既强调能力差异,也强调成本与缓存优化;但发布路径明显受到政府访问规则和安全审查影响,前沿模型的开放方式正在改变。[2774][2786][2775][2783]
6000 次邮件式提示注入尝试失败,显示防御能力在提升;Linux Foundation 的 Akrites 则把开源漏洞响应推进到跨公司协作层面,目标是跟上 AI 加速带来的攻击速度。[2772][2778]
Lindy 用 DeepSeek 取代 Claude 以大幅降本,说明 AI 竞争已不只是能力比拼,价格、推理成本和供应商切换能力正成为核心变量。[2787]
OpenAI 的 Jalapeño 及行业更广泛的自研芯片趋势,表明大型 AI 公司正在把硬件控制权重新收回到自己手里。[2782][2784]
从《纽约时报》对微软/OpenAI 的版权诉讼,到 AI 责任归属的法律讨论,再到 Anthropic 的海外访问限制,AI 的商业化路径正在被法律框架重新塑形。[2779][2791][2788]
OpenAI 加码印度市场的同时,联合国开源周强调开源、互操作性与可替换基础设施,显示全球 AI 战略正同时走向扩张与去依赖化。[2781][2789]
前沿模型发布、监管介入与安全防护同时升温,AI 行业正在进入一个“能力扩张与控制加强并行”的阶段。OpenAI 的 GPT-5.6 预览、Anthropic 的访问限制、Linux Foundation 的开源安全协作,以及围绕成本、责任和提示注入的讨论,共同指向同一个现实:AI 正从产品竞争转向制度竞争。
OpenAI 今天的信号最强烈:GPT-5.6 不是单一模型,而是一套面向不同场景的分层发布。Sol、Terra、Luna 分别对应旗舰能力、平衡性与低成本路径,同时新定价和缓存机制也在强调可用性与成本控制。[2774][2786]
更值得注意的是,这次预览并不只是产品节奏问题,还叠加了政府访问规则与安全审查。OpenAI 的最新模型被限制给少数合作伙伴或受审查用户,说明前沿模型的发布正在从“谁先做出来”变成“谁先拿到放行”。[2775][2785][2783]
AI 安全不再只是模型对齐问题,而是落到具体攻击面上。一次持续约 6000 次尝试的提示注入挑战失败,说明当前前沿模型对现实世界攻击正在变得更难被诱导,但这并不等于生产环境已经安全。[2772]
与此同时,Linux Foundation 联合多家科技公司启动 Akrites,试图用更协调的漏洞披露与修复机制来应对 AI 时代放大的开源安全压力。这反映出行业共识正在形成:面对更快的漏洞发现与利用速度,零散的志愿者维护模式已经不够用了。[2778]
模型之争也在变成成本之争。Lindy 直接用 DeepSeek 替换 Claude,以削减数百万美元支出,说明价格与推理成本已经足以改变初创公司的模型选择。[2787]
同样重要的是,AI 基础设施正向自研芯片倾斜。OpenAI、Google、Apple、SpaceX 等公司被描述为越来越多地用定制芯片对冲对 Nvidia 的依赖,这意味着未来的 AI 竞争不仅在模型层,也在硬件控制权层。[2782][2784]
AI 对就业结构的影响开始更直接地浮现。Anthropic 高管表示,公司对初级工程师的需求下降,招聘正更偏向经验丰富的人,这提示“AI 替代入门级工作”已经从外部担忧变成内部现实。[2777]
法律与政策压力也在加码。《纽约时报》试图修改对 OpenAI 和微软的版权诉状,进一步把“基础设施是否构成帮助侵权”推向法庭核心;而关于 AI 责任的讨论也再次强调,部署模型的组织不能把错误完全甩给系统本身。[2779][2791]
OpenAI 继续押注印度市场,任命首位印度总经理,说明增长前线仍在全球南方与高潜力市场展开。[2781]
与此同时,联合国开源周上的讨论把数字主权重新定义为“可迁移、可互操作、可替换”的基础设施选择,而不是封闭本土栈。这与今天的模型、云和芯片话题形成呼应:各国和机构都在寻找减少单点依赖的方法。[2789]
今天的新闻不是单点突破,而是同一个趋势的多面投影:更强的 AI 正在被更严格的安全、监管、成本和主权要求包围。未来的竞争,不只是模型参数和榜单成绩,而是谁能在可控、可负担、可合规的前提下持续交付能力。
Stories
OpenAI News
·#ai
OpenAI 预览了 GPT-5.6 Sol,并将其描述为下一代模型,在编程、科学和网络安全方面能力更强。该公司还表示,这一模型配备了其最先进的安全体系。
一个在编程、科学和网络安全方面都有提升的模型,可能会改变开发者、研究人员和安全团队在高风险场景中使用 AI 的方式。强调更强的安全体系也表明,能力提升正在与更严格的防护措施同步推进。
OpenAI 发布了 GPT-5.6 Sol 的预览版,将其定位为下一代模型。公司表示,这个模型在编程、科学和网络安全方面都比以往系统更强。OpenAI 还称,Sol 是其迄今为止在网络安全方面最强大的模型。公司表示,该模型推动了长周期安全任务中的性能与效率边界,其中包括漏洞研究和利用。
这种表述说明,重点不仅在于原始能力,也在于模型能否持续完成更复杂的多步骤工作。OpenAI 还表示,GPT-5.6 Sol 配备了其最先进的安全体系。这次发布是预览性质,因此它更多是在传递技术进展和方向,而不是一次包含全部技术细节的全面公开发布。
OpenAI 的预览特别强调了网络安全能力,称 GPT-5.6 Sol 在漏洞研究和利用等长周期安全任务上推动了性能与效率的边界。此次发布仍然只是预览,而非完整公开发布,因此面向公众的细节仍然有限。
Simon Willison
OpenAI 已开始有限预览 GPT-5.6 系列,推出 Sol、Terra 和 Luna 三个版本,分别面向旗舰能力、日常平衡使用以及低成本快速响应。公司表示,计划在未来几周内将这三款模型正式全面开放。
这次发布之所以重要,是因为它扩大了 OpenAI 的模型阵容,并把能力、速度和成本的权衡划分得更清楚,让开发者可以按不同产品需求选择模型。它也表明 OpenAI 继续重视 API 成本效率,尤其是更低价的档位和改进后的提示缓存,这会直接影响生产环境的使用成本。
2026 年 6 月 26 日,OpenAI 宣布开始对 GPT-5.6 系列进行有限预览。此次预览包含三款模型:Sol 被定位为旗舰模型,Terra 面向日常工作的平衡型模型,Luna 则强调快速和低成本。OpenAI 表示,Terra 的性能可与 GPT-5.5 相媲美,但价格便宜一半;Luna 则以最低成本提供较强能力。公司还表示,自己重视广泛可用性,并计划在未来几周内让 GPT-5.6 的 Sol、Terra 和 Luna 正式进入全面开放。
OpenAI 还称,在发布前已经就该计划及模型能力与美国政府进行了预览沟通。根据政府方面的要求,这次发布先从一小批受信任合作伙伴开始有限预览,这些合作伙伴的参与情况也已与政府共享,之后再更广泛推出。与此同时,OpenAI 公布了三种模型按 token 计费的价格,并改进了提示缓存机制。新的缓存规则包括显式缓存断点、30 分钟的最短缓存生命周期、按未缓存输入价格 1.25 倍计费的缓存写入,以及继续享受 90% 折扣的缓存读取。
GPT-5.6 按每 100 万 token 计费:Sol 为输入 $5 / 输出 $30,Terra 为输入 $2.50 / 输出 $15,Luna 为输入 $1 / 输出 $6。此次更新还加入了更可预测的提示缓存机制,包括显式缓存断点、30 分钟的最短缓存存活时间、按未缓存输入价格的 1.25 倍计费缓存写入,以及继续享受 90% 折扣的缓存读取。
Financial Times AI
OpenAI推出了GPT-5.6系列的有限预览版,但访问权限仅开放给少数可信合作伙伴,而且这些参与方已与美国政府共享。该系列包括Sol、Terra和Luna,其中Sol被定位为旗舰模型。
这次发布表明,前沿AI的获取权限正越来越受到政府监管影响,尤其是那些具备网络安全能力的模型。它可能会影响研究人员、企业和网络防御者,因为他们可能需要更久才能获得这些最新工具的广泛使用权限。
OpenAI表示,受美国政府要求影响,它正在将最新模型的访问权限限制给少数可信合作伙伴。GPT-5.6系列包括Sol、Terra和Luna,其中Sol是能力最强的模型,Terra适合日常平衡使用,Luna则更快、成本更低。尽管这次发布被称为有限预览,但OpenAI表示,参与预览的合作伙伴名单已经与政府共享。此举发生在AI公司面临更大压力、需要限制其最先进系统的背景下。报道指出,特朗普政府也对其他前沿模型的发布施加了限制,甚至在担心外国人访问后,要求Anthropic撤下其最强的公开模型。
OpenAI对此表示不满,认为这种政府访问流程不应成为长期默认做法,因为它会让用户、开发者、企业、网络防御者和全球合作伙伴无法及时获得最好的工具。OpenAI称,这次预览只是一个短期步骤,未来几周内将推动更广泛的开放,同时与政府合作制定新的网络安全框架,以及未来模型发布的可重复流程。OpenAI还表示,Sol是其迄今最强的模型,在编码、生物学和网络安全方面都有改进,并引入了max推理模式和ultra模式,后者通过协调多个子代理来处理复杂任务。公司称,Sol对对抗性攻击进行了强化,并刻意优化为优先支持防御性网络安全工作,而且其安全护栏是直接嵌入模型核心行为中的,而不是依赖外部过滤器。
OpenAI表示,GPT-5.6 Sol在编码、生物学和网络安全方面增强了代理能力,并新增了“max”和“ultra”推理模式。该公司还称,其安全体系直接内置于核心模型行为中,目标是优先支持防御性网络安全工作,而不是进攻性利用。
The Decoder

Epoch AI 和 METR 推出了 MirrorCode,这是一个要求 AI 模型在没有原始源码的情况下从零重建完整程序的新基准。早期结果显示,Claude Opus 4.7 以 56% 的解决率领先,其中包括在 14 小时内重写一个 16,000 行的生物信息学工具包。
MirrorCode 比许多短小且预算受限的基准更接近真实的软件工程工作,能衡量模型的长周期编程能力。它既显示了编程代理的快速进步,也表明最难的多日、数千行任务仍然会让所有测试模型失败。
Epoch AI 和 METR 的 MirrorCode 基准旨在测试 AI 系统能否从零重建完整程序,而不是只解决一些小型编程题。该基准包含 25 个目标程序,覆盖多个计算机科学领域,并要求模型精确复现原程序的输出,包括模型开发过程中看不到的隐藏端到端测试。与许多现有软件工程基准不同,MirrorCode 允许更大的推理预算,因为研究者希望它反映人类可能需要数天或数周才能完成的任务。Epoch AI 表示,其中一次最大的运行花费了 2,600 美元,并让模型在没有人工介入的情况下连续工作了 19 天。
当前最亮眼的结果来自 Claude Opus 4.7,它在 14 小时内以 251 美元的成本重写了 gotree,这是一个约 16,000 行 Go 代码的生物信息学工具包,包含 40 多个命令。Claude Opus 4.7 以 56% 的总体解决率领先,GPT-5.5 以 44% 紧随其后,Gemini 3.1 Pro Preview 则为 32%。即使模型没有完全完成任务,它们通常也能通过 90% 以上的测试,但最复杂的大型程序仍然没有任何测试模型能够攻克。Epoch AI 还指出,一年前的领先模型大约只能达到 30% 的成绩,而且大多只能处理更简单的工具类程序,这说明进步很快,但问题还远未被完全解决。
MirrorCode 覆盖 25 个目标程序,涉及 Unix 工具、数据序列化、生物信息学、解释器、静态分析、密码学和压缩,并通过隐藏的端到端测试来验证输出是否完全一致。Epoch AI 表示,其中一次最大规模运行花费 2,600 美元,让 AI 连续工作了 19 天;该基准已开源,包含 25 个程序中的 22 个,以及跨 6 种语言的 132 个任务实例。
The Decoder

Anthropic联合创始人Jack Clark表示,公司现在对初级工程师的需求更少了,因为包括Claude在内的AI工具可以承担过去需要大团队完成的工作。他说,招聘正在转向更有经验的人,因为“直觉的回报”如今高得多。
这反映了AI在一家领先AI公司内部带来的真实劳动力市场影响:初级技术岗位可能最先缩减,而资深经验的价值会更高。如果这种模式扩散,可能会重塑招聘路径、职业入门通道以及更广泛的白领就业趋势。
Anthropic联合创始人Jack Clark表示,由于AI改变了工程工作的扩展方式,公司对初级工程师的需求已经减少。在接受Reason采访时,他说Anthropic现在比以前更倾向于招聘经验非常丰富的人,因为“直觉”的价值变得更高了。Clark指出,过去需要大团队来支持实验的任务,如今可以借助Claude更高效地完成。这意味着公司不必再为了相同的工作量大量补充入门级员工。结果就是,招聘策略开始更偏向“资深直觉”,而不是初级人数。
Clark认为,这种变化不只是Anthropic自身的现象,也可能预示着其他行业正在发生的更广泛转变。他警告说,AI可能一边提高生产率和GDP增长,一边自动化初级工作并抬高失业率。按照他的说法,这种组合可能比以往的劳动力转型带来更严重的经济冲击。他还表示,各国政府目前并没有为这种冲击做好准备。
Clark将这种变化描述为一种规模化转变:过去经验丰富的研究人员需要庞大团队来做实验,但现在Claude可以分担这部分工作。他还警告说,AI可能在带来异常强劲GDP增长的同时推高失业率,形成政府尚未准备好的经济冲击。
The Decoder

Linux Foundation 联合约 20 家公司启动了 Akrites,包括 AWS、Google、Microsoft、OpenAI 和 Red Hat,目标是协调关键开源软件的漏洞披露与修复。该计划采用共享安全响应团队,并表示在项目无人维护时还会帮助直接补丁修复。
AI 工具正在显著加快漏洞发现和利用速度,这会进一步加重本就依赖志愿者维护的开源项目负担。若 Akrites 按预期运作,它有望减少重复报告、加快修复速度,并提升大量产品和服务所依赖软件的安全性。
Linux Foundation 宣布推出 Akrites,这是一个旨在保护关键开源软件免受 AI 赋能攻击的行业协作计划。该计划大约有 20 家机构参与,包括 Amazon Web Services、Anthropic、Cisco、Citi、Google、IBM、JPMorganChase、Microsoft、NVIDIA、OpenAI、Red Hat、Rust Foundation、Vodafone 和 Zscaler 等云、AI、安全、金融与基础设施公司。公告称,Linux Foundation 旗下的定向基金 Alpha-Omega 将提供种子资金。这个项目的目标是用更协调的机制,取代当前碎片化的漏洞响应方式。现在,多个组织常常对同一软件包进行扫描,提交重复报告,甚至发出相互冲突的补丁,这会让维护者不堪重负。Akrites 则建立了一个共享的 Security Incident Response Team,由其接收报告、验证问题并与项目维护者协调修复。
该计划采用协调漏洞披露流程,并依赖 CVE、CVSS 和 TLP 等既有框架。保密性被放在核心位置:每份报告最初都以 TLP:RED 处理,只有指定的案件团队才能查看,直到适合公开披露为止。Linux Foundation 认为,这一举措之所以重要,是因为现代 AI 系统可以在几分钟内扫描大型代码库,从而大幅降低发现和利用漏洞的门槛。Akrites 还计划在关键但已经无人维护的项目上充当“最后维护者”,确保补丁仍能交付给用户。该计划也会与政府机构协调,以便公共和私人防御方能够同步应对。
Akrites 的核心是一个统一的安全事件响应团队,用于审核报告、过滤重复项并按照协调漏洞披露流程推进修复。所有报告初始都以 TLP:RED 保密处理,该计划还沿用 CVE、CVSS 和 TLP 等标准,并计划在无人维护的软件包上充当“最后维护者”。
Ars Technica AI

《纽约时报》已请求法院修改其针对 OpenAI 和微软的版权诉状,新增指控称微软通过为 OpenAI 构建定制超级计算系统,故意帮助其侵犯受版权保护的作品。该动议还回应了最高法院在另一宗 Cox Communications 案中的最新裁决,因为该裁决改变了共同侵权的法律标准。
此事之所以重要,是因为它可能影响法院在 AI 时代如何判断帮助侵权的版权责任,尤其是在基础设施提供方被指控协助另一家公司实施侵权时。此案也给微软和 OpenAI 带来更大法律压力,这两家公司都处于生成式 AI 监管与诉讼关注的中心。
《纽约时报》在一份经过大量删减的法庭文件中,请求法院允许其修改针对 OpenAI 和微软的版权诉状。修订后的诉状将澄清其中一项主张,并加入更直接的指控,称微软通过为 OpenAI 构建一套定制超级计算系统,积极鼓励其窃取《纽约时报》的作品,而该系统被描述为全球最强大的系统之一。纽约时报表示,这一修改基于新的法律进展和在证据开示过程中发现的新证据。该动议的背景是,最高法院在另一宗涉及 Sony 和音乐盗版的 Cox Communications 案中支持了 Cox Communications,这一裁决收紧了共同侵权的标准。按照这一新标准,原告必须证明被告是故意诱导非法行为。
纽约时报称,修改后的诉状正是为了让其针对微软的共同侵权主张符合这一标准。与此同时,纽约时报同意自愿撤回针对所有被告的两项共同版权侵权和商标淡化指控。微软则把这份文件称为原告试图挽救一项已被近期裁决削弱的主张的最后努力。纽约时报则表示,微软和 OpenAI 都不会因修改而受到不公平影响,而且由于它不寻求针对修订主张进行额外证据开示,案件进度也不会被拖慢。
《纽约时报》表示,它正在收窄并强化自己的主张,包括自愿撤回针对所有被告的两项共同版权侵权和商标淡化指控。该报称,这次修改不应拖慢案件进度,因为它不要求增加新的证据开示;而微软则称此举是原告试图绕开不利先例的最后努力。
Simon Willison
Fernando Irarrázaval 在 hackmyclaw.com 上发起了一项公开挑战,测试人们能否通过给他的 OpenClaw 测试助手发邮件来诱导它泄露秘密。经过大约 6000 次尝试后,仍然没有人成功,而且这次实验大约消耗了 500 美元的 token 费用,还因为收到了过多入站邮件导致一个 Google 账号被暂停。
这个结果表明,当前最先进的模型在面对提示注入时正在变得更有抵抗力,尤其是在这种基于邮件的现实攻击场景中。这对构建能够读取消息、使用工具或访问敏感数据的 AI 助手的人来说很重要,因为提示注入仍然是智能体系统的主要安全风险之一。
Fernando Irarrázaval 发起了 hackmyclaw.com 挑战,想看看人们能否通过给他的 OpenClaw 测试实例发送精心构造的邮件来攻破这个 AI 助手。目标是诱导模型泄露秘密,这是一种典型的提示注入攻击,尤其针对那些需要读取不可信输入的系统。报道提到,参与者总共进行了大约 6000 次尝试。尽管攻击次数很多,但没有人成功提取出秘密。
整个实验据称消耗了大约 500 美元的 token 费用,而且由于入站邮件过多,还触发了一个 Google 账号暂停。该系统底层使用的是 Opus 4.6,助手被明确要求不要泄露 secrets.env、不要修改自己的文件、不要执行邮件中的命令,也不要把数据发送到外部端点。Simon Willison 认为,这和他自己观察到的现象一致:前沿模型的训练正在让这类攻击变得更难奏效。不过他也强调,这个结果不能被视为生产环境安全性的保证,因为更复杂的攻击者仍然可能找到突破口。
该助手运行的是 Opus 4.6,并带有明确的反提示注入规则,要求它不要泄露 secrets.env、不要修改文件、不要执行邮件中的代码,也不要把数据外传。这个结果并不能证明系统在生产环境中就是安全的;作者明确提醒,6000 次失败尝试并不等于可以抵挡更复杂的攻击。
TechCrunch AI

OpenAI任命前Uber印度和南亚总裁Prabhjeet Singh担任其首位印度总经理。Singh将于9月加入,并向OpenAI亚太区管理董事Kiran Mani汇报,负责消费端增长、企业采用、合作伙伴关系、监管沟通和运营。
这表明OpenAI正在把印度视为美国之外最重要的增长市场之一。此举可能帮助公司深化本地合作、应对政策问题,并在美国AI公司争夺印度用户、开发者和企业客户的竞争中获得更强位置。
OpenAI任命前Uber印度和南亚总裁Prabhjeet Singh为其首位印度总经理。Singh已于周五从Uber离职,并将于9月加入OpenAI。按照安排,他将向OpenAI亚太区管理董事Kiran Mani汇报。OpenAI表示,Singh的职责将覆盖印度市场的消费端增长、企业采用、合作伙伴关系、监管沟通以及运营。此次任命延续了OpenAI在印度的持续加码。公司去年8月在新德里开设了首个办公室,今年早些时候又表示将进一步在孟买和班加罗尔设点。
此前,OpenAI还引入了Pragya Misra负责公共政策与合作,之后她的职责扩大为战略和全球事务负责人;公司也曾请来前Twitter印度负责人Rishi Jaitly担任高级顾问,帮助建立与印度政府在AI政策上的沟通。过去几个月里,OpenAI已经在高等教育、企业支付、AI驱动的商业和网页流媒体等领域达成合作,同时也参与到印度不断扩张的数据中心建设中。OpenAI多次强调,印度是其仅次于美国的第二大市场,而ChatGPT在印度的快速普及是公司持续投入的重要原因。与此同时,OpenAI还在印度招聘AI部署工程师、开发者体验工程师、开发者营销负责人、合作伙伴总监和解决方案工程师等职位。报道指出,随着印度成为美国AI公司争夺的核心战场之一,Anthropic也在近期于班加罗尔开设印度办公室,并任命前微软印度总经理Irina Ghose负责印度业务。
OpenAI已经在新德里开设办公室,并计划在孟买和班加罗尔设立新办公室,同时持续招聘AI部署工程师、解决方案工程师等岗位。公司还提到其在高等教育、企业支付、AI驱动商业和网页流媒体等领域的合作,并强调ChatGPT在印度的采用正在快速增长。
TechCrunch AI

TechCrunch 强调,OpenAI、Google、Apple 和 SpaceX 正越来越多地自研定制芯片,以减少对英伟达的依赖。节目还特别提到 OpenAI 与 Broadcom 合作打造的自定义推理芯片 Jalapeño,作为 AI 硬件格局变化的一个信号。
这件事重要在于,定制芯片可以让大型科技公司在性能、成本和供应上获得更多控制权,尤其是在 AI 负载越来越大、且战略意义越来越强、不能只依赖单一供应商的情况下。若更多公司走这条路,英伟达将面临更强竞争,而更广泛的 AI 基础设施市场也可能变得更加分散和专业化。
英伟达多年来一直主导 AI 芯片市场,但 TechCrunch 认为,这种几乎完全依赖单一供应商的时代可能正在结束。节目中,主持人讨论了越来越多公司开始自研定制硅芯片,以降低单一供应风险。OpenAI 也是这一趋势的一部分,它已经公布了与 Broadcom 合作打造的 Jalapeño 定制推理芯片计划。讨论把 OpenAI 与 Google、Apple 和 SpaceX 放在一起,作为试图掌握自身硬件路线图的典型代表。
文章的核心观点并不是这些公司要彻底抛弃英伟达,而是希望拥有一种“对冲”手段,从而获得更多控制权。定制芯片可以针对特定工作负载进行优化,因此可能带来更好的性能,并减少对通用硬件的依赖。节目还把这一趋势与 AI 基础设施、半导体竞争,以及下一层计算控制权归属的更大问题联系起来。
文章将定制芯片描述为一种“对冲”而不是彻底脱离英伟达,强调这种方式能让硬件更贴合特定工作负载,并带来更强的性能和平台控制力。文章还把这一趋势与 Apple 当年脱离 Intel 后获得的性能与平台掌控能力联系起来。
TechCrunch AI

TechCrunch 认为,真正重要的变化不再是 Anthropic 和 OpenAI 之间的竞争,而是美国政府在决定前沿模型何时可以发布方面扮演越来越大的角色。文章称,OpenAI 的 GPT-5.6 也将进入有限预览,并且在获得全面发布许可前,审批可能会按客户逐一进行。
如果政府开始在前沿模型大规模发布前进行审查,模型上线速度、商业回报和实验室对高成本研发的规划都可能受到影响。这个变化也不只关乎单个公司,还可能影响数据中心投资、安全治理以及更广泛的 AI 市场。
TechCrunch 将当前局面描述为一种转变:重点已经不再是 Anthropic 和 OpenAI 之间的简单竞争。文章认为,美国政府正在成为决定哪些前沿 AI 模型可以发布的核心力量。文中提到,Anthropic 的 Fable 和 Mythos 模型已经被拉入审查流程,而 OpenAI 的 GPT-5.6 似乎也正走向类似的有限预览阶段。根据文章引用的报道,在获得更大范围发布之前,模型可能会先以“按客户逐一”审批的方式开放。文章警告说,即使只是短短几周的审查,也可能显著削弱 AI 实验室在每个新模型上的商业回报。
它还指出,若模型开发节奏因此放缓,持续进行中的数据中心扩建也可能受到拖累。作者强调,这不是某一家公司单独面临的问题,而是整个行业都可能被一种笨拙的审批机制影响。文章同时承认,在网络安全、生物风险和对齐等领域确实存在真实风险,但认为仅仅限制模型发布并不能解决全部问题。相反,文章主张行业可能需要与独立机构合作,并接受“没那么差”的监管方案,而不是把监管当成竞争武器。
文章指出,Anthropic 的 Fable 和 Mythos 模型已经陷入类似的停滞状态,而且 Mythos 预览期已经持续数月,仍看不到明确的正式发布路径。文章还认为,美国政府缺乏足够能力和技术清晰度来界定这种审查流程所需的安全保证,以及它究竟要针对哪些风险。
TechCrunch AI

TechCrunch 的 Equity 播客讨论了 OpenAI 的 Jalapeño,这是一款与 Broadcom 合作打造的定制推理芯片。节目将其放在更大的背景下来看:越来越多的大型科技公司开始自研芯片,以降低对 Nvidia 的依赖。
如果主要 AI 公司把更多工作负载转向定制芯片,它们就能在性能、成本和供应风险上获得更多控制权。这会削弱 Nvidia 在 AI 基础设施中的短期主导地位,并加速整个行业向硬件多元化转型。
节目一开始就提出一个判断:Nvidia 多年来一直主导 AI 芯片市场,但这种“完全依赖”的局面可能正在改变。OpenAI 已经披露了 Jalapeño 的计划,这是一款与 Broadcom 合作打造的定制推理芯片,而这一动作被放在更大的行业转向定制硅片的背景下理解。节目强调,这并不是要彻底取代 Nvidia,而更像是一种对冲手段,让公司对自己的算力栈拥有更多控制权。讨论还指出,定制芯片可以针对特定工作负载进行优化,并可能带来更高效率,这类似于 Apple 当初摆脱 Intel 后获得的收益。
节目把 OpenAI 与 Google、Apple、SpaceX 等公司放在一起,说明大型企业都在尝试降低关键硬件上的单一供应商风险。与此同时,这种芯片布局之所以重要,是因为推理是 AI 产品大规模落地的核心环节之一。除了 Jalapeño,节目还谈到 Groq 的大额融资、AI agent 变得更强、Agility Robotics 计划通过 SPAC 上市,以及 Google DeepMind 对电影制作 AI 工具包的投资。整体来看,这一段内容把 OpenAI 的芯片消息视为一个信号:AI 硬件市场正在变得更分散,对 Nvidia 的依赖也可能不再像过去那样绝对。
Jalapeño 被描述为一款推理芯片,而不是训练芯片,这意味着它主要面向模型训练完成后的高效运行,而不是训练本身。文章将定制芯片视为一种对冲策略,而不是彻底摆脱 Nvidia;OpenAI 也加入了 Google 和 Apple 等公司,开始追求针对特定工作负载优化的硬件。
TechCrunch AI

TechCrunch报道称,OpenAI不会立即向公众广泛开放GPT-5.6,而是在预览期内只向少数密切合作伙伴提供访问权限。报道还称,Sam Altman在内部表示,政府将按客户逐个批准访问,如果试运行顺利,几周后可能再进行更广泛发布。
如果属实,这意味着美国政府正在直接影响前沿AI模型的发布方式,而不只是上线后的监管。这可能会重塑行业对分阶段部署、安全审查以及商业化速度与公共风险控制之间平衡的预期。
TechCrunch报道称,OpenAI即将推出的下一代模型GPT-5.6将采取一种不同寻常的限制性发布方式。与通常直接面向公众上线不同,这家公司据说只会在预览期内向少数密切合作伙伴开放该模型。报道指出,Sam Altman在内部告诉员工,访问权限将由政府“按客户逐个批准”。如果预览进展顺利,OpenAI据称希望在几周后再扩大到更广泛的发布。The Information还称,OpenAI员工一直与政府密切合作制定这次发布计划。
据报道,要求限制性发布的机构包括国家网络总监办公室和白宫科技政策办公室。文章认为,这反映出特朗普政府正在从最初的“少干预”AI立场,转向更直接的联邦介入。报道还把这一做法与Anthropic对其前沿网络安全模型Claude Mythos的自愿克制进行对比,后者只通过一个小型合作伙伴计划向少数对象开放。文章指出,背后的原因是担心强大的AI系统会被滥用于网络犯罪和漏洞利用。与此同时,文章也提醒说,由于这些系统仍然是封闭的,外界很难准确判断它们到底有多危险。
报道指出,国家网络总监办公室和白宫科技政策办公室参与推动了限制性发布方案,而且OpenAI员工据称一直与政府密切合作制定发布计划。更大的背景是,特朗普政府近来转向对新模型进行更多联邦层面的监督,包括签署行政命令,要求企业在公开发布前自愿接受测试和评估。
The Decoder

OpenAI 发布了 GPT-5.6 新模型系列,包含 Sol、Terra 和 Luna 三个层级。Sol 是旗舰模型,目前仅通过 API 和 Codex 向少数合作伙伴开放预览,并受到美国政府访问规则的限制。
这次发布之所以重要,是因为 OpenAI 正把 GPT-5.6 定位为 Anthropic Claude Mythos 系列的直接竞争对手,同时强调它在代理式编程和网络安全方面更高效。受限上线也凸显了前沿 AI 的开放获取、政府监管与开发者需求之间日益加剧的矛盾。
OpenAI 推出了 GPT-5.6 Sol,这是一个旨在与 Anthropic Claude Mythos 系列竞争的新一代模型。当前发布仍处于受限阶段,只通过 API 和 Codex 向少数合作伙伴开放,OpenAI 说这是在美国政府明确要求下进行的。公司还表示,这种访问控制不应成为长期默认做法,因为它会让用户、开发者、企业、网络防御者和全球合作伙伴无法及时获得最强工具。GPT-5.6 还引入了新的分层命名方式,其中 Sol 是旗舰型号,Terra 是平衡型模型,Luna 是最便宜的版本。OpenAI 称 Terra 的性能接近 GPT-5.5,但成本只有一半,而 Luna 面向更低成本的使用场景。
这个系列还提供 “max” 模式用于更深度推理,以及 “ultra” 模式,将复杂任务分配给并行运行的子代理。基准测试方面,OpenAI 表示 Sol 在代理式编程上领先,并且在网络安全任务中表现强,同时消耗的 token 更少。OpenAI 还提到,Sol 在 GeneBench v1、ExploitBench 和 ExploitGym 上都有不错表现,但它仍低于公司定义的 “Cyber Critical” 阈值,因为它更擅长发现和修复漏洞,而不是独立执行完整的自动化攻击。OpenAI 同时公布了定价:Sol 每百万 token 输入 5 美元、输出 30 美元,Terra 和 Luna 则更便宜,并表示 Sol 将在 7 月登陆 Cerebras,速度最高可达每秒 750 token。
OpenAI 表示,Sol 在多个基准测试中与 Claude Mythos 5 持平或更强,并在代理式编程方面明显领先,在网络安全任务中也更节省 token。Terra 被定位为更便宜、性能接近 GPT-5.5 的型号,Luna 则是最低成本选项;OpenAI 还加入了“max”和“ultra”模式,用于更深度推理和并行子代理执行。
The Decoder

AI 初创公司 Lindy 据称已经用 DeepSeek 完全取代了 Anthropic 的 Claude,首席执行官 Flo Crivello 表示,这一调整为公司节省了数百万美元。他说,公司的 AI 账单已经变得难以承受,只有当 Anthropic 降价时他才会考虑换回去。
这清楚表明,模型定价已经成为竞争的核心战场,而不只是模型质量本身。如果初创公司能够在性能损失可接受的情况下切换到更便宜的替代方案,那么像 Anthropic 这样的高价供应商将面临更大的利润率和增长压力。
文章称,AI 初创公司 Lindy 已经完全放弃 Anthropic 的 Claude,转而使用 DeepSeek,以降低模型成本。首席执行官 Flo Crivello 接受 CNBC 采访时表示,切换之后公司的成本曲线“直接坠落”,为公司节省了数百万美元。他称 Lindy 的 AI 开支已经“不可持续”,并指出在这家只有 25 人的公司里,模型成本已经超过了人员成本。Crivello 还表示,如果 Anthropic 降价,公司会考虑重新回到 Claude,这说明这次调整不是出于产品偏好,而是出于生存压力。
文章将这一举动视为 Anthropic 面临的成本压力正在加剧,因为客户对 AI 支出越来越敏感。它同时指出,更便宜的中国模型在性价比方面正变得更有吸引力。文章引用了 Snowflake 首席技术官的一项分析,称 GLM-5.2 等模型虽然未必完全达到 Claude 的水平,但在不同任务上仍可能具有竞争力。文章还提到 OpenAI 首席执行官 Sam Altman 的说法,即随着代理式系统大量消耗 token,AI 成本已经成为企业面临的“巨大问题”。
Crivello 表示,Lindy 只有 25 人,且 AI 成本已经超过人力成本,这说明推理开支可能会迅速吞噬小公司的预算。文章还提到,Lindy 使用的是由美国公司托管、部署在美国本土的 DeepSeek,如果 Anthropic 降价,公司会考虑回到 Claude。
The Verge AI

距离 Anthropic 将其 Mythos 级模型下线已经过去两周,但公司与特朗普政府就出口管制和外国访问限制的谈判仍未解决。The Verge 报道称,Mythos 5 和 Fable 5 目前仍然无法使用,而相关磋商仍在华盛顿继续。
这是一场高风险的试验,检验美国将如何通过出口管制法律来监管前沿 AI 系统。结果可能影响 Anthropic 的收入、先进模型的可用性,以及类似限制是否会扩展到其他 AI 公司。
Anthropic 在收到特朗普政府周五晚间的最后通牒后,已经把 Mythos 级模型下线了两周。公司迅速派出多位高管前往华盛顿特区,但公开更新非常有限,恢复服务的时间表仍然不明确。Anthropic 本周多次拒绝置评,只表示没有新消息可分享。现在这种不确定性已经不只是 Anthropic 自身的问题,因为政府可能会把类似命令扩展到其他具备相似能力的 AI 系统。报道称,6 月 12 日的出口管制命令以国家安全为由,要求 Anthropic 阻止任何外国公民访问 Mythos 5 和 Fable 5。
这个限制甚至适用于在 Anthropic 内部工作的非美国公民,这使公司几乎没有办法继续让这些模型保持在线。报道指出,问题的核心可能在于:出口管制被施加到 AI 系统时,并没有一套成熟统一的框架,不像传统的“双用途”产品那样可以用既定清单审核。原本通常需要数月甚至数年的流程,因为一项关于 Fable 5 护栏可能被绕过的担忧而在几天内被压缩完成。安全研究员 Katie Moussouris 认为这个问题被夸大了,并指出让模型帮助修复代码、解释修改原因并编写测试,是防御性安全工作中非常关键的能力。与此同时,据报道 Anthropic 联合创始人 Tom Brown 已接替 CEO Dario Amodei 参与谈判,但整体进展看起来仍然停滞。
据称,6 月 12 日的命令要求 Anthropic 停止向“任何外国公民”提供 Mythos 5 和 Fable 5 的访问权限,甚至包括在公司内部工作的非美国公民。争议之所以复杂,是因为目前缺少一套明确的框架来把出口管制应用到 AI 模型上,而据报 Fable 5 可能存在的护栏绕过问题又加速了这次限制。
ZDNET AI

在纽约举行的联合国开源周上,各国官员和技术人员把数字主权从政策口号推进为可执行目标。来自德国、爱尔兰、摩洛哥、坦桑尼亚等国家的发言者认为,开源、互操作性和开放式 AI 是降低对美国云巨头依赖的现实基础。
这场讨论反映出一个更大的转变:各国不再追求封闭的本土技术栈,而是转向可迁移、可替换的基础设施,以便在供应商变化时不影响关键服务。若被广泛采纳,这些原则可能重塑全球公共部门的云战略、采购方式和 AI 治理。
ZDNET 报道称,在纽约举行的联合国开源周上,数字主权成为核心议题,来自各国的部长和技术人员把它重新定义为一项面向基础设施的实际行动方案。会议传达的核心观点是,各国不应追求封闭的国家技术栈,而应拥有自己的数据和基础设施,并保留在供应商和模型之间自由切换的能力。与会者认为,只有建立在开放标准和开源软件之上,这种能力才真正可行。文章指出,这场讨论并不局限于欧洲,全球南方多个国家也对过度依赖 Microsoft、Google 和 Amazon Web Services 表达了不满。坦桑尼亚提供了最清晰的实践案例,部长 Angellah Jasmine Kairuki 表示,该国正在从“被动消费技术”转向“主动创造技术”。
她强调,数字主权意味着拥有权和按本国条件开展合作,而不是孤立。坦桑尼亚还给出了具体数据:在电子政务、数据保护、网络犯罪和行业监管等法律框架下,超过 90% 的政府系统已运行在开源技术之上。Kairuki 还说,该国已经培训了大约 500 名公务员,使他们能够作为协作型开发者社区来建设和维护公共系统。在另一场关于 AI 主权的讨论中,Cloudera 首席技术官 Sergio Gago 指出,如果数据、基础设施和治理过度集中,AI 只会更快、更大规模地放大既有偏见。他认为,互操作性是参与的前提,主权是持续运行的前提,并提出“私有 AI”需要回答的一系列实际问题,例如数据到底存在哪里、谁可以访问、如果更换模型或供应商系统是否还能继续运行。
坦桑尼亚表示,其政府系统中已有超过 90% 运行在开源技术之上,并由 2020 年《电子政务管理局法》、2023 年《个人数据保护法》等法律提供支撑。在 AI 主权讨论中,Cloudera 首席技术官 Sergio Gago 警告说,数据、基础设施和治理过度集中会让偏见更快、更大规模地扩散,并强调真正的主权需要互操作性,以及在不影响服务的情况下替换模型和供应商的能力。
Simon Willison
Simon Willison 链接了 Andrew Nesbitt 的讽刺作品《Incident Report: CVE-2026-LGTM》,其中设想两个来自不同厂商的 AI 代码审查代理在一个依赖升级 foxhole-lz4 的拉取请求上陷入争论循环。这个虚构事件最终演变成 340 条评论和 41,255 美元的推理成本,随后财务部门撤销了两个 API 密钥。
尽管是虚构故事,它仍然触及了 AI 代理参与代码审查、软件供应链安全以及失控用量成本等真实担忧。它说明了多智能体系统可能带来噪声式争论、运营风险,以及让工程和财务团队都措手不及的高额账单。
2026 年 6 月 26 日,Simon Willison 发布了一篇链接文章,指向 Andrew Nesbitt 的《Incident Report: CVE-2026-LGTM》。这篇被链接的内容被写成一份关于 AI 代码审查代理的模拟事故报告。故事里,两个来自不同厂商的代理同时挂在同一个下游拉取请求上。这个拉取请求把一个名为 foxhole-lz4 的依赖进行了升级,而两个代理对它是否恶意产生了分歧。
这个分歧不断升级,最后变成了一个循环,累计生成了 340 条评论。虚构的审查过程还消耗了 41,255 美元的推理费用。等到成本异常被发现后,财务部门撤销了两个厂商的 API 密钥。讽刺的结尾是,其中一家厂商的市场团队把这次事故包装成新闻稿,宣称“对抗性多智能体安全推理同比增长 430%”,随后股价上涨了 6%。
故事围绕一个下游拉取请求展开,该请求把名为 foxhole-lz4 的包进行了升级,而两个 AI 审查器都把它当成可能有恶意。它的笑点来自不断升级的冲突和荒诞的公司反应,而不是一个真实漏洞报告或已确认的 CVE。
Simon Willison
Bruce Schneier argues that organizations should remain legally liable for mistakes made by AI systems they deploy, especially in cases like AI-generated summaries.
A concise commentary on an important legal/AI accountability issue, but it is a short link post rather than a deep technical analysis. No discussion comments are provided, so community discussion quality cannot be assessed.
25th June 2026 - Link Blog AI and Liability . Bruce Schneier on the recent German ruling that Google be held liable for errors introduced in their AI overviews: AI agents are agents of the person or organization that deploys them—and should be treated by the law as such. If a company hired human writers to write its summaries, that company would be liable for inaccuracies in those summaries. [...] To allow businesses to hide behind the excuse of faulty AI in those same circumstances would be a massive handout to companies, and would introduce disastrous incentives for corporate misbehavior.