Nvidia推出RTX Spark助力Windows本地AI

The Decoder·6月1日 21:17 UTC·作者 Maximilian Schreiner

关键信息

Nvidia表示RTX Spark采用统一内存设计，CPU和GPU共享同一内存池，并提供从16 GB到128 GB的多个版本。公司还推出了OpenShell Runtime，用于代理隔离、策略执行，以及根据隐私设置在本地模型和云端模型之间路由请求。

资讯摘要

Nvidia在GTC Taipei上发布RTX Spark，将其作为进入Windows笔记本本地AI代理领域的首个重要动作。该芯片本质上是已知DGX Spark硬件的Windows版本，但面向的是消费级设备和紧凑型系统，而不是Linux AI工作站。顶配版本采用GB10 Grace Blackwell Superchip，并提供多个SKU，在核心数量、SM数量和内存容量上有所不同。Nvidia称旗舰配置由Blackwell RTX GPU、6,144个CUDA核心和第五代Tensor Cores组成，同时搭配20核Arm架构Grace CPU，并通过NVLink-C2C互联。Nvidia还表示，MediaTek参与了CPU设计。该方案的内存最高可达128 GB，且CPU与GPU共享，这也是其本地AI工作负载卖点的核心。

公司宣称在稀疏条件下可实现1 petaflop的FP4性能，但也说明实际GPU性能会因负载不同而大致接近GeForce RTX 5070 Laptop GPU。Nvidia把这款产品视为对Apple Silicon和Qualcomm Windows-on-Arm芯片的直接回应。除了硬件，Nvidia还推出了身份管理、隔离和策略执行等Windows组件，以及OpenShell Runtime，用于定义代理权限，并决定数据何时留在本地、何时发送到云端。Nvidia称Hermes Agent和OpenClaw等开源项目已经把这层能力集成进Windows应用。Adobe也借此宣布重建Photoshop和Premiere，Premiere将加入TensorRT集成，Photoshop则引入GPU加速合成。Nvidia表示，RTX Spark设备将于2026年秋季由ASUS、Dell、HP、Lenovo和Microsoft Surface等厂商推出。

资讯正文

英伟达将 RTX Spark 定位为终于让 Windows 设备上的本地 AI 智能体变得实用的芯片

要点

- 英伟达宣布推出 RTX Spark，这是一款面向 Windows 笔记本的 Grace Blackwell 芯片，最高配备 128 GB 统一内存和 1 petaflop 的 FP4 AI 计算能力，直接与 Apple Silicon 和高通 Snapdragon 展开竞争。

- 该芯片面向本地 AI 智能体运行，并由新的安全工具提供支持，例如用于智能体隔离和隐私控制的 OpenShell Runtime。

- 包括 ASUS、Dell、HP、Lenovo 和 Microsoft Surface 在内的主要 OEM 设备将于 2026 年秋季上市。

RTX Spark 是英伟达进军 Windows 笔记本的第一步，旨在本地运行 AI 智能体。这款硬件是已为人熟知的 DGX Spark 芯片的 Windows 版本。

英伟达在 GTC Taipei 上发布了 RTX Spark。在最高规格上，这款芯片与为 DGX Spark 提供动力的 GB10 Grace Blackwell Superchip 是同一款。不同之处在于其目标用户。RTX Spark 面向消费者级 Windows 笔记本和紧凑型台式机，而不是面向 AI 开发者的 Linux 工作站。英伟达提供了多个变体，拥有不同的核心和 SM 数量，以及从 16 GB 到 128 GB 不等的内存选项。

顶配 SKU 将 Blackwell RTX GPU 与 6,144 个 CUDA 核心和第五代 Tensor Core，搭配一颗基于 Arm 的 20 核 Grace CPU，并通过 NVLink-C2C 连接。英伟达称，这款 CPU 由联发科协助设计。内存最高为 128 GB，由 CPU 和 GPU 共享。英伟达规格中所称的 1 petaflop 峰值，指的是在稀疏性条件下的 FP4 精度，属于理论上的最佳情况。英伟达表示，GPU 性能会根据工作负载不同，接近 GeForce RTX 5070 Laptop GPU。

英伟达对 Apple Silicon 和 Snapdragon 的回应

RTX Spark 延续了苹果在 2020 年为其 M 系列芯片开辟的路径：Arm CPU、GPU 和内存控制器集成在同一封装中，共享统一内存池，而不是使用独立的 VRAM。苹果的 M4 Max 也提供最高 128 GB 的统一内存，带宽为 546 GB/s，但其 Neural Engine 的上限为 38 TOPS（INT8）。相比之下，RTX Spark 宣称约为 1,000 TOPS，不过这是基于带稀疏性的 FP4，因此条件差异很大。即便如此，原始 AI 计算能力上的差距仍然相当显著。英伟达真正的优势仍然是其 CUDA 技术栈，包括可原生运行的 TensorRT 和 RTX。

高通也在 2024 年借助 Snapdragon X Elite 进入 Windows-on-Arm 笔记本市场，随后又在 2025 年 9 月推出 X2 Elite，将 18 个 Oryon 核心的性能提升到 80 TOPS。这些芯片围绕微软的 Copilot+ 功能构建，而不是面向具有数十亿参数模型的本地推理。英特尔和 AMD 的传统 x86 平台仍然依赖分离的 CPU 和 GPU 内存，以及小得多的 NPU。

本地 AI 智能体获得新的安全护栏

英伟达认为，AI 代理很少会在用户的主设备上运行，因为此前一直缺少合适的安全工具。新的 Windows 组件将提供身份管理、代理隔离和策略执行。Nvidia OpenShell Runtime 则增加了另一层能力：它定义代理被允许执行的操作，根据隐私设置将请求路由到本地模型或云端模型，并在云端查询中对个人数据进行遮蔽。英伟达表示，开源项目 Hermes Agent 和 OpenClaw 已经将这一层集成到了它们的 Windows 应用中。

Adobe 还宣布了将 Photoshop 和 Premiere 重构为适配现代 GPU 的计划。Premiere 将获得带有 Nvidia TensorRT 集成的新视频管线。Photoshop 将获得带有 GPU 加速合成的新引擎。在 RTX Spark 上，Premiere 还应能受益于共享内存池。Adobe 表示，这一目标是让 AI、编辑和特效工作流的速度最高提升两倍。

除了这款笔记本芯片，英伟达还展示了面向 Windows 的 DGX Station。它基于 GB300 Grace Blackwell Ultra Desktop Superchip，拥有最高 748 GB 的共享内存和 20 petaflops 的 FP4 性能。英伟达表示，它可以在本地运行参数规模高达一万亿的模型。该产品将于 2026 年第四季度发货。

RTX Spark 设备将从 2026 年秋季开始由 ASUS、Dell、HP、Lenovo、Microsoft Surface 和 MSI 推出。

来源与参考

收录于 2026-06-02