XCENA融资1.35亿美元押注AI内存瓶颈

TechCrunch AI··作者 Kate Park

关键信息

MX1 通过 CXL 连接到 CPU,并在内存模块内部直接处理预处理、KV cache 管理和数据缓存等任务。XCENA 表示该芯片目前仍是原型,计划在 2026 年底前进入三星代工产线量产,并预计于 2027 年开始产生收入。

资讯摘要

TechCrunch 报道称,XCENA 完成了 1.35 亿美元的 B 轮融资,投后估值达到 5.7 亿美元,这反映出投资者仍在积极押注 AI 基础设施效率提升方向。这家成立四年的初创公司在韩国和美国都设有办公室,其核心观点是:AI 最大的瓶颈不只是算力,而是内存数据流动。按照传统流程,一次 AI 查询会让数据先从内存到 CPU 做预处理,再到 GPU 做计算,然后再返回;而生成每个 token 时,这个过程都会重复。XCENA 认为,这种架构会迫使大量常规工作经过行业中最昂贵、最耗电的芯片,造成明显浪费。为此,公司推出 MX1 芯片,希望把计算能力更靠近 DRAM,让常见数据操作直接在内存附近完成。

XCENA 说,这样可以减少 CPU、GPU 和内存之间反复往返的数据搬运,某些场景下甚至可能把原本需要 10 台服务器的工作量压缩到 1 台。公司 CEO Jin Kim 表示,团队由来自 Samsung 和 SK Hynix 的老兵组成,目标是让内存也像 CPU 和 GPU 一样“更智能”。XCENA 重点瞄准的是 AI 推理中围绕模型运转的部分,例如预处理、KV cache 管理和缓存,而不是 GPU 最擅长的矩阵乘法。公司还称,自去年下半年以来,市场对内存解决方案的需求显著上升,其理想客户是每年在 AI 基础设施上投入数百亿美元的超大规模云厂商。MX1 目前仍是原型,计划在 2026 年底前进入三星代工厂量产,预计 2027 年开始产生收入;与此同时,公司也将 Astera Labs 和 Marvell 视为主要竞争者,并强调自己的差异化来自更大的 IP 储备和数千个 RISC-V 核心。

XCENA融资1.35亿美元押注AI内存瓶颈

资讯正文

每次你向 ChatGPT 提出一个问题,你的请求都会触发一场数据接力赛。信息先从内存中取出,经过 CPU 进行预处理,接着传到 GPU 做重计算,然后再返回——而 AI 生成的每一个词,整个过程都要重复一遍。

瓶颈就在于这种结构性设计——这意味着每一次请求都要路由经过业内一些最昂贵、最耗电的芯片。总部位于韩国和美国的初创公司 XCENA 正试图解决的,正是这种低效问题。这家成立四年的初创公司设计了一款芯片,将计算能力尽可能靠近 DRAM——也就是存放处理器正在使用数据的高速短期存储芯片——从而让常规数据操作可以在靠近内存的位置完成,而无需在 CPU、GPU 和内存之间来回奔波,付出高昂代价。

如果这一方案能够规模化落地,对 AI 基础设施成本的影响可能会非常显著,这在很大程度上也解释了投资者对这家公司热情高涨的原因。事实上,XCENA 刚刚完成一轮 1.35 亿美元的 B 轮融资,估值达到 5.7 亿美元,使其累计融资额达到 1.85 亿美元。

XCENA 首席执行官 Jin Kim 于 2022 年与首席技术官 Dohun Kim 以及首席产品官 Harry Juhyun Kim 共同创立了这家公司,三人都曾在三星和 SK 海力士任职,这两家存储巨头为 Nvidia 的 GPU 提供芯片支持。Jin Kim 在接受 TechCrunch 采访时表示:“几十年来,CPU 和 GPU 都变得更聪明了。内存却没有。XCENA 想改变这一点。”他补充说:“近期内存价格和相关股票的上涨,表明 AI 基础设施正朝着以内存为中心的架构发生更广泛的转变。”(本月,全球存储芯片市场占据主导地位的三家公司——三星、SK 海力士和美光——市值都首次突破了 1 万亿美元。)

Kim 表示,XCENA 正把公司的商业模式押注在这样一个判断上:“推理不仅仅是一个计算问题;它越来越成为一个内存扩展问题。”

XCENA 的芯片 MX1 通过 CXL(Compute Express Link)连接到 CPU——本质上是在处理器和内存之间开辟的一条专用快车道——在数据甚至还不需要离开内存模块之前就对其进行处理。它把计算带到数据所在的位置,而不是反过来。公司称,过去需要 10 台服务器才能完成的工作,现在有可能只用 1 台就能运行。

Kim 说:“GPU 在矩阵乘法上表现出色——这正是 AI 模型训练背后的重型数学运算——但周边大量的数据编排工作,包括预处理、KV cache 管理(即存储此前对话上下文、让模型无需重新处理的系统)以及数据缓存,仍然运行在 CPU 上。我们的芯片直接在内存模块内部处理这些任务。”

自去年下半年以来,市场对内存解决方案的需求激增,而公司认为这一时机正对自己有利。

公司已与几家全球内存供应商展开对话,但 Kim 拒绝透露具体名称。公司的理想客户是每年在 AI 基础设施上投入数百亿美元的超大规模云服务商,在这样的环境下,即便内存效率只提高一点点,也可能意味着数亿美元的节省。

MX1 仍然只是一个原型。量产芯片计划于 2026 年底前在三星的代工生产线上下线,公司预计将从 2027 年开始产生收入。

当神经处理单元(NPU)厂商都在争相挑战英伟达在训练工作负载上的地位时,XCENA 盯上的是支撑这一切的、对内存高度密集的底层环节。

XCENA 最接近的竞争对手包括 Astera Labs 和 Marvell,这两家公司都在纳斯达克上市,正在研发下一代内存连接技术。Kim 表示,Marvell 是一家规模更大、资历更深的厂商,已经在同一领域开展工作;而差异化关键在于知识产权。“我们有数千个核心,”Kim 说。根据公开规格作比较,Marvell 的方案相对依赖少数几个通用核心。

这些核心基于 RISC-V——一种开源芯片设计蓝图——并针对数据处理进行了专门优化,每个核心都被有意设计得尽可能小巧高效。除了核心本身之外,XCENA 还自行设计内部内存层级、互连总线和 DRAM 控制器——这种程度的垂直整合,即便是更大的竞争对手在内的大多数芯片公司,通常也会外包出去。

这轮 B 轮融资由首尔风投公司 Atinum 和 IMM Investment 共同领投,Corstone Asia 以及现有投资者 SBI Investment 和 Mirae Asset Capital 也参与其中。该公司在盆唐和硅谷的 Sunnyvale 设有办公室,员工超过 90 人,同时也在与国际投资者就追加融资进行洽谈。

来源与参考

  1. 原始链接
  2. This chip startup just raised $135M on a bet that AI's biggest bottleneck isn't compute -- it's memory | TechCrunch

收录于 2026-05-30