XCENA融资1.35亿美元押注AI内存瓶颈

TechCrunch AI·5月29日 20:00 UTC·作者 Kate Park

关键信息

MX1 通过 CXL 连接到 CPU，并在内存模块内部直接处理预处理、KV cache 管理和数据缓存等任务。XCENA 表示该芯片目前仍是原型，计划在 2026 年底前进入三星代工产线量产，并预计于 2027 年开始产生收入。

资讯摘要

TechCrunch 报道称，XCENA 完成了 1.35 亿美元的 B 轮融资，投后估值达到 5.7 亿美元，这反映出投资者仍在积极押注 AI 基础设施效率提升方向。这家成立四年的初创公司在韩国和美国都设有办公室，其核心观点是：AI 最大的瓶颈不只是算力，而是内存数据流动。按照传统流程，一次 AI 查询会让数据先从内存到 CPU 做预处理，再到 GPU 做计算，然后再返回；而生成每个 token 时，这个过程都会重复。XCENA 认为，这种架构会迫使大量常规工作经过行业中最昂贵、最耗电的芯片，造成明显浪费。为此，公司推出 MX1 芯片，希望把计算能力更靠近 DRAM，让常见数据操作直接在内存附近完成。

XCENA 说，这样可以减少 CPU、GPU 和内存之间反复往返的数据搬运，某些场景下甚至可能把原本需要 10 台服务器的工作量压缩到 1 台。公司 CEO Jin Kim 表示，团队由来自 Samsung 和 SK Hynix 的老兵组成，目标是让内存也像 CPU 和 GPU 一样“更智能”。XCENA 重点瞄准的是 AI 推理中围绕模型运转的部分，例如预处理、KV cache 管理和缓存，而不是 GPU 最擅长的矩阵乘法。公司还称，自去年下半年以来，市场对内存解决方案的需求显著上升，其理想客户是每年在 AI 基础设施上投入数百亿美元的超大规模云厂商。MX1 目前仍是原型，计划在 2026 年底前进入三星代工厂量产，预计 2027 年开始产生收入；与此同时，公司也将 Astera Labs 和 Marvell 视为主要竞争者，并强调自己的差异化来自更大的 IP 储备和数千个 RISC-V 核心。

资讯正文

每次你向 ChatGPT 提出一个问题，你的请求都会触发一场数据接力赛。信息先从内存中取出，经过 CPU 进行预处理，接着传到 GPU 做重计算，然后再返回——而 AI 生成的每一个词，整个过程都要重复一遍。

瓶颈就在于这种结构性设计——这意味着每一次请求都要路由经过业内一些最昂贵、最耗电的芯片。总部位于韩国和美国的初创公司 XCENA 正试图解决的，正是这种低效问题。这家成立四年的初创公司设计了一款芯片，将计算能力尽可能靠近 DRAM——也就是存放处理器正在使用数据的高速短期存储芯片——从而让常规数据操作可以在靠近内存的位置完成，而无需在 CPU、GPU 和内存之间来回奔波，付出高昂代价。

如果这一方案能够规模化落地，对 AI 基础设施成本的影响可能会非常显著，这在很大程度上也解释了投资者对这家公司热情高涨的原因。事实上，XCENA 刚刚完成一轮 1.35 亿美元的 B 轮融资，估值达到 5.7 亿美元，使其累计融资额达到 1.85 亿美元。

XCENA 首席执行官 Jin Kim 于 2022 年与首席技术官 Dohun Kim 以及首席产品官 Harry Juhyun Kim 共同创立了这家公司，三人都曾在三星和 SK 海力士任职，这两家存储巨头为 Nvidia 的 GPU 提供芯片支持。Jin Kim 在接受 TechCrunch 采访时表示：“几十年来，CPU 和 GPU 都变得更聪明了。内存却没有。XCENA 想改变这一点。”他补充说：“近期内存价格和相关股票的上涨，表明 AI 基础设施正朝着以内存为中心的架构发生更广泛的转变。”（本月，全球存储芯片市场占据主导地位的三家公司——三星、SK 海力士和美光——市值都首次突破了 1 万亿美元。）

Kim 表示，XCENA 正把公司的商业模式押注在这样一个判断上：“推理不仅仅是一个计算问题；它越来越成为一个内存扩展问题。”

XCENA 的芯片 MX1 通过 CXL（Compute Express Link）连接到 CPU——本质上是在处理器和内存之间开辟的一条专用快车道——在数据甚至还不需要离开内存模块之前就对其进行处理。它把计算带到数据所在的位置，而不是反过来。公司称，过去需要 10 台服务器才能完成的工作，现在有可能只用 1 台就能运行。

Kim 说：“GPU 在矩阵乘法上表现出色——这正是 AI 模型训练背后的重型数学运算——但周边大量的数据编排工作，包括预处理、KV cache 管理（即存储此前对话上下文、让模型无需重新处理的系统）以及数据缓存，仍然运行在 CPU 上。我们的芯片直接在内存模块内部处理这些任务。”

自去年下半年以来，市场对内存解决方案的需求激增，而公司认为这一时机正对自己有利。

公司已与几家全球内存供应商展开对话，但 Kim 拒绝透露具体名称。公司的理想客户是每年在 AI 基础设施上投入数百亿美元的超大规模云服务商，在这样的环境下，即便内存效率只提高一点点，也可能意味着数亿美元的节省。

MX1 仍然只是一个原型。量产芯片计划于 2026 年底前在三星的代工生产线上下线，公司预计将从 2027 年开始产生收入。

当神经处理单元（NPU）厂商都在争相挑战英伟达在训练工作负载上的地位时，XCENA 盯上的是支撑这一切的、对内存高度密集的底层环节。

XCENA 最接近的竞争对手包括 Astera Labs 和 Marvell，这两家公司都在纳斯达克上市，正在研发下一代内存连接技术。Kim 表示，Marvell 是一家规模更大、资历更深的厂商，已经在同一领域开展工作；而差异化关键在于知识产权。“我们有数千个核心，”Kim 说。根据公开规格作比较，Marvell 的方案相对依赖少数几个通用核心。

这些核心基于 RISC-V——一种开源芯片设计蓝图——并针对数据处理进行了专门优化，每个核心都被有意设计得尽可能小巧高效。除了核心本身之外，XCENA 还自行设计内部内存层级、互连总线和 DRAM 控制器——这种程度的垂直整合，即便是更大的竞争对手在内的大多数芯片公司，通常也会外包出去。

这轮 B 轮融资由首尔风投公司 Atinum 和 IMM Investment 共同领投，Corstone Asia 以及现有投资者 SBI Investment 和 Mirae Asset Capital 也参与其中。该公司在盆唐和硅谷的 Sunnyvale 设有办公室，员工超过 90 人，同时也在与国际投资者就追加融资进行洽谈。

来源与参考

收录于 2026-05-30