Parasail 获得3200万美元融资,助力AI推理中的tokenmaxxing

TechCrunch AI··作者 Tim Fernholz

关键信息

Parasail并不拥有自己的芯片,而是租用全球15个国家40个数据中心的GPU资源,并通过流动性市场优化成本,目标是压低依赖固定硅基架构公司的价格。

资讯摘要

由前Groq高管Mike Henry领导的Parasail已筹集3200万美元,为构建生成式AI应用的开发者提供低成本、高速的AI推理计算服务。该公司每天处理5000亿个token,不拥有硬件,而是通��全球15个国家的40个数据中心调度GPU资源来降低成本和延迟。它瞄准那些希望灵活使用、无需长期承诺的初创企业——这是大型云提供商主要面向企业客户所忽略的空白。

随着AI代理和开源模型的兴起,这种基础设施需求正在增长,例如Elicit公司就利用开源模型实现科学文献的高效研究。投资者认为,推理成本未来将占软件开发成本的至少20%,使Parasail的中介模式变得愈发重要。

Parasail 获得3200万美元融资,助力AI推理中的tokenmaxxing

资讯正文

“给我令牌。只要给我令牌。我想要它们快点,便宜点,现在就要。”

这是帕拉赛尔(Parasail)首席执行官迈克·亨利听到的开发者们在构建生成式AI模型软件时的口号。帕拉赛尔为运行AI模型进行推理的企业提供云计算服务,亨利告诉TechCrunch,该公司每天生成5000亿个令牌。这算不算tokenmaxxing(令牌最大化)?

亨利曾是专注于大型语言模型(LLM)芯片的Groq公司的高管,在那里他打造了该公司的云服务,早早认识到开发人员希望使用针对其需求定制的云处理能力。如今,帕拉赛尔在一年前脱离保密状态后,已筹集到3200万美元的A轮融资,以规模化实现这一目标。

亨利拥有芯片物理设计背景,但帕拉赛尔并不打算自己拥有芯片。虽然部分GPU是自有的,但该公司主要租用全球15个国家40个数据中心的计算时间,并从流动性市场购买更多资源,幕后协调这一切,以降低推理请求的成本。

通过聪明地分配工作负载并避开需求高峰,公司希望与那些拥有自有硅片、可能受限于现有客户承诺和工作负载的竞争对手展开竞争。

帕拉赛尔的潜力依赖于开源模型和代理在前沿实验室之外的持续普及。帕拉赛尔的高管和投资者表示,这背后的原因是使用Anthropic和OpenAI等公司服务的成本和摩擦正在增加。

根据埃利克特(Elicit)的CEO安德烈亚斯·施特尔穆勒的说法,一种混合架构正在浮现。埃利克特是一家刚刚完成2200万美元A轮融资的初创公司,致力于开发用于科学文献的研究助手。顶级制药公司的客户使用这款基于大语言模型的工具,来审查和分析来自数万篇科学论文的数据。

“我们越来越转向开源模型,因为向API端点发送十万次请求实在太麻烦了,”施特尔穆勒告诉TechCrunch。尤其是现在,公司正依赖代理来提升产品功能,将任务拆分并在更长的时间范围内更战略性地运作。开源模型负责初步筛选,从而降低成本,之后再由更强大的前沿模型提供最终答案。

随着代理逐渐成为软件开发中的常见组成部分,模型查询数量的激增正在推动对帕拉赛尔这类提供廉价推理基础设施公司的投资。此次融资的领投方之一、Touring Capital合伙人萨米尔·库马尔告诉TechCrunch,他预计未来推理成本至少会占到软件开发总成本的20%。

Parasail能占据多大的市场份额呢?在竞争激烈的云计算领域,亨利认为,他的公司专注于推理(不允许训练),并且愿意接纳初创客户而无需长期承诺,这使其区别于那些聚焦企业业务的大型云计算公司,甚至优于其他资金更充裕的云推理竞争对手,比如Fireworks AI和Baseten。

当然,在所有客户都是种子轮和B轮融资初创公司的AI行业中,也存在另一种风险。

Kindred Ventures合伙人史蒂夫·江(Steve Jang)是本轮融资的联合领投方之一,他表示,模型部署的经济性将需要Parasail这样的计算经纪服务。而这还只是在模型广泛用于内容生成和机器人技术之前。

“大家都觉得AI是个泡沫,其实并没有AI泡沫,”他对TechCrunch说,“推理需求远超供应。”

来源与参考

  1. 原始链接
  2. This startup is betting tokenmaxxing will create the next compute giant | TechCrunch

收录于 2026-04-16