These two founders left Goldman and Meta to build voice AI for markets everyone else overlooked | TechCrunch
TechCrunch AI··作者 Ivan Mehta
资讯摘要
Customer support and service are among the hottest sectors in voice AI right now. But building a product that sounds human and responds without noticeable delay turns out to be much harder in some markets than others — and most of the major players weren’t built with Africa and the Middle East in mind. AethexAI, a startup founded last year to close that gap, has raised $3 million in pre-seed funding led by 4DX Ventures, with participation from Enza Capital, Dorm Room Fund, Mojo Ventures, and Stanford GSB 26 Fund. Individual investors include Stanford faculty, telecom executives, and AI researchers from Anthropic.

资讯正文
客户支持和客服服务如今是语音 AI 领域最火热的赛道之一。但事实证明,在某些市场,要打造一款听起来像真人、并且能在几乎没有可察觉延迟的情况下作出回应的产品,要比在其他市场困难得多——而且大多数头部玩家在设计时并没有把非洲和中东纳入考虑。
AethexAI 是一家去年成立、旨在填补这一空白的初创公司,已完成 300 万美元的种子前融资,由 4DX Ventures 领投,Enza Capital、Dorm Room Fund、Mojo Ventures 和 Stanford GSB 26 Fund 参投。个人投资者包括斯坦福大学教员、电信行业高管,以及来自 Anthropic 的 AI 研究人员。
这家公司没有采用现成的编排工具,比如 Vapi 和 LiveKit,而是从零开始自行构建了一个小模型和编排层,以处理其目标市场中使用的本地化英语、法语和阿拉伯语方言——之所以这样决定,正如后文将提到的,是由在该地区运营所面临的特殊需求所驱动。
该公司还将向企业推出其平台供试用并注册服务,同时向开发者提供 API 和 SDK,供其试验这些模型。
这家初创公司由 Mariama Diallo 和 Ayooluwa Odemuyiwa 创立。CEO Diallo 曾在 Goldman Sachs 工作,之后加入 YC 支持的 ModelML,担任产品和增长岗位。CTO Odemuyiwa 毕业于 Caltech,曾在 Meta 工作,并在共同创办这家公司之前入读斯坦福商学院。这对搭档希望打造面向新兴市场的产品,并开始寻找机会。
全球各地的企业都在竞相采用 AI 工具,以自动化其运营中的部分流程。但这并不总能如愿。创始人发现,在埃及,一家呼叫中心曾自动化了相当大比例的来电,但由于效果不佳,最终又将系统回滚。非洲的几家客服中心也告诉他们,以合适的成本找到并雇佣工程师来自动化电话呼叫,是一个长期存在的难题。
“我们在这个地区看到的自动化通话延迟和抖动都离谱得惊人。如果我们当时成了编排层,可能就不得不使用部署在区域外的大模型,从而导致更高的延迟。我们意识到,要让这件事可行,就必须使用非常小的模型,并在每一个环节把延迟压到最低,”Odemuyiwa 向 TechCrunch 解释了公司为何决定自行构建模型和编排层。
部署最新模型的 AI 实验室通常会花费数百万美元来训练模型并获取数据。AethexAI 为这两方面都找到了解决方案。它没有去追逐尽可能大的模型,而是认为小模型已经足以解决延迟问题,同时保持准确性,并开发了自己的 Kora 系列,参数规模从 3 亿到 17 亿不等。这只是 LLM 的一小部分规模,而这正是重点所在。
为了训练这些模型,这家初创公司使用了来自一家呼叫中心合作伙伴的匿名录音。它还把硬盘寄往非洲各地的电台,以收集更多音频数据。为了降低成本,它建立了一个由大学生组成的贡献者网络,用于标注数据和读出当地姓名。因此,该公司表示,如今它每天处理的通话量已经超过 17,000 通。
在业务方面,这家公司非常注意引导那些刚接触语音 AI 的客户一步步走完整个流程,提供现场演示和工作坊,帮助他们找出最适合自动化的用例。
“我们总是告诉客户,我们现在不可能对所有人都面面俱到。我们规模还很小。当我们开始和一家公司交流时,我们会要求他们先选出一个对他们来说最重要的用例,从那个开始,”Diallo 说。
这家初创公司愿意与所有行业合作,但目前其许多用例主要集中在催收电话、客户激活,或 KYC——Know Your Customer 认证,也就是银行和电信公司使用的标准身份核验流程。公司正在以合同制方式招聘前置部署工程师,为本地市场提供服务,并与电信运营商建立渠道合作,以处理语音 AI 通话所需的电话通信。它表示,现成即用的解决方案在这里根本行不通。
4DX Ventures 的联合创始人兼管理合伙人 Walter Baddoo 认为,非洲和中东市场在本质上与大多数语音 AI 公司最初服务的市场截然不同。
“非洲和中东的企业处理的通话量大约是西方同行的三倍,因为语音仍然是客户互动的主导渠道,”他说。“现有系统是为西方市场打造的,而西方市场的特点是高端 GPU 基础设施、标准英语和欧洲语音环境,以及在美国和欧洲常见的企业工作流。当企业需要能够处理方言、代码切换和非正式表达模式的系统,并且这些系统还要能嵌入他们现有的电话基础设施以及符合他们实际价格区间时,这就会产生真正的缺口。”
换句话说,虽然像 ElevenLabs、Deepgram、Sierra 和 Cognigy 这样的公司正以很快的速度走向全球扩张,但它们最初面向的市场和它们正在进入的市场并不总是一回事。像 AethexAI 这样的初创公司押注,市场空白——针对本地方言定制的模型、扎根当地的合作伙伴关系、为该地区打造的基础设施——代表着一个巨头既没有动力也没有架构去填补的市场机会。
来源与参考
收录于 2026-06-04