企业因数据基础设施薄弱而难以采用人工智能
MIT Technology Review AI··作者 MIT Technology Review Insights
关键信息
文章强调必须从孤立的SaaS平台转向支持结构化与非结构化数据、实时上下文和严格访问控制的统一数据架构。Databricks和Infosys被定位为推动这一转变的关键参与者。
资讯摘要
许多企业因数据基础设施碎片化和治理不足而在规模化部署AI时遇到困难。虽然消费级AI工具已取得快速进展,但商业应用需要可靠、上下文清晰且受控的数据。Databricks的Bavesh Patel指出,AI的质量完全取决于组织的数据。
要成功,企业必须将数据整合为开放格式,强化治理,并在各部门间共享。Infosys的Rajan Padmanabhan补充说,将AI直接与业务指标挂钩可确保价值实现。未来方向是从‘参与系统’转向‘行动系统’——让AI驱动实际工作流和交易。

资讯正文
赞助
与Infosys Topaz合作
人工智能可能正在主导董事会的议程,但许多企业发现,实现有意义采用的最大障碍在于其数据的状态。尽管面向消费者的人工智能工具以速度和便捷性吸引了用户,企业领导者却意识到,规模化部署人工智能需要的并非炫酷的技术,而是更加基础且至关重要的东西:统一、受控且适配用途的数据基础设施。
AI雄心与企业准备度之间的差距,正成为这一轮数字化转型中最关键的挑战之一。正如Databricks高级副总裁Bavesh Patel所言:“人工智能的质量及其有效性,实际上取决于你组织内的信息。”然而,在许多公司中,这些信息仍分散在遗留系统、孤立的应用程序和不连贯的格式中,使得人工智能系统几乎无法生成可信且富含上下文的输出。
“对大多数组织而言,真正的竞争优势在于自身数据,以及他们可以叠加的第三方数据,”Patel表示。
要让企业级人工智能创造价值,数据必须被整合为开放格式,通过精准治理,并在各个职能间实现可访问性。如果没有这样的基础,企业将面临Patel直言不讳所说的“糟糕的人工智能”。这意味着要超越孤立的SaaS平台和脱节的仪表板,转向一种统一、开放的数据架构,能够融合结构化与非结构化数据,保留实时上下文,并实施严格的访问控制。当基础铺设正确时,组织就能迈向可衡量的结果,释放效率,自动化复杂工作流程,甚至开拓全新的业务线。
Infosys单位技术官Rajan Padmanabhan强调,这种价值导向至关重要,尤其是在企业寻求驱动商业决策的输出精度时。领先的公司不再将人工智能项目视为孤立的创新举措,而是直接将其部署与业务指标挂钩,利用治理框架判断哪些能带来成果,哪些应迅速放弃。
“我们看到一个巨大的机会,即提升业务用户的AI素养,他们非常渴望了解应该如何思考人工智能,”Patel补充道,“当你揭开AI的面纱,它意味着什么?从技术和培训、赋能的角度来看,你需要建立哪些组成部分和基本模块?”
前方的可能性十分巨大。随着AI代理从协作者演变为能够管理流程和交易的自主操作者,那些现在就构建正确基础的组织将成为赢家。
“我们看到一种新的思维方式正在形成,那就是从执行系统或互动系统转变为行动系统,”Padmanabhan指出,“这就是我们看到的未来道路。”
企业人工智能的未来将取决于企业能否将分散的信息转化为战略资产,从而推动更明智的决策,并开创全新的运营方式。
本期《商业实验室》节目由Infosys Topaz联合制作。
完整文字稿:
梅根·塔图姆:来自麻省理工科技评论,我是梅根·塔图姆,欢迎收听《商业实验室》,这档节目帮助企业管理者理解从实验室走向市场的新兴技术。
本期节目由Infosys Topaz联合制作。
如今,人工智能的最新进展可能已经解锁了一些令人信服的新工业应用,但对不完善数据模型的依赖意味着许多企业正面临瓶颈。尤其是代理型人工智能(agentic AI)给数据带来了全新的要求。这项技术需要更大的访问权限、上下文信息以及安全边界才能有效运行。现有的数据模型往往难以满足这些需求,它们过于碎片化或孤立,数据本身质量也不高。要弥合这一差距,企业需要进行一次面向人工智能的数据升级。
两个词送给你:数据重构。
今天我的嘉宾是Databricks的市场高级副总裁巴维什·帕特尔,以及Infosys的数据分析与人工智能技术负责人拉詹·帕德曼阿布安。
欢迎你们,巴维什和拉詹。
拉詹·帕德曼阿布安:谢谢,感谢邀请我们。
巴维什·帕特尔:谢谢你们邀请我们。
梅根:太棒了,非常感谢两位今天加入我们。巴维什,如果我先问你,当我们谈论‘面向人工智能的数据’时,具体指的是什么?人工智能对数据提出了哪些新要求?这对数据的结构和使用方式会产生怎样的影响?
巴维什:是的,非常好的问题,感谢你今天的主持。显然,全世界都被人工智能吸引,因为我们作为用户都能感受到它的强大能力。AI现在已普及到数亿用户。当我们谈到企业在使用AI时,AI的质量和效果实际上取决于组织内部的信息,也就是数据。我们发现大多数企业的数据被锁在不同的应用程序和系统中,很难全面了解:我的所有数据是什么?可信度如何?有多新鲜?这些信息都会被注入到AI中。如果你没有对数据有充分的理解,无法确保数据准确并可供使用,那么AI就无法发挥其潜力,最终只会产生糟糕的结果。
我们看到很多客户花大量时间清洗、整理数据,确保权限控制得当,而这正是高质量AI的基础燃料。
梅根:确实如此,这是一个基础性的问题,但也容易被忽视。拉詹,对于企业来说,拥有面向人工智能的数据到底能带来多大的改变?当他们真正释放AI及其应用场景的全部潜力时,这种变化体现在哪里?
拉jan:首先,非常感谢邀请我们。这是一次愉快的交流。我认为,延续巴韦什提到的内容,数据和人工智能几乎是同义词。同样地,消费者AI、企业AI以及企业代理型AI之间存在差异,因为首要的是,业务必须具备上下文。来自企业信息的这种上下文——不仅包括结构化数据,还包括非结构化数据、用户生成内容以及各种形式的数据——将对准确获取上下文至关重要,从而确保你选择的任何模型都能发挥作用。这就是Databricks等平台能够提供帮助的地方,无论是使用大量现成模型,还是构建自己的模型,或者基于你的数据来固定模型,这些都极为关键。因此,为AI准备数据将成为重中之重。
第三个关键点,这实际上可能是AI采用过程中的一个主要障碍。这也是为什么我们看到消费者端的AI采用率飙升,而企业端却进展缓慢的原因:主要是输出精度问题。当你做出商业决策,比如购买或销售决策,或是推荐内容时,可能涉及20种不同的应用场景,此时精度就变得极其重要。我们观察到,成功的客户明确要求精度必须超过92%,这不是目标,而是必备条件。如果你能达到这一点,那么拥有高质量的AI数据将成为企业当前最重要的竞争优势。
梅根:如果我们已经明确了这一点的重要性,那么企业应该从哪里着手呢?也许可以从专业层面出发,构建一个AI就绪的数据模型时,最基础的要素是什么?
巴韦什:是的,我认为拉jan说得很到位。企业面临的挑战与消费者AI完全不同。首先,你必须掌握自己的数据。正如我所说,很多数据被锁在系统中。你需要确保有能力把数据放到一个可以让你全面理解尽可能多数据的地方。第一步就是将数据转换为开放格式。如今组织中许多有价值的数据都储存在某些专有SaaS应用或系统里,各个数据集彼此孤立,无法形成完整的上下文。第一步应该是深入分析你的数据资产:哪些是关键数据?它们需要被放在什么地方,以便你能开始理解这些数据,并弄清楚它们之间的关联方式。
思考如何建立数据目录,思考数据资产之间的关系,以及围绕这些数据建立治理机制,这似乎是第一步。如果你回顾一下ChatGPT的构建过程,它收集了互联网上的全部数据,然后进行聚合和整合,最终构建出Transformer模型。而企业通常并没有掌握组织内部的所有数据——这是你需要首先考虑的基础。第二点是,你不应该随意开展AI项目,而要真正从商业价值出发。许多客户现在更加战略性地看待AI,他们希望推动那些能带来明确成果的项目,并从中创造业务价值。
构建一条清晰的AI价值路线图,这与你数据组织的完善程度密切相关。这两点似乎是成功在组织内启动AI的关键基础。
梅根:价值这一点真的非常重要,不是吗?据我所知,Infosys和Databricks紧密合作,帮助企业完成这一转型。我想问一下,拉詹,你能分享一些你所服务的企业案例吗?你们帮助它们实现了哪些具体影响,使它们能够更深入地集成更复杂的AI和代理型AI应用?
拉詹:这是一个非常好的问题。Databricks和Infosys都提出了一套框架。首要的是,一切必须从价值出发。我们曾与一家大型食品生产企业合作,应用了这套框架。该框架包含六个关键要素。首先是价值管理,正如巴韦什提到的那样。我们共同制定了一个3M测量框架,即适应性(Adaptability)、业务价值(Business Value)和责任性(Responsible)。你不能只是随便做个小项目,必须可衡量、负责任,并遵循所有这些原则。这对客户来说非常关键,我们帮助他们优先排序,确保投资回报最大化。
第二个关键点在于,大多数企业并不是天生就具备AI能力的公司。它们大多诞生于模拟时代或数字早期阶段。有些企业正在利用AI进行现代化改造,因为历史数据正是构建长期上下文的重要来源。这时,我们与Databricks的一些原生工具密切协作,比如Lakehouse Bridge或AI助手,然后在此基础上创建可组合的服务,帮助客户释放Databricks中的潜在价值。第三个环节是我们帮助客户准备数据——现在你已经引入了数据,接下来就要整合结构化、非结构化、分析型等各种数据类型。
第三层是我们与Databricks紧密合作的部分,充分利用其各项强大功能,无论是Unity Catalog、开放格式,还是网关及其他方面。我们成功让数据对这位客户可用。真正帮助到这位第三方客户的,是Agent Bricks,这是我们的一个差异化优势。它为企业提供了专属的体验。我们在此基础上密切协作,并开发了一些行业特定的代理工具,比如消费品(CPG)、能源和金融服务业(FS)。针对这位客户,我们采用了部分消费品行业的具体用例,无论是人力资源、采购还是市场营销领域。这极大地帮助客户围绕这些场景构建了业务能力,解锁了大约八到九个用例,我们称之为‘代理型AI产品’,它们能真正为客户创造价值,解决实际业务问题。
这种全面的框架体系、一系列服务套件,加上Infosys解决方案资产以及从Databricks中释放的价值,确实帮助了这些客户。我们在许多成功的合作中都看到了类似的模式——通过持续应用这套框架,不断为客户创造价值。
梅:没错,听起来确实带来了实质性改变。拉詹刚才提到了Databricks目录中的几个工具,巴韦什。我知道你最近刚推出面向AI代理和应用的操作数据库。我想知道这样的平台如何助力企业在这条旅程中前进?它与其他平台相比有何不同?
巴韦什:Databricks推出了一个名为Lakehouse的新产品,这是一个OLTP数据库,可用于构建AI应用程序。如果从企业角度思考,数据主要分为两类:一类是历史数据,即过去发生的所有事情,这也是分析的基础;另一类则是当前运行的数据。传统上,企业会将历史数据存储在旧的应用系统中,而Databricks推出的Lakehouse本质上是一个数据仓库,包含所有非操作性的历史数据。我认为Lakehouse的概念正在推动AI的发展,因为很多客户内部有成千上万的用户需要获取数据,他们目前通常采用BI路线,也就是构建仪表板或报告。
大多数组织中,成千上万的仪表板和报告在企业内部不断扩散,随后又需要进行定制。这使得业务用户实际获取数据的过程变得非常漫长。如今,人工智能正在从分析的角度极大简化这一过程,让我们能够真正实现数据访问的民主化——这正是大多数数据团队长期以来追求的目标。他们希望不再成为障碍,而是将正确的数据以恰当的权限交给企业内的正确人员。
在 Databricks 的 Genie 产品中,你只需用英语或任何你使用的语言提问,它就能返回与你的问题相关联的数据答案。它提供的不只是 ChatGPT 那样来自互联网的信息,而是会具体解释:为什么我四月份的销售数字没有达到预期?
它会基于你的企业数据提供根本原因分析。Genie 将成为一项真正重要的技术,因为它将彻底实现企业内部的数据民主化。这就是 OLAP(在线分析处理)的世界,也就是 Lakehouse(湖仓一体)的核心理念。最近,我们推出了被称为 Lakebase 的新产品,它对应的是 OLTP(在线事务处理)世界。
我们发现,这些组织已经开始部署代理(agents),而这些代理需要一个地方来存储所有编排逻辑以及特定工作流中的上下文信息。一方面,用户只是提出问题;另一方面,接下来的发展方向将是自动化整个业务流程。比如营销中生成一个推广活动的功能,涉及许多工具和步骤。
代理可以介入并自动完成其中大部分工作。但在代理的背后,你需要搭建一个实时数据库来追踪代理执行的所有操作。Databricks 提供的就是这种 OLTP Lakebase 解决方案。我们带来的创新在于,这是一种现代版的 Postgres 数据库,我们将计算与存储分离,就像我们在数据湖仓架构中对数据仓库所做的那样。不过,在 Lakebase 中,数据仅在云存储中保留一份副本,而计算资源则独立出来,并且是无服务器的。你可以轻松实现分支功能,也能快速启动 OLTP 数据库。我们发现,代理正开始使用 Lakebase,因为它们能迅速创建、运行、暂停甚至复制一个实例。
代理正在执行这些任务,然后他们需要速度,还需要一种成本效益高的解决方案。这一切的美妙之处在于,当你将OLTP(在线事务处理)——它围绕Lakebase和实时数据展开——与OLAP(在线分析处理)结合时,你就拥有了一个统一的数据系统。你不再需要复制数据,也不再需要管理所有权限,还能设置上下文环境。我们看到这些AI应用程序将成为企业运营的未来,它们将消除人类重复劳动带来的瓶颈,并利用大型语言模型(LLMs)和其他新技术实现自动化。我们希望成为这一切背后的默认动力,因为我们相信我们的Lakebase技术将为AI数据库提供更快、更便宜、更安全的解决方案。
梅根:听起来确实是一个真正的变革性突破。我们之前已经多次提到过这个概念,也就是价值。我们知道,对于高层管理者而言,挖掘AI投资的商业价值现在正处于优先级的顶端。那么,当构建面向AI的数据系统时,这种价值衡量机制有多重要呢,拉jan?组织如何确保他们能够监控哪些措施真正有效,而哪些没有效果?
拉jan:这具有至关重要的意义。大多数成功的AI实施或代理型AI实施都离不开价值测量。我来扩展一下之前提到的那个客户案例——一家大型食品生产企业,全球性的产品公司——来解释这个问题。我想用一个类比:当初数字世界刚出现时,我们有很多围绕绩效管理KPI的分析,基于事实的决策以及其他方面都在逐步演化。通常来说,这些指标对衡量某个职能或业务表现至关重要。同样地,对于价值测量,如果以同一个客户为例,对企业而言最关键的是要明确你所期望的结果。
在这个案例中,问题是如何优化我在直接采购和间接采购上的支出?通过应用AI,我希望识别出可以优化支出的领域。这意味着其中一项关键指标是:你的间接费用分类是什么?你已分类的支出有多少?引入AI后你能减少多少?建立这些度量标准和指标将极为关键。一旦建立了基础指标和测量体系,其优势在于,正如Bavesh刚才谈到的,Databricks提供的能力,比如指标视图、特征工具和其他功能,实际上可以帮助你把来自应用程序的AI遥测数据和业务遥测数据转化为可衡量的成果指标,从而使用Genie房间进行价值管理测量。
随后会发生两件事:一是你可以选择某个用例,比如我提到的这个客户,我们在采购端或市场研究端开发的产品,如果发现其中存在价值——无论是因为VAC(价值评估与成本)识别出可以优化的空间,还是能够提升可达性(即覆盖范围),你都可以加速该用例,并进一步微调产品以扩大应用范围。二是如果你发现它并不能带来实际价值,或者你无法看到预期收益,那么完全可以采用快速失败的方法,而不是强行让它运行下去。相反,你可以及时做出决策,将项目转向其他方向。
这里有三个关键点。根据我们的经验,不仅针对这家客户,也包括我们在工业制造、金融服务业和能源行业的其他客户,通过提前建立以指标为导向的价值评估方法,并利用技术能力将这些遥测数据和信号转化为可衡量的结果,我们称之为‘AI导航室’,这样就能真正衡量业务相关方的需求——无论来自营销部门、供应链部门,还是来自CFO办公室——他们可以清楚地知道:‘这是我们的目标,当前的测量结果是什么,哪里出现了偏差’,这有助于他们及时调整方向。这种做法不仅能推动AI在企业内部的普及,还能让所有智能代理的衰减过程得到控制,从而真正创造价值。
这对企业来说至关重要,也正是我之前提到的六步框架发挥作用的地方:应用价值办公室理念、评估是否具备AI准备度、构建转型基础设施;第三部分是治理,这将是整个项目的推动力。运营模式不应再基于SLA(服务等级协议),而应基于体验水平协议和业务指标,持续进行测量。整合这六个层面,对组织而言非常关键。这也是为什么我们看到一些成功的企业正是这样做的,这些案例证明,从测量角度看,这种方法极为重要。
梅根:这里有很多具体的方式可以衡量价值。你提到了治理,而AI对治理的影响也是高管层讨论的热点话题之一,数据交互在其中扮演核心角色。您认为建立正确的治理和安全协议,在多大程度上是实现AI就绪数据的基础?巴韦什,这些系统需要应对哪些场景?这对数据模型意味着什么?
巴韦什:这正成为部署成功AI项目的先决条件。麻省理工学院曾发布一份报告指出,95%的新AI项目最终未能产生商业价值。一个重要原因在于,你可以轻松原型化、搭建试点并编写代码进行测试,但当你真正把工作负载投入生产环境时,才会意识到治理的重要性。
那么,我们真正所说的治理到底是什么意思呢?我认为首先要做的是整理好数据,就像我之前说的,使用开放格式。大多数公司现在都意识到,他们与客户互动的方式、研发药物的方式,以及审批信用额度提升的方式,所有这些企业信息实际上都是他们的竞争优势。因为你可以去使用像ChatGPT或Claude这样的前沿模型,它们对所有人都开放。
实际上,对于大多数组织而言,真正的竞争优势在于自己的数据,以及可以添加进来的第三方数据。将数据转化为开放格式,以便你能理解它,而理解数据正是治理的核心所在。因为当你想到治理时,你真正希望的是能够找到所需的数据。
如果我是一个终端用户,或者我在开发一个AI产品,我希望知道有哪些数据可供我使用,我能信任这些数据吗?数据有多新鲜?它是来自我的分析系统,还是我需要一个实时系统,比如OLTP系统?我必须能快速找到数据,同时还要确保访问权限控制得当,以免给组织带来巨大的麻烦。这一点至关重要。例如,如果我有一大堆PDF文件,里面包含采购订单,谁实际上有权访问这些数据?
在临床试验中,比如医疗领域,你真的需要确保不同试验之间的人看不到患者数据。也许用于构建该模型的流程是在多个试验间运行的。谁有全部数据的访问权限?谁只能访问部分数据?你必须认真思考这些问题。我们还关注数据的语义层面。拉詹一开始就提到了这一点:什么是上下文?我们该如何理解业务用户头脑中那些已知的指标和各种信息?我们需要开始把这类知识编码记录下来。我们在Databricks有一个名为Unity Catalog的产品,可以实现数据发现、访问控制以及业务语义管理。你还需要共享数据。
在代理(agents)的世界里,我们看到一种被称为‘代理泛滥’的现象。很快,就像SaaS应用在任何组织中变得非常普遍一样,它们确实解决了具体的业务问题。你走进某个业务部门,会说:‘我需要能够进行信用评估’,或者‘我在处理事先授权的场景’,又或者要解决成千上万种用例中的任意一种——总有一个SaaS应用可以满足需求。与此类似,未来将出现大量代理投入使用,大多数组织也会持续运行许多代理。但现实情况是,这个代理表现如何?用户反馈是什么?运行这个工作负载的成本是否显著上升?如果你没有一套可扩展的方式来监控、理解和追踪所有的提问、回答和响应,你最终会陷入困境。这实际上可能损害你的组织,因为用户会对该做什么感到困惑。
当谈到治理时,大多数组织正在认识到,他们必须开始理解自己从系统、流程和工具角度建立的架构。聚焦于一个用例,构建针对该用例的治理机制,但要以一种可重复的方式进行。AI 不会只局限于一两个用例;谁能以安全、可靠且成本可控的方式构建多个用例,并推动业务成果,谁就能成功。如果不实施治理,这将非常困难。
在 Databricks,我们四到五年前就对治理下了重大赌注。这也是我们现在公司快速增长的主要原因之一,因为我们能够确保进入所有 AI 的数据都是高质量的。你可以使用 Genie、Agent Bricks,也可以基于 Lakehouse 构建应用。如果没有治理,这些功能都无法真正发挥作用。我们称之为 Databricks 内部的‘大脑’。
我们的大多数客户都花大量时间在 Unity Catalog 中工作。好消息是,AI 正在极大加快治理的部署速度。有一位客户三年前还在努力整合来自客户、忠诚度应用和电商引擎的所有数据资产,需要手动梳理所有数据资源。现在 AI 已经能完成其中大部分工作,人类只需做最后的检查确认。
我们借助 AI 让这件事变得更容易了。我们始终把 AI 视作一个商业用例和结果,我认为这才是价值最大的地方。但在 Databricks,我们也利用 AI 在平台内部提升运营效率,更好地为你的企业提供所需的一切。这是我们在 AI 市场逐步成熟过程中创新的核心部分。
Megan:Rajan,Bavesh 刚才提到一点,那么 Agentic AI 的集成是否会带来额外的复杂性?这又会对治理提出哪些新的考量?
Rajan:这是一个非常重要的问题。我想用一个比喻来说明。我们现在正进入自动驾驶汽车、机器人出租车等世界。尽管这通向自动化,但仍需遵守道路规则。我之所以举这个例子,是因为实际所需的是遵守规则,而不同的地形、不同地点的驾驶要求会极为关键。代理带来的复杂性主要体现在如何在这些约束条件下运作。
比如,作为 UTO(统一交易操作员),我可以执行十项任务,但如果我不能批准超过 70% 的折扣,或者不能给某人发放奖金,因为这属于 CFO 的权限范围,代理就必须清楚这一点。
这是其中一个方面,即施加约束并确保代理遵守这些约束。第二个复杂性在于工具的访问能力。作为一个企业,在当今世界定义流程时,某些流程需要特定的一组工具来真正执行。有些权限只有特定身份的人才能拥有,这取决于他们的身份或情境需求,你必须加以管理。第三个问题是信息共享。虽然MCP和其他方面都很出色,UCP等其他方面也很强大,但一个关键点是:你需要分享什么,不需要分享什么。这些都是至关重要的考量。
最后是学习和重新学习。有时候当你学到好的东西时,应该保留它;有时则更好完全删除它,并以更新的方式重新评估、重新学习。所有这些要素都是必需的。对于代理而言,这一点尤为重要,因为当你在企业中运行代理时,你需要了解、学习并遵守相关的合规规则、业务约束条件、权限身份,而适用于物理人类的信息共享规则也将开始适用于代理。这就是其重要性的所在。这需要一套全新的操作系统——并不是说现在就要创造全新的东西,而是我正在尝试解读Bavesh提到的Unity Catalog如何发挥作用。
我们看到的一些最佳实践,以及一些客户正在实施的做法是扩展Unity Catalog及其功能:现在你可以对工具进行目录化管理,对MCP进行目录化管理,也可以对这些代理进行目录化管理,然后基于约束条件来治理这些代理,并将它们建立在约束基础上。
这将变得非常非常重要。不要等到以后才做,而应该从战略层面就开始推进,并将其作为衡量价值的关键维度之一,这对组织来说也至关重要。这就像是不仅要制造自动驾驶汽车,还要确保这辆车按照交通规则行驶,而不是失控。
Megan:有很多值得思考的内容,非常有趣。谢谢!最后快速展望一下未来,我们都清楚AI和代理型AI的发展速度如此之快。对于那些能够优先构建AI就绪数据的企业来说,您能预见未来几年哪些最引人注目的技术应用场景会脱颖而出呢,Bavesh?
Bavesh:我认为现在的兴奋程度达到了顶峰。我们看到了大量对人工智能的投资。我认为之所以有这么多兴奋感,是因为你可以看到早期采用者,这些组织正在获得巨大的收益。我要告诉你的一个事实是,真正表现良好的公司大致分为三类,而我认为做得好的那些公司,很多都是从辅助工具开始的,比如为人们提供快速答案的工具。这可以看作是提升个人效率的第一阶段。这一阶段的回报率目前还比较存疑。但像Genie这样的工具就更加有效,因为它直接基于你的数据,并且你的数据在组织内部是有上下文的。我认为这是我们将看到大量创新的一个领域。我们会看到大多数组织开始把正确信息在正确的时间传递给正确的人。这对很多组织来说一直是个梦想。
第二个趋势是围绕自动化整个业务流程展开的。比如我之前提到的市场营销功能,或者你处理一家公司的返利流程时,涉及很多步骤,你需要进入三个不同的应用程序,从Excel中导出数据再粘贴到其他地方。成千上万的人在从事非常繁琐、重复且单调的工作。这些智能代理将极大提高业务流程的生产力,同时让事情变得更加快速。原本需要几周才能完成的流程,现在几天就能完成;原本需要几天的流程,现在只需几个小时甚至几分钟。
我们观察到的一个趋势是,人工智能世界变化非常快。在一个有很多不同参与者的环境中,你要从基本原理出发思考:什么是基础?你要确保掌握自己的数据,确保能掌控结构化和非结构化数据,并建立相应的治理机制。但另外一点要特别注意的是,不要让自己陷入锁定状态。
如今,如果你仔细想想,Gemini在多模态方面表现非常出色,只要有图片或视频之类的内容,它都特别强。而如果你是在编写代码,Claude则更擅长。如果只是进行某些关于自我反思的问题,ChatGPT又很优秀。你真正需要的是一个开放的数据平台,可以在多个云平台上构建自己的AI系统,这正是我们在Databricks所做的事情。
我认为这有助于解决第二个问题,即你可以按需选择。当你构建这些代理时,不需要只依赖单一模型。你应该根据特定工作负载挑选最佳质量、最高安全性和最大投资回报率以及最低成本的模型。一个工作负载可能使用多个模型,甚至可能是特定行业的模型。你需要一套能够真正应对这种复杂性的系统和平台。
我认为第三类是业务的重新构想。很多人谈到这一点:你确实会去获取数据并使其可用,让每个人都能访问数据,并使现有流程更加高效。但第三件事是,这将催生出全新的事物。
我们有一位非常大的客户是一家银行,他们已经开发出了一款去年还不存在的产品。本质上,这是机器学习和大语言模型帮助财务部门预测账户余额,因为他们现在能更方便地获取更多数据。过去,数据传到银行家手中需要很长时间,他们无法真正预测财务部门的账户余额。想想看,对于一家大型企业来说,他们现在已经构建了一个全新的数据AI解决方案,并将其商业化,在最初的六个月内创造了数亿美元的价值。我们正在看到全新的业务线正在开启,这将非常令人兴奋,因为真正的变革就发生在这里。会有生产力提升,会在业务流程层面实现自动化,还会出现一些我们甚至未曾想象过的新事物。
我们实际上已经在每个行业中看到了早期迹象。我们看到零售商能够以小时甚至分钟为单位获取数据,从而更紧密地整合他们的供应链。我们也看到更加精准的客户360度应用场景:无论是零售商还是消费者,我们都曾对广告感到厌烦,但现在广告变得高度情境化,而且你掌握了大量关于目标客户真正关心的信息,因此你能提供更有价值的内容,从而更好地吸引他们。整个行业都在围绕代理型电商、管家式服务和虚拟购物等创新领域快速发展。
无论哪个行业,都一定有新的做事方式。这正是人工智能最令人兴奋的地方,但你也必须避免脱离基础而走得过远。你之前提到过这一点:开放的数据平台、确保治理得当、认真思考历史分析数据以及实时的应用数据,建立一个坚实的基础,这样才能让你快速扩展并在这个新世界中竞争。
我们对我们客户的进展和他们正在构建的东西感到非常兴奋。老实说,这也是我在Databricks担任这个角色时最享受的部分——我们的团队真的会去拜访客户,问他们:‘你们希望达成什么成果?’早期信号非常积极。我们看到那些认真对待所有基础要素、系统性地构建以结果为导向的AI解决方案的企业,其中5%的项目取得了巨大成功。这就是我们公司不断增长的原因:一旦你有一个成功的项目,它就会在高管层获得广泛关注。
最后一点是,从历史上看,很多技术都集中在IT部门。业务部门设计市场策略、竞争方式以及他们希望提供的产品和服务,而IT则作为赋能者,在许多情况下变成了成本中心,被要求优化支出和工具组合。
但现在我们看到业务部门在AI方面开始引领潮流,他们想要了解现在能做什么以前做不到的事情。我们看到了一个巨大的机会,那就是提升业务用户的AI素养,他们非常渴望理解应该如何思考AI。当你揭开AI的面纱时,它意味着什么?你需要在技术和培训及赋能方面搭建哪些基础组件?我们正在花大量时间帮助高管们完成这一旅程。我们确实看到了前方充满许多令人兴奋的机会。
梅根:是的,创新正在不断涌现。那么你呢,拉詹?有什么让你最兴奋的未来趋势吗?
拉詹:我认为巴韦什已经谈到了很多,但我看到的情况主要是劳动力转移——也就是释放人类潜力,或将当前的工作方式转变为更高效的新工作模式。这主要是一个效率游戏。目前我们看到的大多数成功案例都是围绕劳动力转移的。但更有前景的是两种转变:业务层面的转变。
我们正在看到一种新的思维方式或新事物出现,那就是从执行系统或互动系统转向行动系统。这就是我们所看到的未来道路。这也是我之前提到的一些要点。业务部门希望获得访问权限,但如何真正带来实质性改变呢?
一个我清楚看到的经典例子是我们为一家制造行业的客户实施的方案,涉及产品的全生命周期管理以及围绕该产品内容的发布,以匹配其不同的B2B市场平台。在这里,我们不仅仅是推荐或生成内容,而是能够重新构想整个流程——过去需要五个不同部门协作才能完成的过程,现在可以更快实现,同时还能保证决策的准确性,并且更容易落地执行。这是第二点,也是我们正在见证的变化。
第三点我认为也将影响商业的发展方式。除了代理驱动的商业之外,我们还看到代理与代理之间的交易、代理与人之间的交易、代理对代理支付、代理对人类支付,以及内容变现等场景。
这些是新的商业机会,比如构建新型的业务代理产品。它们可以面向家庭科技、消费者端,也可以面向工业技术领域。这将是我所说的经济转型、劳动力转型和业务转型,因为这会带来一套全新的行动体系,将它们从传统的执行系统或典型的SaaS应用中转移出来,并在上面叠加代理功能,也就是所谓的代理型应用。这将是一场重大变革,而我们正处在这一进程之中。
但在技术层面,对创业者而言至关重要的是,在当今世界,你拥有数据、分析数据、运营数据,还有智能——它有多个维度。
我认为,分析核心和运营核心将真正融合为一体。这就是为什么我们对Lakebase及其他相关产品的发布如此热衷,因为这就是未来的发展方向。当企业真正思考如何为AI技术用例做好准备时,他们应该认真考虑:如何真正构建一个面向新时代的统一核心?
第二部分是人们必须重新构想当下。以SAP为例,你可能需要数百个边缘应用或业务应用来集成其他系统。通常我们会形成这些集成的蔓延。对于某个具体的技术用例,人们可以问:‘我如何在这个统一核心之上创建基于领域的服务网格?如何让其更具备代理集成能力?’这是我们正在向客户建议的一个技术用例。
现在,随着许多围绕SAP、BDC与Databricks以及零基集成的新领域出现,这促使他们重新思考自己的集成方式和做事方法。
第三部分,从技术投资和技术角度来看,最值得讨论的用例并不是现在才开始谈,而是现在正是你需要重新定义组织内人员归属的时候。代理将成为你的新全职员工(FTE)。
这意味着一些新的技术范式将到来:你最终会在组织内部创造出这些协同智能体。也就是说,你需要投资于我们称之为‘代理网格’的东西,它会像一张统一的代理织网,让所有代理能够真正协作、集成,并在此基础上构建统一的运营分析核心,以及建立在其之上的统一代理集成架构。这将创造出一套全新的体验,即代理体验,而不是传统的体验或对话式体验。
然后,新的协作方式将成为技术层面的关键方面,人们必须从技术角度认真思考。首先,我会建议从数据角度入手,构建统一的核心、统一的集成以及用于共享和协作的协作层,包括智能协作和代理协作,所有这些都应在单一框架下进行管理。这将成为一个至关重要的用例,没有人会感到不适,反而会获得投资的100倍回报。
梅根:当然,前方充满了令人兴奋的发展。非常感谢你们两位的精彩对话。刚才与我交谈的是Databricks公司的市场副总裁巴维什·帕特尔(Bavesh Patel)以及Infosys公司数据智能与AI部门的技术官拉让·帕德马纳班(Rajan Padmanabhan),我们是在英国布莱顿进行的这次交流。
本期《商业实验室》到这里就结束了。我是主持人梅根·塔图姆(Megan Tatum)。我是MIT Technology Review旗下定制出版部门Insights的撰稿编辑兼主持人。MIT Technology Review成立于1899年,位于麻省理工学院,您可以在纸质刊物、网站以及全球每年举办的活动中找到我们。有关我们及本节目的更多信息,请访问technologyreview.com。
本节目可在所有主流播客平台获取。如果您喜欢这一期内容,欢迎花一点时间给我们评分并留言评论。《商业实验室》由MIT Technology Review出品,本期节目由Giro Studios制作。谢谢收听。
此内容由MIT Technology Review的定制内容部门Insights制作,非其编辑团队撰写。内容由人类作家、编辑、分析师和插画师研究、设计并撰写,包括调查问卷的编写及数据收集。若使用了AI工具,也仅限于后期生产流程,并经过严格的人工审核。
深度探索
OpenAI正在全力投入打造全自动研究员
独家专访OpenAI首席科学家雅库布·帕乔奇(Jakub Pachocki),探讨该公司最新挑战及其对人工智能未来的展望。
《Pokémon GO》如何为配送机器人提供精准的世界视角
独家报道:Niantic的人工智能衍生公司正利用玩家贡献的300亿张城市地标图像,训练新一代世界模型。
来源与参考
收录于 2026-04-28