公共部门通过小语言模型实现AI落地
MIT Technology Review AI··作者 MIT Technology Review Insights
关键信息
小语言模型使用数十亿而非数千亿参数,计算资源需求更低,适合本地部署;它们避免将敏感数据发送到外部云服务,并可在无网络环境下运行。
资讯摘要
公共部门机构因严格的隐私法规、有限的互联网接入以及缺乏GPU基础设施,在采用人工智能时面临独特挑战。大型语言模型(LLMs)往往不切实际,因为它们需要集中式云资源并带来合规风险。一项Capgemini研究显示,79%的公共部门领导者担心数据安全问题。
相比之下,小语言模型(SLMs)提供了可行的替代方案:它们可本地部署,计算需求低,并能确保对敏感数据的控制。Elastic的研究指出,65%的公共部门领导者难以实时大规模使用数据。SLMs通过向量搜索和来源验证等智能检索技术,仅调取相关信息,从而实现安全且准确的回答。

资讯正文
在受限的公共部门环境中实现人工智能运营
赞助
与Elastic合作
人工智能热潮已席卷各行各业,公共部门组织正面临加速采用AI的压力。与此同时,政府机构在安全、治理和运营方面面临独特的限制,这使它们区别于私营企业。因此,专为特定用途设计的小型语言模型(SLMs)为在这些环境中实现AI运营提供了有前景的路径。
凯捷(Capgemini)的一项研究发现,全球79%的公共部门高管对AI的数据安全性感到担忧,这一数字是可以理解的,因为政府数据敏感度高,且对其使用有法律义务。正如Elastic的AI副总裁韩晓所说:“政府机构必须非常严格地控制向网络发送的数据类型。这给它们如何思考和管理数据设定了很多边界。”
对敏感信息的控制需求是诸多复杂因素之一,尤其相较于私营部门的标准操作假设,这使得AI部署更加困难。
独特的运营挑战
当私营企业扩展AI时,通常会假设某些条件已经具备,包括持续连接云端、依赖集中式基础设施、接受模型透明度不足,以及对数据流动的限制有限。但对于许多政府机构而言,接受这些条件可能从危险到不可能不等。
政府机构必须确保其数据始终处于自身控制之下,信息可以被核查和验证,并且运营中断要降到最低。同时,它们往往需要在互联网连接有限、不可靠或完全不可用的环境中运行系统。这些复杂性阻碍了许多有潜力的公共部门AI试点项目从实验阶段走向实际应用。“很多人低估了AI的运营挑战,”韩晓表示,“公共部门需要AI能够在各种数据上可靠运行,并且能够扩展而不崩溃。运营连续性常常被低估。一项针对公共部门领导者的Elastic调查显示,65%的人难以实时、大规模地持续使用数据。
基础设施限制加剧了这一问题。政府机构还可能难以获得用于训练和访问复杂AI模型的图形处理器(GPU)。正如韩晓指出的那样:“政府通常不会购买GPU,不像私营企业那样熟悉GPU基础设施的管理。因此,获取GPU来运行模型对许多公共部门来说是一个瓶颈。”
更小、更实用的模型
公共部门的诸多不可妥协的要求使得大型语言模型(LLMs)难以实施。但小型语言模型(SLMs)可以本地部署,提供更高的安全性和控制权。SLMs是专门化的AI模型,通常使用数十亿而非数百亿参数,相比最大的LLMs计算需求低得多。
公共部门无需构建越来越大的模型并将其部署在远程的集中式位置。一项实证研究表明,小型语言模型(SLMs)的表现与大型语言模型(LLMs)相当甚至更优。SLMs能够在不增加运维复杂性的前提下,有效且高效地使用敏感信息。肖这样解释道:‘用ChatGPT进行校对很容易,但在没有网络连接的环境中,要像运行自己的大语言模型那样顺畅却非常困难。’
SLMs是为特定部门或机构的需求量身打造的。数据存储在模型之外的安全位置,仅在查询时才被访问。精心设计的提示词确保只检索最相关的信息,从而提供更准确的回答。通过智能检索、向量搜索和可验证的来源定位等方法,可以构建出满足公共部门需求的人工智能系统。
因此,公共部门人工智能应用的下一阶段可能是将AI工具带到数据所在处,而不是把数据发送到云端。Gartner预测,到2027年,小型专用AI模型的使用频率将是LLMs的三倍。
更强大的搜索能力
‘当公共部门人员听到AI时,他们可能首先想到的是ChatGPT。但我们应该更有雄心,’肖说。‘AI可以彻底改变政府如何搜索和管理其庞大的数据资源。’
超越聊天机器人,AI最直接的机会之一就是显著提升搜索效率。与许多组织一样,公共部门拥有大量非结构化数据——包括技术报告、采购文件、会议纪要和发票。如今的人工智能可以从多种媒体中提取结果,例如可读PDF、扫描件、图像、电子表格和录音,并支持多种语言。所有这些都可以由SLM驱动的系统索引,从而提供定制化的响应,并以任何语言起草复杂的文本,同时确保输出符合法律要求。‘公共部门有很多数据,但他们并不总是知道如何利用这些数据,也不知道其中的可能性在哪里,’肖表示。
更进一步,AI可以帮助政府员工理解他们所获取的数据。‘当今的人工智能能为你提供一种全新的方式来挖掘这些数据的价值,’肖说。一个训练良好的SLM可以解读法律规范,从公众咨询中提取洞察,支持基于数据的决策制定,并改善公众获取服务和行政信息的能力。这将极大提升公共部门的运作效率。
小型语言模型的潜力
聚焦于SLMs意味着讨论的重点从模型的全面性转向效率。LLMs带来显著的性能和计算成本,需要许多公共机构无法负担的专业硬件。尽管需要一定的资本支出,SLMs比LLMs资源消耗更低,因此通常更便宜,也能减少环境影响。
公共部门机构通常面临严格的审计要求,而SLM算法可以被记录和认证为透明的。一些国家,尤其是欧洲国家,还有如GDPR这样的隐私法规,SLM可以设计为满足这些要求。
定制训练数据能产生更精准的结果,减少人工智能容易出现的错误、偏见和幻觉。正如肖所说:“大型语言模型根据其训练内容生成文本,因此它们有一个训练截止日期。如果你询问该日期之后的内容,它们就会产生幻觉。我们可以通过强制模型使用经过验证的来源来解决这个问题。”
通过将数据保留在本地服务器上,甚至特定设备上,也能降低风险。这并不是关于隔离,而是关于战略性自主权,以建立信任、韧性和相关性。
通过优先选择专为本地处理数据环境设计的任务导向型模型,并持续监控性能和影响,公共部门组织可以构建持久的人工智能能力,从而支持现实世界的决策。‘不要从聊天机器人开始;从搜索开始,’肖建议道。‘我们认为的人工智能智能,实际上更多是关于找到正确信息。’
本文由《麻省理工科技评论》的定制内容部门Insights制作,不是由《麻省理工科技评论》编辑团队撰写。内容由人类作家、编辑、分析师和插画师研究、设计和编写,包括调查问卷的撰写及数据收集。可能使用的AI工具仅限于辅助生产流程,并经过严格的人工审核。
深度解析
OpenAI正全力投入打造全自动研究员
独家对话OpenAI首席科学家雅库布·帕霍茨基,探讨该公司新的重大挑战及人工智能的未来。
宝可梦GO如何让配送机器人获得精确到厘米的世界视角
独家报道:Niantic的人工智能衍生公司正在利用玩家贡献的300亿张城市地标图像,训练一种新型世界模型。
来源与参考
收录于 2026-04-17