辅助功能设置

文字大小

色彩设置

单色 柔和色 dark

阅读工具

底部遮盖 标尺

2025年3月的一场示威活动中,抗议者反对由埃隆·马斯克领导的特朗普白宫临时小组 DOGE 在退伍军人事务部取消合同并裁减数千个岗位的决定。图:Shutterstock

文章

主题

揭露DOGE利用缺陷AI削减退伍军人关键服务,他们是如何做到的?

其他语言

今年年初,特朗普政府在埃隆·马斯克的领导下成立了政府效率部(DOGE),其公开目标是查明并削减联邦政府中的浪费、欺诈和滥用行为。该部门的重点目标之一是退伍军人事务部(VA)——一个负责为数百万前美国军人提供医疗保健和其他服务的机构。最终,该部门取消了数百份由退伍军人事务部管理的合同。

迄今为止,被取消的合同总数约有600份,内容涵盖了从用于协助开发新癌症疗法的基因测序设备,到帮助衡量和改善护理质量的工具等多个领域。然而,一个未曾公开的事实是,在确定削减哪些合同的过程中,人工智能(AI)扮演了至关重要的角色。

这款人工智能工具由DOGE的一名软件工程师开发,而他在政府采购或医疗保健领域毫无经验。该工具的任务是全面审查退伍军人事务部的合同,并专门将那些可供削减的合同标记为“munchable”(即可吞噬的)。据统计,该工具总共将超过2000份合同列为削减目标。

政府不仅没有披露使用AI来筛选合同一事,而且当新闻机构ProPublica的记者团队获取该工具的源代码后,发现其代码充满了错误和“幻觉”。例如,该工具会严重夸大某些合同的金额,甚至将与患者直接相关的护理合同也列为削减目标。ProPublica发布的这篇重磅调查深入剖析了用于“吞噬”政府合同的代码,揭示了草率部署人工智能技术会如何带来严重且始料未及的后果。

寻找故事线索

故事的开端很简单——源于一条线索。

“在特朗普政府入主白宫几周后,退伍军人事务部(VA)内部一片混乱,”ProPublica的调查记者、这篇揭露报道的三位署名作者之一维纳尔·科尔曼(Vernal Coleman)说。“有人被解雇,有人被安排行政休假,大家都不清楚自己的未来会怎样,养老金也可能面临风险——各种状况层出不穷。人们都非常焦虑。”

在此期间,科尔曼所在的记者团队正在报道这场动荡给退伍军人事务部带来的影响。一名线人主动联系了他,并提供了一大批该机构的内部文件,其中包括一份备忘录,详细说明了如何通过一个被称为“Munchable”的人工智能脚本,来自动化筛选那些据称是浪费性的合同。

科尔曼和ProPublica团队随即与线人合作,获取了更多与此流程相关的内部文件,其中就包括存储在一张SD卡里的人工智能源代码。科尔曼解释说:“我们拿到了原始代码,以及至少一部分首次尝试运行这些代码后得出的结果,还有它实际能够标记出的合同清单。”

“在那一刻,我们意识到,一个大新闻来了。”

调查脚本代码

“当你与人工智能打交道时,指令必须非常具体。你必须直接、清晰,不能有任何模棱两可的地方。一旦你给它留下了诠释的空间,就等于给了人工智能一个凭空编造内容的机会。”布兰登·罗伯茨(Brandon Roberts)指出。他是ProPublica新闻应用团队的一名调查记者,也参与了这篇报道。

在分析这个人工智能脚本的早期阶段,罗伯茨就发现了几个明显的危险信号。他说:“给AI的提示词漫长而混乱,充满了大量的歧义……而且我们手头有它运行的结果,所以能清楚地看到它在哪里犯了错。事实是,它犯了成堆的错误。”

ProPublica image on different 'munchable' levels of DOGE AI tool analyzing VA contracts

人工智能工具试图通过提示词将退伍军人事务部(VA)合同的价值分为几个等级,以找出削减目标。但该工具无法理解合同的细节,也无法辨别哪些合同与患者的直接护理密切相关。图片来源:ProPublica网站

这个人工智能的任务是将退伍军人事务部的合同分为三个等级。0级被定义为与“直接患者护理”相关,因此“不可吞噬”——例如,在退伍军人医院工作的床边护士。所谓的1级合同则包括那些无法在内部找到替代的顾问服务。而被认为适合削减的合同类别,则包括与多元化、公平性和包容性(DEI)相关的项目,以及那些被归类为“与退伍军人护理有多重间接关系”的合同。

罗伯茨解释说:“一项服务是否‘可被吞噬’,其判断标准是它与患者护理的接近程度。因此,这其中存在一个固有的假设:任何非床边护士的人员都不直接参与患者护理。但人工智能根本无从判断这一假设是否成立。它不知道这些合同上的人员具体在做什么。”

例如,在梳理那些被人工智能标记为优先削减的合同时,ProPublica团队发现了一些与患者护理直接相关的项目被错误分类的情况——比如一种用于协助抬起无法动弹的病人的设备,竟被错误地描述为与患者有多重间接关系。

科尔曼说,从那以后,“事情就变成了逐一审查合同,并查阅公开的合同网站,以弄清楚:这份合同究竟是什么时候被取消的?它真的被取消了吗?在确认这些信息后,我们再去和那些真正在一线的相关人员交谈,了解这份合同的实际作用。”

采访开发者

尽管团队已经掌握了原始代码,并能识别出哪些合同被标记为取消对象,但罗伯茨表示,他们仍想更深入地探究“Munchable”在退伍军人事务部内部造成的影响。“这个工具是如何被使用的?由谁来决定这一切?”

团队决定联系该程序的开发者萨希尔·拉文吉亚(Sahil Lavingia),以了解他在政府效率部(DOGE)的工作授权范围。“他的上级究竟告诉他这项工作的范围是什么?他是否被允许放手去做任何他认为需要做的事情来达成目标?如果是,那个目标又是什么?这个项目上曾有过什么样的限制?”罗伯茨说,“我认为,他是唯一能为我们解答这些问题的人。”

当拉文吉亚还在DOGE工作时,罗伯茨曾与他进行过一次非正式的谈话,但他当时不愿公开评论他的人工智能程序。然而到了五月,拉文吉亚被DOGE解雇,据称是因为向媒体谈论了他的工作。从那时起,他同意公开谈论他的人工智能项目。

ProPublica对拉文吉亚的采访,为了解DOGE内部人员如何看待利用人工智能来执行其临时任务提供了一个窗口,同时也揭示了他们“技术优先”方法所带来的风险。采访显示,拉文吉亚仅在入职第二天就构建了该工具的第一个版本,并在第一周内就开始将合同数据输入他的笔记本电脑进行分析。

科尔曼说:“很明显,这就是一个技术专家试图解决问题的典型案例。他完全没有考虑到当时实际发生的所有背景情况。如果你想替换掉一份合同并选择一个更便宜的方案,后续由谁来执行?如果你真的取消了这份合同,过渡期间由哪些员工来完成这项工作?这会对其他护理服务造成多大的压力?又会如何影响到患者?”

罗伯茨解释说:“(拉文吉亚)或许是DOGE使命的真正信徒——至少是其公开宣称的使命:努力让政府更高效,从而更好地为人民服务。在我看来,这不过是‘让我们用技术来解决一个本属于政治和社会问题’的又一个翻版。这并不是一个计算机问题。”

罗伯茨补充道:“当你这样做的时候,我们在这里发现的所有结果——所有的错误、所有奇怪的问题——几乎都是注定会发生的。”

给调查人工智能的记者的建议

ProPublica的报道发布后,参议院民主党人呼吁联邦政府对退伍军人事务部取消政府合同的做法展开调查,包括调查在该过程中使用“Munchable”人工智能的情况。

对于报道人工智能及其在政府和机构中应用的记者,罗伯茨建议他们可以从设想所有可能的失败情形入手,然后逆向推导。“想一想,如果它产生幻觉会怎样?如果它错误地标记了某些东西会怎样?你不需要任何人工智能经验就能思考这类问题。”他指出。

“我们在DOGE身上看到的一点是,他们根本没有考虑过这类事情。他们并不在乎,”他评论道。“人工智能之所以会出问题,正是因为人们没有思考全局,而只关注于那一小块技术本身。”

科尔曼则重申,即使在人工智能时代进行报道,扎实的一线实地采访依然至关重要。

他建议说:“多发展信源,接近那些处在人工智能开发和应用第一线的人,努力去理解它。这样你就能知道他们正在尝试什么,以及它被如何应用。你也能了解当权者究竟打算如何利用这项技术。通过与这些人交谈,当真正发生事情时,你就能处在最佳位置,接触到那些了解内情的聪明人。”


Devin WindelspechtDevin Windelspecht is是一名常驻华盛顿特区的作家和编辑,他热衷于通过新闻工作解决紧迫的全球性问题。他的文章重点关注独立记者在当今一些最紧迫议题上的工作,包括冲突、人权、气候变化和民主。他的报道曾聚焦于俄罗斯的亲民主记者、巴西的环境记者、报道美国生育权的记者、乌克兰的战地记者,以及报道全球专制国家的流亡媒体机构。

您可以根据知识共享协议条款免费转载这篇文章

转载


阅读更多

深度报道方法

如何用数据揭露系统性的性别暴力?

CCIJ 通过数据分析揭露了非洲国家斯瓦蒂尼针对女性的系统性暴力。在这篇文章中,他们通过十个步骤,详细介绍了团队如何获取相关数据、建立分析框架,最终揭示司法系统整体性缺陷的。