

2025年3月的一場示威活動中,抗議者反對由埃隆·馬斯克領導的特朗普白宮臨時小組 DOGE 在退伍軍人事務部取消合同並裁減數千個崗位的決定。圖:Shutterstock
今年年初,特朗普政府在埃隆·馬斯克的領導下成立了政府效率部(DOGE),其公開目標是查明並削減聯邦政府中的浪費、欺詐和濫用行為。該部門的重點目標之一是退伍軍人事務部(VA)——一個負責為數百萬前美國軍人提供醫療保健和其他服務的機構。最終,該部門取消了數百份由退伍軍人事務部管理的合同。
迄今為止,被取消的合同總數約有600份,內容涵蓋了從用於協助開發新癌症療法的基因測序設備,到幫助衡量和改善護理質量的工具等多個領域。然而,一個未曾公開的事實是,在確定削減哪些合同的過程中,人工智能(AI)扮演了至關重要的角色。
這款人工智能工具由DOGE的一名軟件工程師開發,而他在政府採購或醫療保健領域毫無經驗。該工具的任務是全面審查退伍軍人事務部的合同,並專門將那些可供削減的合同標記為“munchable”(即可吞噬的)。據統計,該工具總共將超過2000份合同列為削減目標。
政府不僅沒有披露使用AI來篩選合同一事,而且當新聞機構ProPublica的記者團隊獲取該工具的源代碼後,發現其代碼充滿了錯誤和“幻覺”。例如,該工具會嚴重誇大某些合同的金額,甚至將與患者直接相關的護理合同也列為削減目標。ProPublica發布的這篇重磅調查深入剖析了用於“吞噬”政府合同的代碼,揭示了草率部署人工智能技術會如何帶來嚴重且始料未及的後果。
尋找故事線索
故事的開端很簡單——源於一條線索。
“在特朗普政府入主白宮幾周後,退伍軍人事務部(VA)內部一片混亂,”ProPublica的調查記者、這篇揭露報道的三位署名作者之一維納爾·科爾曼(Vernal Coleman)說。“有人被解僱,有人被安排行政休假,大家都不清楚自己的未來會怎樣,養老金也可能面臨風險——各種狀況層出不窮。人們都非常焦慮。”
在此期間,科爾曼所在的記者團隊正在報道這場動蕩給退伍軍人事務部帶來的影響。一名線人主動聯繫了他,並提供了一大批該機構的內部文件,其中包括一份備忘錄,詳細說明了如何通過一個被稱為“Munchable”的人工智能腳本,來自動化篩選那些據稱是浪費性的合同。
科爾曼和ProPublica團隊隨即與線人合作,獲取了更多與此流程相關的內部文件,其中就包括存儲在一張SD卡里的人工智能源代碼。科爾曼解釋說:“我們拿到了原始代碼,以及至少一部分首次嘗試運行這些代碼後得出的結果,還有它實際能夠標記出的合同清單。”
“在那一刻,我們意識到,一個大新聞來了。”
調查腳本代碼
“當你與人工智能打交道時,指令必須非常具體。你必須直接、清晰,不能有任何模稜兩可的地方。一旦你給它留下了詮釋的空間,就等於給了人工智能一個憑空編造內容的機會。”布蘭登·羅伯茨(Brandon Roberts)指出。他是ProPublica新聞應用團隊的一名調查記者,也參與了這篇報道。
在分析這個人工智能腳本的早期階段,羅伯茨就發現了幾個明顯的危險信號。他說:“給AI的提示詞漫長而混亂,充滿了大量的歧義……而且我們手頭有它運行的結果,所以能清楚地看到它在哪裡犯了錯。事實是,它犯了成堆的錯誤。”

人工智能工具試圖通過提示詞將退伍軍人事務部(VA)合同的價值分為幾個等級,以找出削減目標。但該工具無法理解合同的細節,也無法辨別哪些合同與患者的直接護理密切相關。圖片來源:ProPublica網站
這個人工智能的任務是將退伍軍人事務部的合同分為三個等級。0級被定義為與“直接患者護理”相關,因此“不可吞噬”——例如,在退伍軍人醫院工作的床邊護士。所謂的1級合同則包括那些無法在內部找到替代的顧問服務。而被認為適合削減的合同類別,則包括與多元化、公平性和包容性(DEI)相關的項目,以及那些被歸類為“與退伍軍人護理有多重間接關係”的合同。
羅伯茨解釋說:“一項服務是否‘可被吞噬’,其判斷標準是它與患者護理的接近程度。因此,這其中存在一個固有的假設:任何非床邊護士的人員都不直接參与患者護理。但人工智能根本無從判斷這一假設是否成立。它不知道這些合同上的人員具體在做什麼。”
例如,在梳理那些被人工智能標記為優先削減的合同時,ProPublica團隊發現了一些與患者護理直接相關的項目被錯誤分類的情況——比如一種用於協助抬起無法動彈的病人的設備,竟被錯誤地描述為與患者有多重間接關係。
科爾曼說,從那以後,“事情就變成了逐一審查合同,並查閱公開的合同網站,以弄清楚:這份合同究竟是什麼時候被取消的?它真的被取消了嗎?在確認這些信息後,我們再去和那些真正在一線的相關人員交談,了解這份合同的實際作用。”
採訪開發者
儘管團隊已經掌握了原始代碼,並能識別出哪些合同被標記為取消對象,但羅伯茨表示,他們仍想更深入地探究“Munchable”在退伍軍人事務部內部造成的影響。“這個工具是如何被使用的?由誰來決定這一切?”
團隊決定聯繫該程序的開發者薩希爾·拉文吉亞(Sahil Lavingia),以了解他在政府效率部(DOGE)的工作授權範圍。“他的上級究竟告訴他這項工作的範圍是什麼?他是否被允許放手去做任何他認為需要做的事情來達成目標?如果是,那個目標又是什麼?這個項目上曾有過什麼樣的限制?”羅伯茨說,“我認為,他是唯一能為我們解答這些問題的人。”
當拉文吉亞還在DOGE工作時,羅伯茨曾與他進行過一次非正式的談話,但他當時不願公開評論他的人工智能程序。然而到了五月,拉文吉亞被DOGE解僱,據稱是因為向媒體談論了他的工作。從那時起,他同意公開談論他的人工智能項目。
ProPublica對拉文吉亞的採訪,為了解DOGE內部人員如何看待利用人工智能來執行其臨時任務提供了一個窗口,同時也揭示了他們“技術優先”方法所帶來的風險。採訪顯示,拉文吉亞僅在入職第二天就構建了該工具的第一個版本,並在第一周內就開始將合同數據輸入他的筆記本電腦進行分析。
科爾曼說:“很明顯,這就是一個技術專家試圖解決問題的典型案例。他完全沒有考慮到當時實際發生的所有背景情況。如果你想替換掉一份合同並選擇一個更便宜的方案,後續由誰來執行?如果你真的取消了這份合同,過渡期間由哪些員工來完成這項工作?這會對其他護理服務造成多大的壓力?又會如何影響到患者?”
羅伯茨解釋說:“(拉文吉亞)或許是DOGE使命的真正信徒——至少是其公開宣稱的使命:努力讓政府更高效,從而更好地為人民服務。在我看來,這不過是‘讓我們用技術來解決一個本屬於政治和社會問題’的又一個翻版。這並不是一個計算機問題。”
羅伯茨補充道:“當你這樣做的時候,我們在這裡發現的所有結果——所有的錯誤、所有奇怪的問題——幾乎都是註定會發生的。”
給調查人工智能的記者的建議
ProPublica的報道發布後,參議院民主黨人呼籲聯邦政府對退伍軍人事務部取消政府合同的做法展開調查,包括調查在該過程中使用“Munchable”人工智能的情況。
對於報道人工智能及其在政府和機構中應用的記者,羅伯茨建議他們可以從設想所有可能的失敗情形入手,然後逆向推導。“想一想,如果它產生幻覺會怎樣?如果它錯誤地標記了某些東西會怎樣?你不需要任何人工智能經驗就能思考這類問題。”他指出。
“我們在DOGE身上看到的一點是,他們根本沒有考慮過這類事情。他們並不在乎,”他評論道。“人工智能之所以會出問題,正是因為人們沒有思考全局,而只關注於那一小塊技術本身。”
科爾曼則重申,即使在人工智能時代進行報道,紮實的一線實地採訪依然至關重要。
他建議說:“多發展信源,接近那些處在人工智能開發和應用第一線的人,努力去理解它。這樣你就能知道他們正在嘗試什麼,以及它被如何應用。你也能了解當權者究竟打算如何利用這項技術。通過與這些人交談,當真正發生事情時,你就能處在最佳位置,接觸到那些了解內情的聰明人。”
Devin Windelspecht is是一名常駐華盛頓特區的作家和編輯,他熱衷於通過新聞工作解決緊迫的全球性問題。他的文章重點關注獨立記者在當今一些最緊迫議題上的工作,包括衝突、人權、氣候變化和民主。他的報道曾聚焦於俄羅斯的親民主記者、巴西的環境記者、報道美國生育權的記者、烏克蘭的戰地記者,以及報道全球專制國家的流亡媒體機構。