插畫作者:Nodjadong Boonprasert
我們正接近一個“信噪比”趨近於一的臨界點——這意味着,隨着虛假信息的傳播速度逐漸趕上真實信息,分辨信息真偽已變得越來越困難。這份指南旨在培訓新聞工作者如何在截稿壓力下識別 AI 生成的內容,並提供了七個每位新聞工作者都需要掌握的檢測方法。
作為一名協助新聞機構打擊虛假信息的從業者,最讓我夜不能寐的是:傳統的事實核查往往需要數小時甚至數天,而 AI 生成虛假信息只需幾分鐘。
視頻虛假信息的歷史非常久遠,甚至早於現代 AI 技術幾十年。即便受限於早期錄像設備的技術水平,視頻仍能製造出極具破壞力的錯誤假象。2003年,保姆克勞迪婭·穆羅(Claudia Muro)蒙冤入獄29個月,只因低幀率的監控攝像頭將她原本溫柔的動作拍得看似暴力,而當時沒人想到去驗證錄像的真實性。到了2025年1月,英國教師謝麗爾·貝內特(Cheryl Bennett)因一段偽造她發表種族主義言論的“深度偽造”(deepfake)視頻而被迫隱姓埋名。

一張顯示教宗方濟各身穿巴黎世家的羽絨服的 AI 生成圖。圖:Midjourney, Pablo Xavier
這張教宗方濟各身穿白色巴黎世家羽絨服的照片曾在社交媒體上瘋傳,欺騙了數百萬網民,最終被證實是用 Midjourney 的“文生圖”功能生成的 AI 圖像。關鍵的破綻在於他胸前的十字架莫名其妙地懸在半空,且鏈條的另一半本該存在的地方卻只有白色羽絨服。圖像的創作者巴勃羅·沙維爾(Pablo Xavier)告訴 BuzzFeed 新聞:“我只是覺得看到教宗穿着滑稽的夾克很有趣。”
有時,最有效的偽造根本不需要 AI。2019年5月,一段美國眾議院議長佩洛西(Nancy Pelosi)的視頻被放慢至 75% 的速度並經過變調處理,讓她看起來像是喝醉了。2018年11月,白宮分享了一段加速處理後的 CNN 記者吉姆·阿科斯塔(Jim Acosta)與白宮實習生互動的視頻,讓他原本的手臂動作看起來比實際情況更具攻擊性。
最近,我在午休時間僅用了28分鐘就製造了一起徹頭徹尾的虛假政治醜聞——包括新聞主播、憤怒的市民、抗議畫面以及那個虛構的市長本人。總成本是多少?8美元,28分鐘,我就製造了一場完全虛構的政治危機,足以矇騙那些在截稿壓力下忙得焦頭爛額的編輯。
不久前,我曾目睹一位經驗豐富的事實核查員自信地宣布一張 AI 生成的圖片是“真實”的,理由是圖中的手是完美的五根手指,而不是六根。但現在,這種鑒別方法已基本失效。
這就是 AI 檢測面臨的殘酷現實:那些曾讓我們感到安全的方法正在眼皮底下消失。在 AI 圖像生成器的早期發展階段,畫得很爛的手非常常見(比如多出的手指或粘連的指頭),這些特徵常被用來識別 AI 圖像。像2023年瘋傳的“特朗普被捕”假照片,部分就是因為這些明顯的手部錯誤而露餡的。然而,到了2025年,Midjourney 和 DALL-E 等主流 AI 模型在繪製結構準確的手部方面已有了顯著提升。結果就是,手部特徵不再是檢測 AI 圖像的可靠依據,想要識別 AI 藝術的人必須尋找其他更細微的線索。
文本渲染技術的變革甚至來得更快。曾經,AI 生成的抗議標語牌上滿是諸如“STTPO THE MADNESSS”和“FREEE PALESTIME”這樣的亂碼,而現在的部分模型已能生成完美的排版。OpenAI 專門針對文本準確性訓練了 DALL-E 3,Midjourney V6 也將“精準文本”作為一個賣點。這一曾經可靠的檢測方法,如今已鮮有成效。
錯位的耳朵、不自然的大小眼以及看起來像是畫上去的牙齒,這些曾經區分 AI 人臉的特徵正變得越來越罕見。2023年1月生成的人像經常出現肉眼可見的瑕疵,而如今同樣的提示詞已經能生成令人信以為真的面孔。
對新聞編輯室而言,這構成了根本性的危險。一名受過2023年檢測方法培訓的記者可能會產生盲目自信,僅僅因為某些內容通過了過時的測試,就將明顯由 AI 生成的內容判定為真,這種錯位的確定性比坦誠的不確定性更危險。
入門:Image Whisperer

Image Whisperer 對一張聲稱顯示美國洪災後女孩獲救的 AI 生成圖像的分析。圖:Henk van Ess
我曾想過,是否可以在這篇文章之外,附贈一個幫助識別 AI 內容的驗證助手。於是我開始給專家發郵件。他們帶我深入到了我未曾預料的物理領域:傅里葉變換、神經網絡的量子力學,以及人眼無法察覺的數學特徵。一位物理學家解釋說,AI 產生的偽影不僅僅是視覺上的瑕疵——它們是頻率域中的指紋。
但緊接着,現實給了我一記重擊:“不要自己構建工具,”一位專家警告道,“你需要龐大的算力和博士級別的團隊。沒有這些基礎設施,你只會慘敗。”
就在那時,我突然想通了。為什麼不用 AI 來對抗 AI,但換個思路呢?與其重新開發價值數十億美元的檢測系統,不如利用現有的 AI 基礎設施來完成繁重的工作。

Image Whisperer 對一張聲稱顯示白俄羅斯總統手持一筒薯條的 AI 生成圖像分析。圖:Henk van Ess
Image Whisperer(原名:Detectai.live)就是在這個理念下誕生的。該工具並行運行大語言模型分析與 Google Vision 處理,應用專家們教給我的物理學原理,同時利用現有的計算能力。最重要的是,與大多數 AI 工具不同,當它不知道時,它會如實告訴你,而不是瞎猜。
它並不希望成為市面上最好的 AI 生成圖片檢測系統——它希望成為最誠實的那個。
七大 AI 檢測類別
AI 創作者與檢測者之間的競賽仍在繼續,目前創作者佔據速度優勢。識別深度偽造(deepfake)正演變成一場貓鼠遊戲,開發人員不斷改進技術。成功識別深度偽造需要結合多種檢測方法,保持時刻警惕,並接受“完美檢測可能不存在”這一事實。對於尋求精確答案的記者來說,目標已經從“確切鑒定”轉變為“概率評估”和“基於專業認知的編輯判斷”。
但新聞業總是能適應技術的變遷。當任何人都能創建網站時,我們學會了核實信源;當每個人都成為潛在的報道者時,我們制定了社交媒體核查方法;現在,在這個任何人都能製造出令人信服的視聽證據的時代,我們必須建立新的標準。
第一類:解剖學與物體的破綻:當完美成為破綻
View this post on Instagram
30秒危險信號檢查(針對突發新聞): 當時間緊迫,你需要對那些可疑的“完美感”進行即時評估時,請相信你的直覺——如果有些東西看起來“好得令人難以置信”。在那些不可能或不適合如此精緻的語境中,尋找雜誌級別的審美。一位化着完美妝容的抗議領袖、一位髮型完美的災難受害者,或者一個每個人都像經過專業造型設計的抓拍政治時刻,都應立即引起你的懷疑。
- 完美感直覺檢查 — 此人是否看起來過於精緻/完美,不符合當前情況?
- 處境不匹配掃描 — 在危機/衝突場景中出現雜誌級的美感?
- 皮膚真實度檢查 — 本該有自然紋理的地方卻呈現噴槍修圖般的平滑?
- 整體修飾評估 — 外表是否符合場景設定?
五分鐘技術核實(適用於常規報道): 這種更深入的檢查側重於那些暴露人工生成痕迹的技術細節。現代 AI 能生成解剖結構正確的圖像,但它們往往表現出一種真實攝影中不存在的“詭異完美”。真人的面孔有微妙的不對稱、自然的磨損痕迹和環境影響,而 AI 很難真實地複製這些。
- 面部放大至 100% — 尋找自然的皮膚紋理、毛孔和微小的不對稱。
- 衣物紋理評估 — 是否存在自然的褶皺、織物紋理和磨損痕迹?
- 髮絲分析 — 是一根根清晰可見的髮絲,還是塗抹/渲染出來的外觀?
- 珠寶/配飾真實感 — 是三維立體的外觀,還是計算機圖形般的扁平感?
- 牙齒檢查 — 是否有自然的瑕疵,還是整齊劃一的完美?
- 整體完美審計 — 修飾水平是否符合聲稱的語境和背景?
深度調查(適用於重磅報道): 對於準確性至關重要的報道,這種綜合分析將圖像視為需要法證級審查的證據,目標是建立基於多個驗證點的概率評估,並理解雖然確鑿的證據可能無法獲得,但明智的判斷卻是可以實現的。
- 對比分析 — 找到同一個人的其他照片,對比自然與人工修飾的程度。
- 技術放大 — 使用專業工具在像素級別檢查皮膚紋理的數學模式。
- 背景核實 — 研究並對比其他圖像,確定該人在類似場合是否通常如此精緻。
- 專業諮詢 — 聯繫像哈尼·法里德(Farid Hany)這樣的數字取證專家進行高級分析。
- 多角度驗證 — 尋找同一事件的其他照片/視頻以檢查一致性。
- 歷史比對 — 與同一時期和背景下該人經核實的照片進行比對。
第二類:違背幾何物理學——當 AI 無視自然法則

一張 AI 生成的鐵軌向遠處延伸的圖像,與其並列的是一張具有正確透視關係的實景照片。圖:Henk van Ess
原理: AI 像是一個拼貼藝術家,而不是攝影師。它理解視覺元素,但不理解現實世界中光線、透視和陰影運作的幾何與物理規則。這些基本的物理錯誤對 AI 來說很難修正,因為這需要理解三維空間和光線行為。
AI 圖像中的現實物理問題: 儘管我們仍處於生成式 AI 的早期階段,但今天的 AI 生成圖像已經在透視校正陰影和反射方面取得進展。一個使用 OpenAI DALL-E 2 生成的典型例子可能會顯示不一致的陰影、完全不匹配或缺失的反射,以及反射中的陰影方向完全錯誤。
消失點分析: 真實的建築物遵循透視法則——平行線會在地平線上的某一點匯聚。AI 經常生成的建築物,其屋頂線指向左邊,而窗戶線卻指向右邊,這種物理上的不可能性揭示了它是算法拼湊而非攝影捕捉的結果。消失點對於捕捉真實圖像中的透視本質至關重要,而生成的圖像通常表現出線條未能匯聚在正確消失點上的不一致性。
陰影一致性檢查: 有光的地方就有陰影。物體、陰影和照明光源之間的關係在幾何上很簡單,但在篡改或合成的圖像中卻極難做到完全正確。在單一光源場景(如陽光下),所有陰影必須指向該光源的相反方向。AI 經常顯示只有太陽一個光源,但人們卻投射出多個方向的陰影,這違反了基本的物理定律。
研究驗證: 學術研究已經證實了這些幾何缺陷。使用 GradCam 分析戶外圖像的研究揭示了車輛陰影方向各異,以及消失點附近的結構扭曲;而室內場景則顯示出物體與陰影不匹配以及房間幾何線條錯位。
這種細微的差別並非一般人所能覺察,要習慣於先盯着線條看。
30秒危險信號檢查:
- 找一張筆直的火車鐵軌照片(谷歌搜索“railroad tracks perspective”)。
- 打開“畫圖”或任何基礎圖像編輯器。
- 使用線條工具描繪兩條鐵軌,將它們向地平線延伸。
- 檢查它們是否匯聚於一點——這是應該發生的情況。
現在你掌握了正確透視外觀的視覺模板。
五分鐘技術核實(適用常規報道):
透視測試:
- 在圖像中選擇一棟建築物。
- 使用任何圖像編輯器畫出延長的屋頂線和窗戶行。
- 檢查同一建築物的線條是否匯聚於一點。
- 同一結構有多個消失點 = AI 拼湊錯誤。
陰影分析:
- 確定主光源(最亮的高光部分)。
- 畫線從光源穿過物體頂部連接到陰影末端。
- 驗證所有陰影是否指向同一方向。
- 陰影方向衝突 = 違反物理定律。
深度調查(適用重磅報道):
反射驗證: 當物體反射在平面上時,連接物體上一點與反射中對應點的線條應匯聚於單一消失點。
- 在圖像中尋找反射表面(水面、玻璃、鏡子)。
- 畫線連接物體與其反射影像。
- 檢查線條是否以直角與反射表面相交。
- 不可能的反射位置 = 無效幾何。
第三類:技術指紋與像素分析——數學層面的 DNA

一張在網絡瘋傳、經過數字篡改的2004年美軍士兵照片。圖片中被人為添加了“DOING THE WORK OF”字樣的臂章,以及俄羅斯、德國和法國的國旗。工具展示了可能的篡改區域。圖:Henk van Ess
原理: 當 AI 創建圖像時,它會在文件中留下隱藏的線索——一種特殊的數學簽名,就像隱形的指紋,只有通過專門的工具才能檢測到。這些線索隱藏在像素的排列方式和文件的壓縮方式中。這就好比 DNA 證據,能證明某樣東西是由 AI 製造的,而非真實相機拍攝。
噪點模式檢測: 真實相機拍攝的圖像帶有自然、雜亂的瑕疵——比如來自相機傳感器的微小隨機噪點。相反,AI 生成的圖像則具有不自然的完美模式。當專家使用專門軟件分析這些模式時,他們會看到真實照片中絕不會出現的獨特星形圖案。這就好比老式電視上真正隨機的雪花點與計算機試圖模擬的隨機噪點之間的區別——如果你有合適的工具,就會發現偽造版本背後隱藏着某種特定的秩序,從而露餡。
複製粘貼檢測: 當 AI 或人類複製圖像區域時,會產生異常的像素相關性。不同的區域在空間冗餘度之外變得異常相似,從而產生可檢測的模式或數學簽名。
壓縮偽影分析: AI 生成的內容通常顯示出不自然的壓縮模式,這與相機生成的原始文件不同,揭示了其源於算法而非光學成像的本質。
專業檢測工具: TrueMedia.org 的技術能夠分析可疑媒體,並識別音頻、圖像和視頻中的深度偽造(Deepfakes)。TrueMedia.org 最近標記的深度偽造案例包括一張所謂的特朗普被捕照片,以及一張所謂的拜登總統與高級軍事人員的合影。
30秒危險信號檢測:
在分析可疑圖像之前,先拿一些簡單的練練手:
- 將你的照片上傳到圖像驗證助手(Image Verification Assistant)。
- 該技術將提供一個“偽造概率”。
- 當偽造概率達到 70% 或更高時,對圖像進行進一步研究。
五分鐘技術核實(適用於常規報道):
- 視覺紋理檢查: 將皮膚或天空等區域放大到 100%。仔細觀察紋理——它是否具有現實生活中那種隨機、不規則的質感,還是看起來過於平滑、過於完美?真實照片擁有自然的混沌感;AI 經常生成可疑的統一模式。
- 自動化檢測工具: 將圖像上傳到 TrueMedia.org(一個免費網站)。該工具會通過 AI 檢測軟件運行圖像,分析我們之前提到的隱藏數學簽名。它會給出一個百分比,以此判斷圖像由 AI 生成的可能性。
- 檢查文件的隱藏信息: 右鍵單擊圖像文件並選擇“屬性”(PC)或“顯示簡介”(Mac)。查看元數據——這顯示了創建文件的軟件和時間。AI 圖像通常會顯示編輯軟件的時間戳或創建工具,這些信息往往與照片聲稱的拍攝時間/方式不符。
- 表面平滑度分析: 這與紋理檢查步驟不同。這裡你要觀察那些本該自然不完美的表面——如牆壁、織物或水面。AI 傾向於對這些表面進行“噴槍處理”(過度磨皮),使其變得不自然地平滑,而真實照片則會顯示微小的凸起、變化或磨損。
每一步都能捕捉到不同類型的 AI 錯誤——這就好比使用多種不同的測試來確保你的結論萬無一失。
深度調查(適用於重磅報道):
Forensically: 這是一套免費、全面的噪點分析工具,具有頻域可視化功能。
頻域分析(Frequency domain analysis): 對 AI 獨有的數學模式進行技術檢測。
第四類:聲紋與音頻偽影——合成語音的破綻

對特朗普 AI 深度偽造音頻的分析。圖:YouTube(經由 Henk van Ess)
原理: 聲音克隆技術僅需幾秒鐘的音頻素材就能複製任何人的聲音,但它在語式模式、情感真實度和聲學特徵方面仍會留下人工生成的痕迹。雖然合成聲音的準確度驚人,但在複製使語音真正真實的微妙人類元素方面,它仍然很吃力。
現實世界的音頻欺詐案例: 2019年3月,一家英國能源公司的 CEO 接到了“老闆”打來的電話,對方操着一口完美的德國口音,要求進行大額轉賬。直到這名 CEO 接到來自奧地利號碼的第二個可疑電話,才揭穿了這場 AI 騙局。2024年,政治顧問史蒂文·克萊默(Steven Kramer)支付了150美元製作了一個模仿美國總統喬·拜登的深度偽造自動語音電話(robocall),敦促人們不要在2024年新罕布什爾州的民主黨初選中投票。
音頻偽造的速度與成本: 根據對克萊默的訴訟,製作這個深度偽造音頻僅耗時不到20分鐘,成本僅為1美元。克萊默告訴哥倫比亞廣播公司新聞(CBS News),他的這番操作讓他獲得了“價值500萬美元的曝光度”。
語音內容的危險信號: 研究新興技術和虛假信息的林賽·戈爾曼(Lindsay Gorman)告訴 NBC 新聞,深度偽造通常會有破綻:“其抑揚頓挫,特別是結尾部分,顯得不自然、像機器人。這是音頻內容可能造假的跡象之一。”
- 語速不自然,缺乏正常的停頓或呼吸聲。
- 發音完美無瑕,缺乏自然語音中的瑕疵。
- 某些單詞或短語的語調像機器人一樣生硬。
- 缺失了本應存在的環境背景噪音。
- 使用了當事人實際上永遠不會使用的短語或術語。
語言邏輯漏洞: 早期的一個深度偽造案例顯示,AI 說出了“pounds 35,000”(3萬5千英鎊)——它機械地將貨幣符號讀在數字之前,這種不自然的方式暴露了其合成生成的本質。
30秒危險信號檢查:
你可以試試看 Hiya Deepfake Voice Detector,這是一個簡單的 Chrome 擴展程序(每月可免費使用20次),可以實時分析音頻,判斷你聽到的是真人的聲音還是 AI 生成的。
它的具體功能包括:
- 分析你在 Chrome 瀏覽器中播放的視頻和音頻中的聲音。
- 即時工作,僅需一秒鐘的音頻即可做出判斷。
- 適用於任何網站——社交媒體平台、新聞網站、視頻平台。
- 檢測由所有主流 AI 語音合成工具生成的類人語音。
- 支持多種語言。
- 在你瀏覽網頁時實時運行。
注意:由於該插件使用概率算法,它無法保證在每種情況下都 100% 準確。
五分鐘技術核實(適用於常規報道):
- 聽辨語音自然度 — 語速和發音是否感覺像真人?
- 核實可能性 — 當事人是否真的可能在聲稱的時間地點發表此聲明?
- 檢查情感真實度 — 情感是否與內容和語境相符?
- 回撥官方號碼 — 對任何緊急的音頻請求,都要回撥官方號碼進行核實。
- 詢問背景問題 — 詢問只有真人才知道的背景問題。
深度調查(適用重磅報道):
- 下載完整的音頻片段。
- 將其輸入 Notta.ai 並讓其生成逐字稿。
- 在等待期間,向 Claude 提供五到六段該人物經過核實的音頻片段或逐字稿。
- 要求 Claude 進行語義分析,並對主題、語言模式、語法使用、風格和語調進行分類。
- 然後上傳你不信任的音頻逐字稿,要求 Claude 對比分析其中的異常之處。
第五類:時序與語境邏輯——當 AI 忽視全局

一張 AI 生成的圖像,聲稱是一則關於巴黎氣候抗議的新聞廣播靜幀。圖:Henk van Ess
原理: AI 基於視覺模式生成內容,卻並不理解現實世界的語境、時間邏輯或情境適宜性。這就導致生成的內容在孤立狀態下看起來令人信服,但經不起常識的推敲。
伊朗監獄視頻騙局: 一段製作精良的 AI 生成視頻聲稱展示了以色列導彈襲擊伊朗埃溫監獄(Evin Prison)的畫面,但實際上是基於2023年的一張照片生成的。關鍵的檢測線索包括季節不匹配(所謂的夏季畫面中灌木叢卻沒有葉子)、違反概率的完美細節匹配,以及不可能的時間線。
30秒危險信號檢查: AI 能創造出視覺上令人信服的內容,但往往忽略了時間、地點和環境之間的基本邏輯關係。在突發新聞場景中,相信你對世界的常識,以此發現那些本需複雜分析才能證實的“不可能性”。
- 季節/天氣合理性檢查 — 植被、衣着或光照是否符合聲稱的日期和地點?
- 技術時間線掃描 — 是否出現了任何不屬於該時間段的設備、車輛或基礎設施?
- 地理直覺檢查 — 建築、標牌和景觀是否符合聲稱的地點?
- 來源可信度快速評估 — 內容的來源是否與其複雜程度和獲取難度相符?
五分鐘技術核實(適用於常規報道): 這種更深入的分析利用你的研究技能,將聲稱的內容與可核實的事實進行交叉引用。AI 難以處理現實世界事件之間相互關聯的本質,生成的內容或許能通過視覺檢查,但在與外部數據源對比時,往往無法通過邏輯審查。
- 歷史天氣核實 — 查閱聲稱日期/地點的歷史天氣數據,與畫面中的可見條件進行對比。
- 建築地標交叉引用 — 核實可見的建築物、標誌和基礎設施是否確實存在於聲稱的地點。
- 文化元素審計 — 確認服裝風格、行為舉止和社會動態是否符合地理/文化背景。
- 時間線概率評估 — 研究聲稱的事件在邏輯上是否可能同時發生。
- 來源模式分析 — 繪製內容傳播路徑,並與類似事件的典型傳播模式進行對比。
- 多角度搜索 — 尋找來自獨立來源的同一事件的其他記錄。
深度調查(適用於高風險報道): 對於關鍵報道,將語境線索視為法醫拼圖中的碎片,每一塊都需要針對既定事實進行系統性核實。這種綜合方法基於多個邏輯不一致點建立概率矩陣,而不是依賴單一的確鑿證據點。
- 綜合時間線重建 — 建立聲稱事件的詳細時間表,並交叉引用所有視覺元素。
- 地理情報核實 — 利用衛星圖像、街景和本地專業知識確認地點細節。
- 季節/環境取證 — 就環境條件諮詢植物學專家、氣象學家和當地消息人士。
- 文化真實性評估 — 採訪區域專家,了解內容中可見的行為規範、着裝規範和社會習俗。
- 技術時代錯亂分析 — 核實所有可見的設備、車輛、基礎設施是否在聲稱的時間和地點存在。
- 來源鏈調查 — 追蹤完整的傳播歷史,並與類似的真實事件模式進行比較。
- 專家諮詢網絡 — 諮詢熟悉聲稱地點或情況的當地記者、學者和官員。
- 概率矩陣構建 — 對每個邏輯元素進行評分,並構建內容真實性的綜合評估。
第六類:行為模式識別——當 AI 搞不懂人類

AI-generatred image purporting to show protesters marching in a city street. Image: Henk van Ess 一張 AI 生成的圖像,聲稱顯示抗議者在城市街道上遊行。圖片來源:Henk van Ess
原理: AI 可以複製人類的外貌,但在模擬真實的人類行為、社會動力學和自然的互動模式方面卻很吃力。這會在人群場景、群體動態和個人行為中產生可檢測的不一致性,訓練有素的觀察者可以發現這些破綻。
30秒危險信號檢查(適用於突發新聞): AI 創造的人群乍一看很逼真,但不自然的某些行為模式暴露了其虛假性。在突發新聞情況下,關注人們的表現是否像在特定情況下的真實人類,而不是遵循程序化行為的數字演員。
- 人群統一性掃描 — 是否有太多人年齡、外貌或着裝風格相似?
- 注意力模式檢查 — 所有人看向同一方向或鏡頭,還是注意力存在自然的變化?
- 情感真實度直覺檢查 — 面部表情是否符合事件聲稱的情緒和強度?
- 動作真實性評估 — 是自然的人際間隔和肢體語言,還是人工排布的位置?
五分鐘技術核實(適用於常規報道): 這種分析利用你對人類社會動力學的理解,識別 AI 在複製真實群體行為方面的缺陷。真實的人群表現出複雜的社會模式,而 AI 訓練數據無法完全捕捉這些模式,導致在所謂的自發集會中出現可檢測的人工統一性。
- 人口統計多樣性審計 — 統計年齡範圍、服裝風格、種族代表性,對比人工統一性。
- 社會互動映射 — 識別真實的對話、關係和群體動態,對比擺拍式站位。
- 環境反應驗證 — 人們對天氣、光線、噪音水平的反應是否恰當?
- 文化行為交叉檢查 — 社會規範、個人空間和互動風格是否符合聲稱的背景?
- 個人表情分析 — 尋找獨特的面部表情和真實的情感,對比統一或通用的反應。
- 動作模式評估 — 是否存在自然的不對稱和個人怪癖,對比人工平滑的動作?
深度調查(適用於重磅報道): 對於重磅報道,將人類行為視為人類學證據,需要對社會模式進行系統分析。這種綜合方法審查複雜的人際互動網絡是否真的可能在所聲稱的情況下發生。
- 社會學人群分析 — 諮詢人群心理學專家,驗證針對聲稱事件類型的現實群體動態。
- 文化真實性核實 — 採訪區域專家,了解適當的社會行為、着裝規範和互動模式。
- 人口統計概率評估 — 研究人群構成是否符合類似事件的典型參與模式。
- 個人行為取證 — 分析特定人員是否具有連貫的個性、關係和真實的情感反應。
- 環境適應研究 — 驗證人群對天氣、聲學和後勤的反應是否符合現實世界的模式。
- 歷史比對研究 — 與同一地區或文化背景下類似真實事件的經核實錄像或照片進行比較。
- 專家諮詢網絡 — 諮詢熟悉區域社會動態的人類學家、社會學家和當地記者。
- 微表情分析 — 諮詢專家檢查面部表情,區分真實的情感反應與人工生成。
- 社交網絡映射 — 追蹤個人之間的關係,以驗證群體形成的真實性,對比人工組裝。
第七類:直覺模式識別——古老的檢測系統

一張 AI 生成的圖像,聲稱顯示白俄羅斯總統在一次正式會議上不協調地拿着一筒薯條。圖片來源:Henk van Ess
原理: 我們的大腦經過數百萬年的進化,形成了模式識別能力。AI 的模式來自訓練數據和算法過程。當某些東西違反了人類感知中內置的自然預期時,這種直覺往往是技術分析之前最快、最可靠的初步檢測器。
現實世界的成功案例: 2019年,社交媒體用戶立即標記了一張在佛羅倫薩颶風期間瘋傳的“街頭鯊魚”圖片。雖然技術上處理得當,但觀眾覺得它在這種情況下顯得不對勁。他們的直覺是正確的——反向搜索揭示了這是數字植入。同樣,經驗豐富的記者能感知到業餘錄像看起來可疑地像電影大片,或者所謂的自發事件卻擁有完美的記錄。
有趣的事實:看來這種所謂在颶風中遭遇鯊魚的事件已經傳了十多年了,但只有一個例子得到了證實。
30秒危險信號檢查: 在時間緊迫時,請相信你進化形成的模式識別能力。尋找“製作質量悖論”,即業餘來源製作出好萊塢級別的內容,或“時間便利性”,即混亂事件被完美記錄。你那古老的檢測系統通常能在技術分析確認之前發現這些違和之處。
- 第一印象反應 — 這感覺是真實的還是“製作出來的”?(相信你對人類的人工表現產生的不安感,也被稱為“恐怖谷”效應。)
- 製作成本悖論 — 業餘來源是否與電影級的質量相符(現在8美元就能製造出專業外觀的政治醜聞)?
- 時間便利性檢查 — 對事件的完美記錄是否發生得太快,超出了正常拍攝的可能?
- 情感操縱測試 — 內容是否旨在引發情感反應和快速分享,而不是為了告知讀者?
五分鐘技術核實(適用於常規報道): 通過檢查觸發你模式識別能力的具體元素,將直覺感受轉化為系統性核實。當你的直覺告訴你有些不對勁時,找出具體是什麼違反了自然預期,以此建立邏輯論證。
- 語境邏輯深度檢查 — 鑒於現實世界的知識,該場景在實踐中是否有意義?
- 來源可信度調查 — 來源是否與內容的複雜程度和獲取要求相匹配?
- 敘事便利性分析 — 故事是否與當前的政治或社會緊張局勢過於完美地吻合?
- 技術不一致性審計 — 質量、光線或音頻是否符合聲稱的情況?
- 模式違規目錄 — 記錄觸發可疑感覺或語境不可能性的具體元素。
- 來源-內容不匹配評估 — 標記那些來自業餘或匿名來源且沒有解釋的複雜內容。
深度調查(適用於重磅報道): 對於關鍵報道,將直覺檢測作為全面核實的起點。你的模式識別發現了異常;現在系統地檢查每個引發懷疑的元素,以建立基於證據的評估。
- 直覺取證 — 記錄每一個感覺“不對勁”的元素,並研究為什麼每個元素都違反了自然預期。
- 製作悖論調查 — 計算所需的實際資源,並與業餘者的假設能力進行比較。
- 語境不可能性分析 — 將場景與現實世界的知識以及專家諮詢的見解進行映射對比。
- 情感操縱評估 — 分析內容結構,區分設計好的病毒式觸發點與有機的信息分享。
- 技術不一致性深度挖掘 — 逐幀分析質量、光線和音頻的不匹配。
- 來源真實性核實 — 調查聲稱的來源是否真的可能製作出此內容。
- 敘事工程檢測 — 檢查故事構建是為了人工便利還是自然事件發展。
- 模式違規專家諮詢 — 邀請經驗豐富的調查員進行獨立的直覺評估。
- 信任閾值分析 — 記錄當多個元素顯得“不對勁”時的情況,並以此為依據拒絕內容,哪怕其技術上看起來合格。
什麼時候該相信你的直覺:
- 即使你無法識別具體問題,但多個元素感覺“不對勁”時。
- 當內容引發立即的情感反應,旨在阻止分析時。
- 如果來源、時間或語境引發邏輯問題。
- 當技術質量與製作人的經驗水平不匹配時。
- 如果你的大腦檢測到了你在實驗中演示的那種製作質量悖論或時間便利性。
現實:沒有完美的解決方案
最重要的事: 這七大 AI 檢測類別和新工具——解剖學破綻、物理違規、技術指紋、語音偽影、語境邏輯、行為模式和直覺識別——為記者提供了一個全面的工具包,以便在截稿壓力下評估內容的真實性。結合專業檢測工具和更新的編輯標準,我們可以保持可信度。以毒攻毒。用 AI 來檢測 AI。並幫助維護我們僅存的共享現實。
出生於荷蘭的亨克·范·埃斯(Henk van Ess)正致力於穿透 AI 的迷霧,從數據中發掘故事。他將這一理念應用於調查研究,並開發了 SearchWhisperer 和 AI Researcher 等供公眾使用的工具。作為華盛頓郵報、施普林格出版社(Axel Springer)、BBC 和 DPG 等全球新聞編輯室的培訓師,他運營着 Digital Digging 網站,將開源情報與 AI 相結合。他還擔任波因特學院國際事實核查網絡(IFCN)和歐洲事實核查標準網絡(EFCSN)的評估員。