有美國新聞界最高榮譽之稱的普立茲獎(Pulitzer Prizes)5月5日公布得獎名單,在橫跨15個新聞類別的入圍與得獎者行列中,有四篇報導向評審團揭示了其應用人工智慧(AI)的情況,包括一篇獲獎報導與三篇入圍報導。
這是連續第二年,普立茲獎主辦方要求參賽者揭露在報導過程中是否使用了AI工具,並在突發新聞攝影與專題攝影類別,首次要求參賽者必須一併提交相機拍攝原始檔和已發表的照片。
和2024年情形相似,參賽報導所應用的AI工具大多並非生成式AI。製作這些報導的記者表示,他們採用的工具,主要是在ChatGPT與大型語言模型(LLMs)問世前便已存在的機器學習技術。
普立茲獎行政主管 Marjorie Miller 說:「我們認為負責任地使用AI,是現今新聞工作者日益多樣化工具箱中的重要環節。」她指出,獲獎報導中還運用了其他工具,例如統計分析、公開資料請求與影像鑑識。「適當使用AI技術,能為新聞增添靈活性、深度與嚴謹性,這在十年前是不可能做到的。」
整體而言,今年使用AI工具的新聞從業人員仍以調查記者為主。以下介紹這四篇報導及其應用AI工具的情形。
案例一:馬斯克(Elon Musk)政治立場轉變的視覺化分析
《華爾街日報》(WSJ)分析馬斯克自2019年以來在X上逾4萬1千條互動資料。他們以機器學習技術,將這份資料賦予數值、轉換為向量,並將向量視覺化呈現,包含相似關鍵字的貼文被聚集成群,以展示出馬斯克言論隨時間演變的趨勢。結果顯示,馬斯克從發布迷因的商業人物轉變成更常提及政治議題的政治人物。
參與該系列報導的記者 John West 說,這篇報導並未使用生成式AI工具,「這不是把資料餵給ChatGPT」。他們使用了文本與圖像嵌入模型來創建向量,得以捕捉包括迷因在內的語意,模型則來自Google軟體開發套件(SDK)。他說:「現在的影像嵌入模型非常強大,我們一年前根本無法做到這些。」
該報導是《華爾街日報》針對馬斯克政治影響力系列報導之一,使其團隊贏得2025年國家新聞獎項。
《華盛頓郵報》(The Washington Post)《四十英畝和一個謊言》系列報導深入挖掘美國財富的歷史秘密。該報記者將自由民局(Freedmen's Bureau)的180萬份手寫土地所有權文件數位化。由於資料數量龐大,記者 Pratheek Rebala 開發了影像辨識演算法,將團隊先前已識別出的土地所有權書與土地登記冊作為訓練資料,接著使用生成的模型搜尋整個自由民局的檔案庫。
「AI工具幫助我們擴大了專案範圍,並顯示『四十英畝和一頭騾子計畫』影響的人數比許多人意識到的要多,」雷巴拉說。
該報導以資料作為起點,確認了超過1000名在美國南北內戰後獲得土地、但在一年半內即被剝奪的前奴隸黑人男女,團隊找到幾位這些人的後代並做訪談。該項目入圍解釋性報導獎項。
《華盛頓郵報》的視覺取證團隊在一篇報導中,推翻以色列軍方對於空襲加薩、造成兩名半島電視台記者死亡的說法。以色列國防軍稱,空襲目標是一名「操作飛行器、對以軍構成威脅的恐怖分子」;報導團隊與地理空間AI公司Preligens合作,確認空襲當天,記者所在地點方圓十英里內沒有任何軍事車輛。這項結果與無人機影像一致,也佐證其他分析專家的判斷:當時當地並無任何即時威脅。
由於以色列禁止多數國際記者進入加薩,大型媒體的視覺調查團隊日益仰賴AI模型分析衛星影像,例如《紐約時報》曾透過分析加薩地區的彈坑分布,證實以色列軍方曾在標示為平民安全區的地點動用重型武器。《華盛頓郵報》這篇報導成為國際新聞獎項入圍作品之一,也成為遠距戰地調查報導的新典範。
《美聯社》(AP)在佛洛伊德(George Floyd)被警察壓頸致死後的隔年,即2022年,開始著手調查受到較少關注的致命執法:美國有多少人在沒有遭到槍擊的情況下,被執法人員壓制致死。最後確認了各地1000多起「致命執法」事件。
AP團隊與馬里蘭大學的霍華德調查新聞中心(Howard Center for Investigative Journalism)等單位合作,在三年調查期間內蒐集了超過20萬頁的數位檔案,涵蓋法院紀錄、警方報告、驗屍報告與死亡證明等,部分為手寫或品質不佳的掃描影像。此系列報導成為調查新聞獎項入圍作品之一。
霍華德調查新聞中心將機器學習與AI工具導入調查流程,例如光學字元辨識(OCR)技術成為資料處理的關鍵,像Amazon Textract這類工具不僅大幅提升文件可讀性,也加快了搜尋效率。霍華德中心資料編輯穆森登 Sean Mussenden 說,機器學習技術協助團隊統整超過1000起「致命壓制」案件的死因與方式,揭示驗屍官判定中存在的偏見與疏失。
Sean Mussenden還提到,團隊特別運用OpenAI的語音辨識模型Whisper,將數百小時的警用隨身攝影機錄音轉錄成文字,這些影片大多是透過公開資訊申請取得的。他強調,這些工具只是輔助記者掌握核心資訊的手段,所有資料都經過多層人工審查,「最關鍵的工作仍是人類記者親自閱讀與萃取文件內容。」
本文摘譯自 Andrew Deck 於5月22日發表在尼曼新聞實驗室(Nieman Lab)的《How this year’s Pulitzer awardees used AI in their reporting》。