在極權政府掌控的資訊環境中,資訊不僅不公開透明,各種內容都會被審查,甚至遭刪除,這嚴重影響歷史檔案的保存與資訊傳遞,但在這20多年間,陸續有專門保存檔案的民間機構成立,投入公開、傳播資料的行動。
《中國數字時代》(China Digital Times,CDT)是2003年在美國成立的中英文新聞資訊網站,其中有個「404文庫」項目,專門保存在中國網路上遭封鎖或刪除的文章。
「(保存檔案)困難不在於技術,在於怎麼樣去判斷,什麼樣的(資料)需要(保存)」,CDT創辦人蕭強提到,現在有許多技術可保存檔案,像是區塊鏈(Blockchain),更易存檔,還不能修改,但這是藉由區塊鏈技術特性,並非有標準查核流程,所以要用區塊鏈技術存檔,必須要有鑑定方案,這關係到人的信譽。
香港行動文獻庫(Hong Kong Action Archives,HKAA)執行長Sam同樣對區塊鏈有疑問,雖然區塊鏈的好處是能對抗審查,因為放上去的內容會永久存放在那邊,但當提供物品的原物主可能之後有困擾,就會面臨無法撤下資料的情況。HKAA是在台灣的香港人於2025年4月成立的組織,保存1960年代以來,香港大小社會運動中的物品和文件。
同樣在2025年4月成立的香港問責檔案庫(Hong Kong Accountability Archive,HK Archive)專門保存2019年「反送中」(反修例)運動中,警察執法情況的影像資料。對於是否會用區塊鏈保存檔案,該組織回道:「我們當前優先要務是確保目前平台的可持續性,以及擴大可提供給使用者的內容。」
檔案存放區塊鏈有雙面影響
2019年創立的台灣新創科技公司「主張數據」(Numbers Protocol),則是藉由區塊鏈技術,強化數位資產的安全性和透明度,並開發數位內容註冊工具「Capture」。該公司共同創辦人嚴世紀(Sofia Yan)說,自己不是媒體人,所以把Capture當成存證工具,因為就算現在手機拍照會自動帶入詮釋資料(元數據,Metadata),但仍能修改,Capture則不同。
Capture有電腦版本的Capture Dashboard、手機應用程式(App)的Capture Cam,以及開發者工具Capture SDK,透過這些系統上傳、拍攝的影像都會放在區塊鏈,並擁有細節資料,確保影像真實性及可信度,同時保障這些影像資產,且影像獲得的「數位身分證」符合內容來源與真實性聯盟(C2PA)及ERC7053標準,其為讓數位內容擁有可信足跡的以太坊(Ethereum)標準。以太坊是去中心化、開源的區塊鏈平台。
嚴世紀提到,任何人想用Capture上傳的影像,要取得原作者的授權。她也說,媒體公司與自由接案的攝影記者、公民記者合作時,這也有助於查證他們提供的影像;傳統媒體則可藉此活化自己的資料庫。
此外,Numbers Protocol曾與史達林實驗室(Starling Lab)合作,向國際刑事法院(ICC)提交加密影像,作為控訴俄羅斯在烏克蘭犯下戰爭罪行的證據。史達林研究室是在美國的學術研究機構,由史丹佛大學電機工程學系(Stanford EE)與南加州大學浩劫基金會(USC Shoah Foundation)共同創立,旨在把歷史學者、法律專家及新聞工作者帶入Web3新世紀。
有助問責警察執法、AI生成訓練
談到保存檔案,嚴世紀直言,「我覺得很重要」,這如同史書讓人們了解過去的歷史,另個重要之處是生成式人工智慧(AI)需要模型訓練,而這些訓練資料都是人類所生產,「如果這些沒被存檔起來,就是我們在網上的所有這些遺跡的話,怎麼去產生新的模型?」
嚴世紀告訴《田間》,Numbers Protocol有個「Numbers Archive」計畫,收錄年度大事件的影像資料,涵蓋選舉和大型社會運動,但版權仍屬原作者所有。HKAA與HK Archive保存的檔案中,同樣有版權是屬於原作者或提供者。
Sam表示,HKAA期許成為民間典藏機構,雖然各國都有學術單位願意保存檔案,但民間自主蒐集和保存,會希望有一天能帶回香港展示。她提到,HKAA的短期目標是先建立歸檔系統,這在籌備階段就有進行,且是參照國際檔案理事會(ICA)制定的《國際檔案描述通用標準》(ISAD(G))來建檔;中期目標則是在2026年推出線上博物館,放上約2000件保存的檔案資料;公開所有保存物品則是長期目標。
HK Archive的短期目標與HKAA相同,都是先把收到大量影像分類歸檔,這是相當耗時的程序,同時檢視回饋,讓網站變得更好使用。HK Archive坦言,當前香港政治局勢為建檔帶來諸多挑戰,大部分涉及安全議題,因為在《香港國安法》實施後,原本提供檔案的人擔心遭到香港政府和香港警務處(HKPF)報復。
HK Archive強調,其成立目的就是向在2019年和平集會中,迫害權利的人究責,並進行獨立調查,只有這樣才能提升HKPF對集會人群的執法行為,以及政府如何回應香港人民的渴望及人權。
「2019年集會的相關影片是HKPF當時執法的重要證據,保存且能公開取得它們(影片)是究責過程的重要一部分。它們也是歷史紀錄的一部分,能促進獨立分析,這對反制不實資訊很重要。」HK Archive表示。
「瘋傳」內容易遭審查
至於404文庫,現於美國加州大學柏克萊分校任職的蕭強告訴《田間》,最初CDT團隊是追蹤中國部落格上的文章,但當中國入口網站公司「新浪」(Sina)2009年推出「微博」(Weibo)後,資訊變得很龐大,而自己和學生主要研究公共輿論,一開始並非關注被審查的內容,只是發現原本關注的內容常被刪除,之後就開始保存這些資訊。他表示,CDT藉由演算法來抓取文章,有些不一定有被刪除。
隨著社群平台愈來愈多,CDT要存取的檔案自然也更多,但有什麼標準?蕭強回道,CDT做的是監督中國審查者的行動,而大多數被刪除的內容都是審查者認為「瘋傳」(go viral)且引起共鳴的內容,「如果不是迅速傳播的話,審查者很可能也沒注意到」。
蕭強說,儘管中國審查系統能刪除文章,但網友會轉發到其他社群平台,一定有足跡找到原本被刪掉的內容,也有人是透過通訊軟體群組投稿遭刪除的內容。這麼多的資訊要如何篩選?他表示,CDT的編輯會以嚴格新聞倫理標準把關,「我們選擇的標準是為了讓它們(資料)比較嚴謹、有價值,有歷史保存價值,也有讀者看的價值」。
蕭強指出,每天「翻牆」上網的中國人次是以百萬,甚至千萬計,而先前在社群平台做的問卷調查發現,不少35歲以下的讀者是在中國境內「翻牆」來看CDT網站。不過他提到,現在有些虛擬私人網路(VPN)安全無保障,資料會交給政府,就算能用Google網站,也無法看到所有資訊。
談到媒體刪除報導的標準,蕭強直言,威權時代的政府對媒體有一系列做法,不單是標準,還有政策、法規、措施、人員、機構去控制媒體,包括威脅到直接的暴力行為,「中國大陸的情況實際上比台灣當年的國民黨威權時代有過之而無不及,今天也這樣,它會審查是因實際上是威權、極權政府,特別擔心資訊自由和活躍會影響他們的政權,包括執政各方面的政治」。
事實查核、建立信任是存檔基礎
「在中國極權政府的資訊生態下,真實的聲明和真相是對審查的最大傷害」,蕭強強調,網路在這方面發揮作用,而CDT保存這些真相。不過他也提到,網路中有大量混淆、故意扭曲真相的資訊,言論自由、媒體自由的環境下更容易放大這些問題,今日的人工智慧(AI)技術也增加這方面的可能性,「更加不易知道什麼是真實的」。
蕭強認為,保存真實的有價值資料本身並不困難,因為「網際網路檔案館」(Internet Archive)網站就提供存檔服務,重點在於眾人參與傳播真相,而新聞記者的工作本身就要求對事實有更嚴謹的查核。
「愈多的人參與,愈多人有這些良知和意識,並且加以訓練,所謂加以訓練就是你自己不斷地實踐,你有這個良知你會知道,誰在那說謊、誰在那欺騙、誰在那說真話,說真話在壓力下是有代價的,都是能夠看得出來的。」蕭強說道。
Sam認為,如何溝通、建立信任,讓更多報導出現,是新聞記者要面對的課題,「尤其在香港現在這個狀況,就是人與世界的信任越來越低的時候,我們要怎麼把這個信任再建立起來,我覺得這個是對記者非常重要的」。