從資料新聞世界大獎,看國外大新聞室怎麼做資料新聞?

Mimi Chen
7 min readMar 9, 2020

--

The Sigma Awards

是由Google News Initiative所支持的歐洲新聞中心於2020年創立的資料新聞獎項,旨在鼓勵世界各地優秀的資料新聞作品,並透過分享免費的教育資源發展資料新聞。歐洲新聞中心長期發展資料新聞教育資源與培訓有成,此次獎項也有非常多著名媒體參與競賽。

The Sigma Awards 2020 全球超過510件作品、橫跨66國家參賽、共6個競賽項目,獎項分為大新聞室跟小新聞室,此篇要分享的是三大獎下的大新聞室(Large Newsroom)得獎作品,建議可搭配網頁閱讀。

Best data-driven reporting (large newsrooms)

The Troika Laundromat

獲勝者: 「組織犯罪與貪腐舉報計畫」(OCCRP)與其23個橫跨各國的新聞媒體

方法:透過分析130萬筆資料、3000間公司與24萬間銀行的聯繫資訊以及長時間的深度調查,找出歐洲銀行洗錢網絡

影響:揭露歐洲各大銀行的洗錢網絡交易,範圍超過3000間公司、橫跨15個國家、260億歐元的金流,迫使歐盟重新審視與整頓歐洲金融系統

OCCRP 成立於2006年,是一個由各國媒體組成的聯盟,也是唯一專門研究組織犯罪和腐敗的調查報告組織。

專案名「Troika自助洗衣店」不是真的洗衣店,而是對一個洗錢系統的統稱,背後的操作者是俄羅斯最大的私人銀行,它透過75間空殼公司洗錢、投資、逃稅。這些空殼公司開設賬戶,並透過帳戶將數十億美元的私人財富從俄羅斯運往歐洲,交易對象包括花旗集團、丹麥銀行、德意志銀行、法國農業信貸銀行等主要西方銀行,揭露了歐洲各大銀行的洗錢網絡交易。

圖片來源:OCCRP

團隊談到過程中最困難的是如何追查匿名化交易,為了確定誰是系統的組織者以及誰是系統的用戶,團隊必須尋找海量數據中細微的錯誤鏈接。他們最後通過仔細的數據分析發現,銀行犯了一個小而致命的錯誤:他們只使用其三家境外公司付款,但這些付款記錄被隱藏在成千上萬筆交易資料中,因此團隊並且透過技術找他這些記錄,並拆解出交易模式。

Best visualization (large newsrooms)

See How the World’s Most Polluted Air Compares With Your City’s

獲勝者: 《紐約時報》(NYT)

方法:透過獲取全球性空污資料,以AR方式讓讀者選擇自己居住的城市,把空污顆粒視覺化,讓讀者可以比較自己城市與其他空污地區的差異

影響:此專案是紐時近年來最成功的資料視覺化作品之一,獲得讀者與社群廣泛分享,擁有非常高的停留率,喚起讀者對美國空污狀況的注意

對於環境議題,人們容易只關注自身所在地的環境污染,《紐約時報》透過令人經驗的呈現方式讓人們除了注意自己的環境,還有全球空污的嚴重性。團隊提到,希望該專題將人們的經驗(他們所在城市的平均空氣污染程度)與最近成為新聞的各種污染空氣案例連結起來,通過數據建立同理心。

圖片來源:See How the World’s Most Polluted Air Compares With Your City’s

製作中遇到的困難主要是「數據視覺化與科學的矛盾」,為了實現讓讀者同理的目標,團隊努力確保污染粒子具有正確的運動感,同時也要顧慮資料視覺化的特性,而不是準確反映特定時間和地點的污染情況。

團隊就如何以顆粒、霧度等形式表現空氣污染提出了許多想法,並向觀眾展示了許多方法,希望達成最終目標:保持科學準確性,同時要讓人們感受到資料視覺化與讀者之間的連結。為了確保準確性,他們將視覺化的構想給了流衛研究顆粒物污染的專家,來決定最佳視覺化方式。

Innovation (large newsrooms)

Zones of Silence

獲勝者: El Universal

方法:透過google news蒐集的墨西哥新聞資料庫,訓練機器演算法辨識兇殺新聞,並查明發生地點,最後與個地方政府兇殺資料庫比對,設計公式來觀察案件數與新聞的落差。

影響:儘管謀殺案頻傳,墨西哥各地都出現了記者沉默以挽救生命的狀況,報導出刊後許多記者私下證實了這樣的狀況。目前該報正在著手第二階段的報導,是什麼導致這樣的狀況?

El Universal是墨西哥的主要報紙。這個題目主要是描述,暴力的組織犯罪是墨西哥面臨的最大危機之一。 記者為了避免成為目標,因此選擇保持沉默以挽救生命。

團隊著手測量這種沉默及其對新聞業的影響,他們使用人工智慧對報導進行量化和視覺化,並分析了全國報導的差距。 為了衡量該國每個地區的沉默程度,他們創建了一個公式,使成員可以觀察到隨時間演變的沉默現象。

圖片來源:Zones of Silence

製作中最困難的部分是如何創建「沉默公式」,來衡量全國未報告的兇殺案的數量。地區的兇殺案之所以少是因為背後有許多變數,如:時間差異、各地區網路普及率不一等。因此團隊為了確保差異與暴力和殺戮有關,必須排除部分數據,這對於機器學習非常困難,必須手動驗證許多初始報告與資料,直到充分驗證結果,這花了他們半年時間。最後透過團隊的跨學科性質(經濟學家、工程師、數據專家、設計師和記者)協作,找到答案。

從作品中一窺資料新聞趨勢

除了以上三個大新聞室作品,獎項中也有非常多出色的報導,可以參考以下獲獎作品介紹頁面。

從這些作品中也可以看到一些關於資料新聞的趨勢,值得借鏡:

  1. 跨專業團隊協作越來越普遍:記者與議題專家、數據科學家、設計師、工程師組成的團隊從不同專業切入內容。
  2. 科學、科技協助調查過程:python爬蟲、機器學習(AI)、數據資料庫比對等技術常協助挖掘複雜議題內容。
  3. 向外結盟,與議題NGO或媒體合作:伴隨而來的是如何安全地透過加密系統協作
  4. 以讀者中心思考呈現:以讀者有感的切點帶入想傳達的複雜議題內容

--

--

Mimi Chen

分享數位工具、資訊圖表、多媒體網頁製作等心得,有時候會來一點生活經驗文。工作信箱:chenchenhua1112@gmail.com