You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

AI與數據治理良性循環(車品覺)

By on April 15, 2026

本文作者車品覺,為港交所獨立非執行董事、香港基因組中心董事、香港大學中國商業學院客座副教授,為《信報》撰寫專欄「全民大數據」

站在2026年回望,如果在10年前能更早意識到生成式人工智能(GenAI)的到來,我們會發現:企業迎接AI,最關鍵的不是使用某個大模型,而是重塑對數據與智能之間關係的理解。其中最重要的思維轉變,是從傳統的「數據優先」轉向「AI優先」,即是數據的採集、儲存與處理,每一個環節都應優先考慮現在及未來AI應用的需求。

沿着這個思路,有兩個在當時尚未被清晰定義,如今卻至關重要的概念值得深入探討。

一、運用AI技術強化數據治理

這是指利用AI技術(涵蓋機器學習、自然語言處理等)革新,並提升數據治理的流程,有效應對傳統治理模式中效率低、過度依賴人工干預的挑戰。其核心理念在於「實現智能化治理」。

傳統模式的痛點十分明顯:元數據管理依賴人工操作、數據質量檢測存在滯後性、數據分類分級耗時、安全識別規則缺乏靈活性等。

相比之下,AI提供的解決方案更是全方位:

智能剖析:自動完成數據血緣及數據字典的掃描與解析

主動監控:實時監測數據異常狀況,例如字段值突然變為空值

自動分類:智能識別數據類型(如身份證訊息、交易金額等)並自動添加標籤

動態安全:通過分析數據訪問行為模式,自動識別異常操作,例如非工作時間出現大量數據下載等異動

把治理工作中重複、繁瑣的部分交給AI,讓人可以專注於真正需要判斷力的環節。

二、為AI應用鞏固數據根基

這裏指向另一個維度:為確保AI應用的可靠性、合規性與可解釋性,而對AI所使用的數據(尤其是訓練數據)實施系統性治理。

當AI從實驗走向生產,突破了傳統數據治理的邊界。AI面臨三大新挑戰:數據偏見導致模型歧視、數據污染引發安全風險、私隱洩露帶來合規風險,這些問題需要專門的數據治理規則來應對:

數據來源管理:確保訓練數據獲得合法授權、具備代表性且不含有害內容

數據質量提升:通過清洗、去除重複與標註,降低噪聲與錯誤對模型的不良影響

風險控制機制:移除或匿名化處理敏感私隱訊息,注入符合倫理規範的約束條件

全鏈路追溯體系:記錄數據從原始狀態,到訓練應用的完整加工流程,實現全程審計與可解釋性

無論是藉助AI工具強化數據治理,還是為AI應用度身定造新的數據治理規範,二者相輔相成:先進的AI技術使數據治理更加高效,而完善的數據治理又為AI系統提供高質量、安全的數據支撐,從而構建良性循環。在這循環中,企業不僅能顯著提升數據處理效率與質量,還能強化對數據安全的掌控能力。

(編者按:車品覺著作《覺悟.大數據》現已發售)

歡迎訂購:實體書、電子書

更多車品覺文章:

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們