You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

人類資訊保育|新網站收藏「前AI時代」資料

By on June 20, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech

自從人工智能(AI)模型流行,由機器生成的內容在網上泛濫,包括文字、圖像及影片,甚至波及人類的原創作品。美國網絡安全公司Cloudflare前高層John Graham-Cumming於是建立網站,公開徵集2022年之前,未受ChatGPT及AI「污染」的資料。網站列出幾個主要館藏,包括2022年8月的維基百科數據轉儲、古騰堡計劃的公共領域書籍收藏、美國國會圖書館照片檔案,以及GitHub的北極代碼庫

網站公開徵集2022年之前,未受ChatGPT及AI污染的資料。(網上圖片)

由美網安專家發起徵集

John Graham-Cumming解釋網站名稱lowbackgroundsteel.ai背後的典故,原來源自冷戰時期一個科學現象。據說在1945年開始核武試驗後,全球大氣被放射性同位素(如鈷-60)污染,令後來生產的鋼鐵自帶微弱的放射性。幾十年來,科學家為製作精密儀器,千方百計尋找無輻射金屬,甚至從戰前沉船打撈鋼材,所得到的珍貴鋼材稱為「低背景鋼」(Low-background Steel)。

事實在人類資訊及文化遺產方面,過去一直有多個保育項目,例如早於1971年的古騰堡計劃,以至1996年成立的互聯網檔案館Internet Archive,較近期的例子則有2017年始動的北極世界檔案館(AWA)

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們