You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

醫療影像大賽連勝兩場 港AI癌症診斷技壓全球

By on January 2, 2019

原文刊於信報財經新聞專欄「StartupBeat創科鬥室

郭俊豪(左)本來任職於銀行IT部門,三年多前開始接觸Python,跟身邊的馮振華(右)成為朋友。(何澤攝)

郭俊豪(左)本來任職於銀行IT部門,三年多前開始接觸Python,跟身邊的馮振華(右)成為朋友。(何澤攝)

國際級醫療影像分析大賽「ICIAR 2018 Grand Challenge on Breast Cancer Histology images」(BACH),出現了港人身影。IT人郭俊豪以高階程式語言Python,用作訓練機器深度學習(Deep Learning),從全球超過50隊參賽隊伍脫穎而出,於比賽兩部分均成功奪得第一名。

BACH是2018年夏天於葡萄牙舉行的「International Conference on Image Analysis and Recognition」的前奏,比賽歷時數個月。參加者須在第一部分比賽編寫程式,利用400張分屬正常細胞、良性腫瘤、原位癌,或已發展成入侵性癌的顯微鏡影像作Training Data,進行深度學習,其後再辨識100張額外的顯微鏡影像(亦即是Testing Data),看看程式的準確度。

IT人受親友病逝啟發

郭俊豪在這第一部分,先以87%準確度(Accuracy),跟另一個印度參賽隊伍成為雙冠軍。至於第二部分比賽,參加者須進一步分析全切片影像(Whole Slide Imaging, WSI),把有問題的部分分類(Classify)出來。經複雜算式計算分數後,郭俊豪在第二部分比賽亦以0.69分高踞榜首。

據悉比賽的參加者大部分都跟他一樣,專長於電腦科學,沒太多醫療背景。郭俊豪形容,「看着那些顯微鏡影像,都不知為何這一張是(癌細胞),那一張不是。要看很多背景資料,了解一下病理學家如何分辨。不過,自己基本上都是從影像分析角度出發來做這研究。」

郭俊豪表示,此前已參加過好幾個醫療科技比賽,當中涉及肺癌電腦斷層掃描(CT)分析、子宮頸癌分析、乳癌擴散等等,例如要從數百個病人的肺部CT影像找出結節(Nodule),並估算結節一年後變成癌症的機會。他透露,自從有親人因癌症離世後,便經常思考一個問題:作為IT人,假如想在癌症相關研究參與其中,到底可以貢獻什麼。

用Python編程潛力巨大

不過,投身IT行業十多年的他,無論是打工抑或創業,均未嘗涉足醫療科技,反而大部分時間在銀行的IT部門打滾,主力負責編寫外滙交易系統,其中JAVA是他最常接觸的程式語言。直至3年多前,他開始接觸另一種熱門程式語言Python,「當時公司有分享會,同事講述自己在台灣參加PyCon(Python Conference)的經歷。」

郭俊豪坦言AI是要輔助醫生找出病人潛在風險,最終確診病人有病與否、決定治療方案等仍是醫生。(何澤攝)

郭俊豪坦言AI是要輔助醫生找出病人潛在風險,最終確診病人有病與否、決定治療方案等仍是醫生。(何澤攝)

與此同時,開源香港(Open Source Hong Kong)會長馮振華在2015年,把專門探討和推廣Python程式語言的PyCon引入香港,兩人便在PyCon HK結緣。

在2018年11月於數碼港舉行的PyCon HK 2018,郭俊豪更擔任講者之一。他透露,現時很多開發者,均以Python訓練模型。馮振華補充指出,Python的語言字眼,跟英文有點相似,相對容易上手,加上Python的軟件庫有不少套件(Package)可供取用,「很方便開發者編程來做他們想做的事」。

商業化需時 先開源供取用

發掘到深感興趣的科技範疇,加上已在銀行IT部門工作十多年,郭俊豪開始思考新發展方向。2018年夏天,他跟3名拍檔一同開設科技公司世閣(SEBit),主打立體視覺技術,包括虛擬實境(VR)、擴增實境(AR)、建築資訊模型(BIM)以及人工智能(AI)。客戶有建築公司及政府部門,參與項目如試行以AI分析街燈毛病。

對郭俊豪而言,朝向AI癌症診斷發展本是他的更大心願,惟暫未遇到合適拍檔,例如醫生。他解釋,香港醫學界一般是憑肉眼,直接透過顯微鏡觀察切片影像,「好處是快,畢竟要將切片影像數碼化需一定時間;而且(用傳統顯微鏡和肉眼)可以從細胞厚度等,找出一些額外的資訊。」故他認為,以AI診斷癌症病理的技術,在香港暫時仍有待商業化。未來會好好整理自己的研究,在GitHub等平台開源,讓其他有興趣人士取用。

輔助醫生 減輕人手負擔

綜合幾次參加國際性AI醫療科技大賽的經驗,郭俊豪認為,AI有時會出現Overfit(過度訓練)的情況,即是Hypothesis(假設)過度貼近Training Data。當要辨識之前未接觸過的Testing Data時,準確度即會打折扣,未必可預測到真實結果。

如此一來,AI要正式在醫學上廣泛應用、用作診斷病人,豈非遙遙無期?郭俊豪直言「咁講只啱一半」,坦言AI是要輔助醫生找出病人潛在風險,最終確診病人有病與否、決定治療方案等仍是醫生,「很多位可以幫輕人手,但不是取代。」

採訪、撰文:陳子健

支持EJ Tech



如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們