大數據AI透視美總統選情 樣本數量超民調 關鍵在掃清雜訊
原文刊於信報財經新聞「StartupBeat創科鬥室」

Beehive Strategy創辦人郭嘉俊稱,大數據分析準確度理應高於傳統民調。(黃勁璋攝)
美國總統大選進入最後倒數,在本周二(3日)投票日決勝,本港處於中美角力風眼,令今屆大選格外受港人關注。過去每屆美國大選,傳媒或大學研究機構均會透過民意調查,預測哪位候選人較有可能入主白宮。近年人工智能(AI)技術普及,有科企從網上蒐集大數據,冀以科學、客觀方法分析選情。
回顧4年前的美國大選,民調顯示民主黨的希拉莉(Hillary Clinton)將會勝出。然而,由印度科企Genic.ai研發的人工智能系統MogIA力排眾議,預測共和黨的特朗普才是王者。結果希拉莉大熱倒灶,令全球一地眼鏡碎,也讓MogIA一夜成名。
MogIA未回應今屆預測
MogIA早於2004年起便預測美國大選結果,據報準確度達100%。本報記者曾透過電郵向Genic.ai創辦人Sanjiv Rai查詢今次大選預測結果,惟對方並無正面回應,僅稱MogIA只是公司的附帶項目。
本地大數據分析公司Beehive Strategy創辦人郭嘉俊指出,民調與選戰結果出現差異時有發生,皆因民意調查往往並非實名制,受訪民眾可按不同考慮,選擇如實回答或不講真話。民調機構亦無法考證民眾的回覆到底是真心說話抑或刻意撒謊誤導民調結果。

不少搖擺州份容許提早投票,對大選結果將有關鍵作用。(路透資料圖片)
如今世界已步入大數據年代,本身是Digital Analytics Association國際認可網絡分析師的郭嘉俊認為,相比起傳統民調,大數據分析的樣本數(Sample Size)較多,加上被受訪民眾刻意誤導的風險較低,分析的準確度理應較高。
「不少公司都想以大數據預測選情,藉以展示公司的分析能力,其實各種分析都有漏洞。」郭嘉俊坦言,自己過往通常是在區議會、立法會選舉過後才會透過大數據分析,檢視民主、建制兩大陣營的競選策略、選民投票取態等,務求檢討日後選舉的投票策略,「選前預測或外國選舉就比較少做,因為做選前預測,蒐集得來的數據有很多Noise(雜訊),例如一些專為左右選舉而開設的社交賬戶。」
熱門搜尋不代表支持者
今次美國大選格外受港人關注,難怪香港亦有科企依照網民在谷歌(Google)搜尋器的搜索關鍵詞,推算今屆大選結果。所謂「口裏說不,身體卻很誠實」,以網民搜尋紀錄分析選情本身並無不可,「你搜尋什麼,某程度上反映了你的潛意識,但要注意的是,網民搜尋某個候選人不代表他就一定會去投票給那個人。熱門搜尋更多是反映人們普遍對什麼東西感興趣。」
郭嘉俊舉例,美國民主黨總統候選人拜登不時被指說話不清楚,甚至曾把對手共和黨的特朗普誤稱為前總統喬治布殊;上月拜登次子亨特(Hunter Biden)爆出「電郵門」事件,被指與中國、烏克蘭關係密切,更流出其性愛影片,網民紛紛搜尋相關消息及片段,「多人搜尋拜登,不代表拜登的支持度會提高。」

郭嘉俊提到:「假如你身邊朋友大多支持A候選人,但你支持的卻是B,你可能選擇當沉默的一群,或口頭附和朋友的立場,避免引起衝突。」(黃勁璋攝)

美國總統大選進入最後倒數,在本周二(3日)投票日決勝。(路透資料圖片)
社交網資料難反映輿情
全美50州當中,很多均容許選民提早投票。據立場親共和黨的霍士新聞(Fox News)報道,自從10月25日亨特流出性愛影片後,「Can I Change My Vote?」在谷歌的搜索量急升近5倍,至於尋求連任的特朗普亦在個人Twitter發文,聲言選民是希望改投他一票。
值得留意的是,相關搜索不少來自賓夕法尼亞、 佛羅里達、明尼蘇達和亞利桑那這些搖擺州份,惟今屆總統大選9個搖擺州份中,既設有提早投票選項,又允許選民更改投票的,就只有明尼蘇達州,這個州去屆被希拉莉成功拿下。
郭嘉俊提到,分析機構通常因應網民在社交媒體,針對選舉以至候選人的發言加以分析,從而推測候選人的支持度。他強調分析關鍵在於數據來源是否廣泛、分析模式是否全面,有很多細節需要注意。例如需要長時間追蹤網民動態,既要揪出專為選舉造勢的新賬戶,同時避免把單一網民的多個社交賬戶,視之為多名不同網民。
他亦提醒,不同年齡層的人士慣用的社交平台各有不同,相關分析要涵蓋多個平台。此外,並非人人都會在社交平台分享政見,「假如你身邊朋友大多支持A候選人,但你支持的卻是B,你可能選擇當沉默的一群,或口頭附和朋友的立場,避免引起衝突。」況且,很多人會隱藏敏感的帖文,甚至把個人社交賬戶設為「不公開」,從Twitter及Facebook蒐集的公開數據未必足以反映真實輿情。

全美50州當中,很多均容許選民提早投票。(路透資料圖片)

分析機構通常因應網民在社交媒體,針對選舉以至候選人的發言加以分析,從而推測候選人的支持度。(路透資料圖片)
採訪、撰文:陳子健
延伸閱讀:
fb提升私隱設定 更難蒐數據
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
禁用AI|高盛禁虛擬面試期間用AI
高盛使用的視像面試平台HireVue,透過人工智能(AI)評估人才,以各種行為問題揭示求職者技能。高盛校園招募團隊據報最近發送一封電郵,提醒歐洲、中東及非洲地區的私人投資學院學生,要注意高盛HireVue面試的要求,包括閱讀該銀行的財務業績,並熟知其商業原則及核心價值,但禁止在面試過程中使用任何外部資源,包括ChatGPT或谷歌搜尋引擎。
- Posted June 16, 2025
- 0
-
中國自主研發AI晶片之路(方保僑)
中國科技企業在人工智能(AI)晶片領域的自主研發,近年來成為國內外關注的焦點。
- Posted June 16, 2025
- 0
-
懶人福音|星形藥丸持續一周釋放效力
對不少慢性病患者而言,往往忘記每天定時服藥,最終導致症狀惡化、病情復發及須住院治療。美國麻省理工學院衍生公司Lyndra Therapeutics開發一種藥丸,只須每星期服用一次,就能在胃內逐漸釋放藥力。
- Posted June 16, 2025
- 0
-
古籍訓練AI|哈佛逾3.8億頁文獻供AI訓練
美國廣播公司新聞(ABC News)報道,除了波士頓公共圖書館計劃外,即將開放收藏的大量舊報及政府文件,美國哈佛大學近日向AI研究人員開放館內藏書,包括近百萬本早在十五世紀出版的書籍,涵蓋254種語言。
- Posted June 16, 2025
- 0
-
AI智能交通|推進智能交通 不離數碼基建
國際汽車及航空工程師學會香港分會前任主席潘志健接受本報專訪時指出,AI可支援城市規劃、交通流量預測與模擬,例如模擬隧道封閉對人流與車流的影響,提前調動巴士等資源,讓政府更有前瞻地部署危機應變策略。
- Posted June 16, 2025
- 0
-
LexisNexis|AI法律助理攻港 助撰合約處理案例 全用本地內容訓練 附連結方便核實
律商聯訊(LexisNexis)是長年法律界主要資料與研究平台供應商,其新一代人工智能(AI)平台Lexis+ AI,內含專為法律工作流程設計的個人化助理Protégé,即將在下月正式登陸香港,成為亞洲首個上線地區。
- Posted June 16, 2025
- 0
-
小心漫遊數據「隱形兇手」(林國誠)
不少人即使已選購數據漫遊計劃,卻忽略了一個經常被低估的事項──手機作業系統在用戶不察覺的情況下,於背景自動使用大量數據,導致數據流量無聲無息地消耗掉,影響漫遊上網體驗。
- Posted June 13, 2025
- 0