人類贏AI|10小時編程馬拉松 人類憑創意贏AI 前員工戰勝OpenAI模型 獲阿爾特曼讚好
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
在東京舉行的2025年AtCoder世界巡迴賽總決賽(AWTF 2025 Heuristic),被視為「決定世界最強選手」的賽事,只邀請過去一年表現最好的12名頂尖程式員參加,今次更首次請來人工智能(AI)選手競逐。結果波蘭程式設計員德比亞克(Przemysław Dębiak)奪冠,OpenAI定制的AI模型(編號為OpenAIAHC)屈居第二,仍擊敗日本、格魯吉亞及法國等選手。
德比亞克比賽時採啟發方式
現年41歲的德比亞克(綽號Psyho),亦是美國AI科企OpenAI前員工,這場長達600分鐘(即10小時)的編程馬拉松,他必須編寫一個程式,引導機械人盡量少的步數,穿過一個30乘30的網格。德比亞克強調沒借助AI工具,只是使用軟件開發平台Visual Studio Code,特別採用創新啟發式方法,使用解決問題的捷徑及有根據的猜測,而並非暴力計算。
最終比賽結果顯示,德比亞克得分為1.8萬億分,OpenAI模型為1.65萬億分,前者以9.5%優勢保住勝利,最終贏得獎金50萬日圓(約2.64萬港元)。德比亞克在社交平台X(前稱Twitter)高呼:「人類勝利了(至少目前是這樣!)我累壞了。估計過去3天只睡了10個小時,現在都快撐不住了。」OpenAI行政總裁阿爾特曼(Sam Altman)也在X大讚德比亞克:「幹得好psyho」。
德比亞克向外媒Business Insider透露,比賽前一周才知道OpenAI參賽,「沒人知道這某種程度上,將是一場人類與AI之間的表演賽。」他認為,AI實施演算法、解決問題、優化程式碼,因為它的速度更快,將在需要直接工程的案例獲勝。不過在較長的比賽中,程式設計師「從頭開始做所有事情」,AI要跟上就很困難。
編程是OpenAI、Anthropic、Google、Meta等聊天機械人最常見用途之一,GitHub Copilot及Cursor等已成為許多專業開發人員的標準工具。美國史丹福大學《2025年人工智能指數報告》顯示,在衡量編程能力的基準測試SWE-bench,AI系統在2023年只能解決4.4%的編程問題,這一數字在2024年已躍升至71.7%。
AI模型國際數學賽奪金
談到AI模型在AWTF的表現,OpenAI認為這是競技編程的里程碑,「像o3這樣的模型已進入編程及數學比賽的前100名,但據我們所知,這是首次在頂級編程數學賽獲得前三名。」歷史上,AI在部分賽事曾擊敗人類,例如1997年,國際商業機器(IBM)的超級電腦「深藍」,戰勝國際象棋冠軍卡斯帕羅夫;時至2016年,Google DeepMind旗下AlphaGo,擊敗南韓圍棋世界冠軍李世乭。
值得留意的是,OpenAI一個未發布的實驗模型,近日在「國際數學奧林匹克」(IMO)比賽奪金,AI在6條難題解答了5題,在總分42分獲得35分。IMO要求各國派出最多6名學生,解答極為困難的代數及微積分預備題。這些練習看似簡單,惟要一定創造力才能取得最高分。在今年比賽中,630名參賽者之中,只有67人獲得金牌,比例約佔一成。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
MWC預示電訊業新時代轉折(林國誠)
西班牙巴塞隆拿的世界流動通訊大會(MWC)剛剛落幕。這場一年一度的電訊界盛會,是業界觀察技術走勢的「風向球」。筆者已連續數年親臨現場,為了解全球電訊界最新進展,每次除了跟不同廠商開會,預備全年的安排之外,也希望把香港的故事帶到國際舞台。
- Posted March 13, 2026
- 0
-
AI時代|Meta四款AI晶片 明年分批應市
Facebook母企Meta Platforms計劃兩年內推出4款MTIA晶片,將用於自家應用程式的生成式人工智能(GenAI)功能及內容排名系統,旨在實現硬件來源多元化,減少對外部晶片製造商的依賴,並在快速發展、成本高昂的AI競賽降低成本。
- Posted March 13, 2026
- 0
-
龍蝦熱潮|百度「龍蝦」手機App登陸安卓
人工智能(AI)代理OpenClaw(俗稱「龍蝦助手」)內地熱爆,百度(09888)智能雲在內地安卓(Android)市場,上線全球首款手機龍蝦應用「紅手指Operator」,蘋果iOS版本料3月內上線。
- Posted March 13, 2026
- 0
-
本地創科動態|港大AI提早15年預警心血管病
心血管疾病是全球頭號「健康殺手」,光是2022年便奪去約1980萬人的生命。香港大學李嘉誠醫學院藥理及藥劑學系的研究團隊,利用人工智能(AI)技術,研發心血管疾病風險預測框架CardiOmicScore。
- Posted March 13, 2026
- 0
-
本地創科動態|理大無創腦機接口 將展開臨床
香港理工大學旗下科研團隊,成功研發新一代「全聲學腦機接口系統」,運用經顱超聲神經調控技術(TFUS),在毋須開顱或植入電極的情況下,對深層腦區作高精度的神經調控,下一步將開展臨床研究,有望為柏金遜症、抑鬱症及其他腦部疾病帶來新治療方向。
- Posted March 13, 2026
- 0
-
阿里創賽雲集人財 促創新商業化
環球創業比賽JUMPSTARTER 2026昨在灣仔會展舉行總決賽,阿里巴巴香港創業者基金行政總裁兼NextGen Partners合夥人周駱美琪指出,創業角度有三大要素,分別是資金、基礎設施及人才。
- Posted March 13, 2026
- 0
-
由User friendly 到Agent friendly的時代(吳壽冠)
在過去的三十年裡,全球工程師與設計師們共同追求一個終極目標:User-friendly(使用者友善)。為了讓人類更直覺地與機器溝通,我們發明了圖形使用者介面(GUI)、觸控螢幕,以及無數優化使用者體驗(UX)的心理學法則。
- Posted March 12, 2026
- 0




















