人類贏AI|10小時編程馬拉松 人類憑創意贏AI 前員工戰勝OpenAI模型 獲阿爾特曼讚好
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
在東京舉行的2025年AtCoder世界巡迴賽總決賽(AWTF 2025 Heuristic),被視為「決定世界最強選手」的賽事,只邀請過去一年表現最好的12名頂尖程式員參加,今次更首次請來人工智能(AI)選手競逐。結果波蘭程式設計員德比亞克(Przemysław Dębiak)奪冠,OpenAI定制的AI模型(編號為OpenAIAHC)屈居第二,仍擊敗日本、格魯吉亞及法國等選手。
德比亞克比賽時採啟發方式
現年41歲的德比亞克(綽號Psyho),亦是美國AI科企OpenAI前員工,這場長達600分鐘(即10小時)的編程馬拉松,他必須編寫一個程式,引導機械人盡量少的步數,穿過一個30乘30的網格。德比亞克強調沒借助AI工具,只是使用軟件開發平台Visual Studio Code,特別採用創新啟發式方法,使用解決問題的捷徑及有根據的猜測,而並非暴力計算。
最終比賽結果顯示,德比亞克得分為1.8萬億分,OpenAI模型為1.65萬億分,前者以9.5%優勢保住勝利,最終贏得獎金50萬日圓(約2.64萬港元)。德比亞克在社交平台X(前稱Twitter)高呼:「人類勝利了(至少目前是這樣!)我累壞了。估計過去3天只睡了10個小時,現在都快撐不住了。」OpenAI行政總裁阿爾特曼(Sam Altman)也在X大讚德比亞克:「幹得好psyho」。
德比亞克向外媒Business Insider透露,比賽前一周才知道OpenAI參賽,「沒人知道這某種程度上,將是一場人類與AI之間的表演賽。」他認為,AI實施演算法、解決問題、優化程式碼,因為它的速度更快,將在需要直接工程的案例獲勝。不過在較長的比賽中,程式設計師「從頭開始做所有事情」,AI要跟上就很困難。
編程是OpenAI、Anthropic、Google、Meta等聊天機械人最常見用途之一,GitHub Copilot及Cursor等已成為許多專業開發人員的標準工具。美國史丹福大學《2025年人工智能指數報告》顯示,在衡量編程能力的基準測試SWE-bench,AI系統在2023年只能解決4.4%的編程問題,這一數字在2024年已躍升至71.7%。
AI模型國際數學賽奪金
談到AI模型在AWTF的表現,OpenAI認為這是競技編程的里程碑,「像o3這樣的模型已進入編程及數學比賽的前100名,但據我們所知,這是首次在頂級編程數學賽獲得前三名。」歷史上,AI在部分賽事曾擊敗人類,例如1997年,國際商業機器(IBM)的超級電腦「深藍」,戰勝國際象棋冠軍卡斯帕羅夫;時至2016年,Google DeepMind旗下AlphaGo,擊敗南韓圍棋世界冠軍李世乭。
值得留意的是,OpenAI一個未發布的實驗模型,近日在「國際數學奧林匹克」(IMO)比賽奪金,AI在6條難題解答了5題,在總分42分獲得35分。IMO要求各國派出最多6名學生,解答極為困難的代數及微積分預備題。這些練習看似簡單,惟要一定創造力才能取得最高分。在今年比賽中,630名參賽者之中,只有67人獲得金牌,比例約佔一成。
支持EJ Tech


Related Posts
Latest News
-
AI修復銘文|DeepMind演算法修復拉丁銘文
古羅馬人留下大量拉丁銘文,從政治塗鴉、情詩、墓誌銘,到商業文件、生日邀請函及「魔法咒語」等。不過,這些文字通常殘缺不全、風化嚴重或被故意損毀,要重建這些缺少的碎片非常艱巨,需要上下文線索幫助。
- Posted July 25, 2025
- 0
-
程式挑戰賽|Konwinski Prize比賽 奪冠僅答對7.5%
坊間存在大量人工智能(AI)編碼工具,但其解難能力一直有待驗證,非牟利組織勞德研究所(Laude Institute)特別建立了一個「真正困難」的基準測試,更列出一個無污染的排行榜,為AI軟件工程師設定新標準。
- Posted July 25, 2025
- 0
-
宇多田光訪談|認為AI寫歌缺情感
日本知名音樂創作人宇多田光,與《人類大歷史》作者、以色列歷史學家哈拉瑞,近日於英國佛洛伊德博物館進行一場跨界對談,內容圍繞AI對於人類創作、情感連結,以及未來角色的衝擊。
- Posted July 25, 2025
- 0
-
互聯網業界倡議|「無感通關」促進交流 iProA:規劃北都智能總部 聚集巨企加快建設
最新一份《施政報告》將在今年9月發表,互聯網專業協會(iProA)昨舉辦傳媒午宴,除了介紹下半年重點科創活動,亦向政府提出多項期望。
- Posted July 25, 2025
- 0
-
都大啟動「天使基金」培育首五間初創公司 各獲高達100萬港元支持業務發展
香港都會大學(都大)第三屆「創業日」於7月18日舉行,吸引逾200名來自初創培育機構代表、業界翹楚、校友和師生參與,就創新創業展開交流。活動重點是「都大初創基金」轄下「天使基金計劃」的啟動儀式,首批五間具發展潛力的初創公司,分別獲投資最高達100萬港元,推動其業務發展;同場亦頒發本年度「薈創點」創業比賽的優勝結果。一眾獲選項目不僅展現了學生與校友的創新精神,同時亦反映都大在支援及培養創業人才的努力成果。
- Posted July 25, 2025
- 0
-
AI護老 擁抱長者心靈健康(湛家揚博士)
回饋所知,貢獻社會,永遠都是有意義的事。最近,我有幸與3位人工智能(AI)專家,一同為長者安居協會提供諮詢與建議。
- Posted July 24, 2025
- 0
-
搜尋引擎大變革?|谷歌洽20媒體授權取用新聞
美國人工智能(AI)科企OpenAI在過去幾年,分別與赫斯特國際集團(Hearst Corporation)、康泰納仕(Condé Nast)、Vox Media、《大西洋月刊》等主要新聞媒體達成協議,所錄得的38宗交易涉資超過3億美元。
- Posted July 24, 2025
- 0