You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

程式挑戰賽|Konwinski Prize比賽 奪冠僅答對7.5%

By on July 25, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech

坊間存在大量人工智能(AI)編碼工具,但其解難能力一直有待驗證,非牟利組織勞德研究所(Laude Institute)特別建立了一個「真正困難」的基準測試,更列出一個無污染的排行榜,為AI軟件工程師設定新標準。

Konwinski Prize只限開放或開源的AI模型參加,驗證它解決GitHub程式設計問題的能力。(K Prize網上圖片)

Databricks及Perplexity聯合創辦人康溫斯基(Andy Konwinski)近日舉行一項多輪AI程式設計挑戰賽Konwinski Prize(K Prize),首位獲獎者是一位巴西提詞工程師Eduardo Rocha de Andrade,他將獲得獎金5萬美元(約39萬港元)。更令人驚訝是他的最終得分,僅答對7.5%題目就贏得比賽。

K Prize只限開源模型參加

與著名的評估數據集SWE-Bench類似,Konwinski Prize只限開放或開源的AI模型參加,基於代碼託管平台GitHub標記的問題,以驗證它處理實際程式設計問題的能力。康溫斯基承諾,向首位能夠在測試得分超過90%的開源模型,提供100萬美元(約780萬港元)獎金。

康溫斯基(右二)舉行AI程式設計挑戰賽,更開出100萬美元(約780萬港元)獎金。(X網上圖片)

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們