Don't Miss
程式挑戰賽|Konwinski Prize比賽 奪冠僅答對7.5%
By 信報財經新聞 on July 25, 2025
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
坊間存在大量人工智能(AI)編碼工具,但其解難能力一直有待驗證,非牟利組織勞德研究所(Laude Institute)特別建立了一個「真正困難」的基準測試,更列出一個無污染的排行榜,為AI軟件工程師設定新標準。
Databricks及Perplexity聯合創辦人康溫斯基(Andy Konwinski)近日舉行一項多輪AI程式設計挑戰賽Konwinski Prize(K Prize),首位獲獎者是一位巴西提詞工程師Eduardo Rocha de Andrade,他將獲得獎金5萬美元(約39萬港元)。更令人驚訝是他的最終得分,僅答對7.5%題目就贏得比賽。
K Prize只限開源模型參加
與著名的評估數據集SWE-Bench類似,Konwinski Prize只限開放或開源的AI模型參加,基於代碼託管平台GitHub標記的問題,以驗證它處理實際程式設計問題的能力。康溫斯基承諾,向首位能夠在測試得分超過90%的開源模型,提供100萬美元(約780萬港元)獎金。
支持EJ Tech

