Don't Miss

程式挑戰賽｜Konwinski Prize比賽奪冠僅答對7.5%

By 信報財經新聞 on July 25, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech」

坊間存在大量人工智能（AI）編碼工具，但其解難能力一直有待驗證，非牟利組織勞德研究所（Laude Institute）特別建立了一個「真正困難」的基準測試，更列出一個無污染的排行榜，為AI軟件工程師設定新標準。

Konwinski Prize只限開放或開源的AI模型參加，驗證它解決GitHub程式設計問題的能力。（K Prize網上圖片）

Databricks及Perplexity聯合創辦人康溫斯基（Andy Konwinski）近日舉行一項多輪AI程式設計挑戰賽Konwinski Prize（K Prize），首位獲獎者是一位巴西提詞工程師Eduardo Rocha de Andrade，他將獲得獎金5萬美元（約39萬港元）。更令人驚訝是他的最終得分，僅答對7.5%題目就贏得比賽。

K Prize只限開源模型參加

與著名的評估數據集SWE-Bench類似，Konwinski Prize只限開放或開源的AI模型參加，基於代碼託管平台GitHub標記的問題，以驗證它處理實際程式設計問題的能力。康溫斯基承諾，向首位能夠在測試得分超過90%的開源模型，提供100萬美元（約780萬港元）獎金。

康溫斯基（右二）舉行AI程式設計挑戰賽，更開出100萬美元（約780萬港元）獎金。（X網上圖片）

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI Konwinski Prize Laude Institute

Tweet

Pin It

Related Posts

OpenAI政策文件｜OpenAI倡4天工作共享AI紅利

OpenAI政策文件｜OpenAI倡4天工作共享AI紅利

Claude Mythos｜突破沙盒安全防線

Claude Mythos｜突破沙盒安全防線

華人長壽之謎｜科大5年研究圖揭華人長壽奧秘招募500名九旬長者抽血AI分析

華人長壽之謎｜科大5年研究圖揭華人長壽奧秘招募500名九旬長者抽血AI分析

Generalist AI系統｜機械人大腦GEN-1自學能手

Generalist AI系統｜機械人大腦GEN-1自學能手

Latest News

金融業必須掌握「主權AI」（陳漢偉博士）
中國以驚人速度擁抱人工智能代理（AI Agent）OpenClaw，截至今年3月，全球近四成的OpenClaw相關資產集中於中國。

Posted April 9, 2026

0

皮采訪談｜谷歌自爆GPT原型「難產」原由
Alphabet行政總裁皮采透露，指Google內部早在2022年前後，構思過類似ChatGPT的GenAI聊天產品LaMDA，但由於當時仍缺乏完整的安全把關，結果未有推出市場。

Posted April 9, 2026

0

OpenAI政策文件｜OpenAI倡4天工作共享AI紅利
ChatGPT開發商OpenAI近日發布政策文件《智能時代的產業政策》，探討在邁向「通用人工智能」（AGI）的轉型過程，如何透過新的產業政策確保「以人為本」宗旨。

Posted April 9, 2026

0

Hermeus｜國防初創Hermeus晉身「獨角獸」
美國國防初創Hermeus近日獲得C輪融資3.5億美元（約27.3億港元），目標是開發無人高超音速戰鬥機，最終目標是速度達到5馬赫（即音速5倍）。

Posted April 9, 2026

0

Claude Mythos｜突破沙盒安全防線
Anthropic近日開發Claude Mythos Preview，但由於這款AI模型功能太強，測試期間曾突破安全防線，更找出各大主流系統與網頁瀏覽器的數千個高風險漏洞，Anthropic決定暫停向公眾推廣模型。

Posted April 9, 2026

0

華人長壽之謎｜科大5年研究圖揭華人長壽奧秘招募500名九旬長者抽血AI分析
香港連續10年蟬聯全球最長壽地區，本地90歲或以上的長者人數在2021年突破10萬。據政府統計數據，本港2024年男性出生時平均預期壽命是83歲，女性更達88歲。

Posted April 9, 2026

0

本地科研動態｜港大研骨科植入物塗層速殺菌
植入物相關感染是骨科手術的一大挑戰，一旦細菌於植入物表面形成生物膜，通常難以清除，往往會引致持續發炎，令植入物未能固定，最終造成鬆脫甚至失效。

Posted April 8, 2026

0

POPULAR POSTS

本地科研動態｜港大研骨科植入物塗層速殺菌

 Splunk｜企業部署AI 應先制定資料策略網安商Splunk提醒釐清數據擁有權

 Seedance 2.0｜港用戶可試玩7天

 谷歌Gemma 4｜手機離線都能用

 Meta吸人才｜年薪500萬聘AI副總裁

 AI腦疲勞｜修正AI結果費時員工嘆「加辛」

皮采訪談｜谷歌自爆GPT原型「難產」原由

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

程式挑戰賽｜Konwinski Prize比賽 奪冠僅答對7.5%

K Prize只限開源模型參加

支持EJ Tech

Related Posts

Latest News

POPULAR POSTS

成為 EJ Tech 會員

程式挑戰賽｜Konwinski Prize比賽奪冠僅答對7.5%