智能代理編程戰 懂人機協作致勝(車品覺)
本文作者車品覺,為港交所獨立非執行董事、香港基因組中心董事、香港大學中國商業學院客座副教授,為《信報》撰寫專欄「全民大數據」。
上周把兩個消息放在一起看,很有意思。
第一個,Anthropic宣布Claude Code推出Artifacts,讓軟件工程師在寫程式的過程中,業務主管能同時打開網頁儀表板,就能看到軟件即時更新及開發的狀態。
第二個,中國人民大學和微軟亞洲研究院聯合推出一個叫Arbor開源自主人工智能體的新框架,系統能自動提出假設、修改代碼,運行真實實驗並從結果中學習,自動優化解決問題。
過去一年大家比併的是模型能力──誰的基準分數高,誰的幻覺少,誰能編寫更長的程式碼;但現在比的不是「AI能否寫程式」,而是「寫完之後,你的團隊怎樣跟它合作」。
Artifacts不是一個技術功能,它是一個溝通層,讓不懂程式的人可以實時看到智能代理在做什麼,追蹤版本歷史,直接給予回饋,不需要等候進度報告和簡報。他們自己用了一句話形容:「讓智能代理在沒有人類逐步介入的情況下,透過實驗回饋自主迭代優化。」以往的開發循環是:寫程式→提交→構建→部署→展示→等回饋→修改程式,但Artifacts將系統或程式碼,由內嵌到開發過程直接展示出來。
從管理角度看,公司買了AI工具但回報不明顯,未必是工具不好,而是技術和業務部門之間的資訊斷層沒有被打破。Artifacts解決的就是那個斷層,讓業務方看到智能代理正在做什麼,進度如何,而不是聽工程師說「快了快了」。
另一邊,Arbor的核心是讓智能代理從嘗試失敗中學習,而不是每次都從零開始反覆試錯。曾做過生產環境除錯的人會理解這個痛點:系統出問題,你根本不知道是哪一個改動真的修好了問題,因所有變數都糾纏在一起。但Arbor把這層糾纏面紗拆開,讓智能代理能追蹤「上次改動這個方向,結果是什麼。」
Anthropic選的是橫向(協作),Arbor背後的團隊選的是縱向(自我優化)。短期看Anthropic的用戶體驗更好,長期看Arbor這類技術會讓智能代理愈來愈不需要人類介入。如果你問我,應該選以上哪個人工智能工具,我給的答案從來不是工具名字,而是3個問題。
第一,你的樽頸是程式碼品質還是溝通?如果是工程師寫程式沒問題,但業務需求變來變去、改完又改,你需要的是協作工具(Anthropic這條路線)。如果是程式本身有很漏洞(Bug)、效能不佳,你需要的是優化工具(Arbor這條路線)。
第二,Artifacts讓非技術人員可以看到活生生的開發過程,這件事是好是壞,取決於你的工程師是否習慣被觀看。因不是每個開發者都願意把半成品放在儀表板上讓業務方看。
第三,我最想強調,真正影響回報的是,工具怎麼嵌入團隊的工作習慣。Anthropic Artifacts和Arbor的價值都不在模型,他們賣的是新的框架,「你的團隊工作方式會變得不一樣」。這場程式代理的戰爭才剛開始。最後贏的不會是最強模型,而是誰最懂團隊如何與人工智能協作。
(編者按:車品覺著作《覺悟.大數據》現已發售)
歡迎訂購:實體書、電子書
更多車品覺文章:
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
















