開源AI創造經濟價值(車品覺)
本文作者車品覺,為香港科技園有限公司董事、香港大學中國商學院客座副教授、阿里雲資深顧問,為《信報》撰寫專欄「全民大數據」。
早前Meta發布最新的開源大型語言模型Llama 3.1系列,這系列模型包括8B、70B和405B三種參數規模。其中405B參數規模的模型,在多項基準測試表現出色,超越了OpenAI的GPT-4o,並可媲美其他領先的閉源模型,例如Claude 3.5 Sonnet。Meta創辦人朱克伯格表示,Llama 3.1版本是行業的一個轉折點,預示着開源人工智能(AI)將成為未來主流。

在此次發布中,Llama 3.1版本的模型不僅在規模上有所擴展,還增加了上下文窗口的大小,從原來的8K增至128K,擴大了15倍,同時支援8種語言。尤其是405B模型,使用了超過15萬億個Tokens訓練,期間採用了1.6萬顆H100 GPU(繪圖處理器),是首個能達到如此規模的模型。評估了超過150個基準數據集後,Llama 3.1 405B模型在常識推理、操作性、數學等任務的表現,可比擬GPT-4、GPT-4o和Claude 3.5 Sonnet。同時,規模較小的8B和70B模型表現,與其他同等規模的開源和閉源模型不遑多讓。
在實際場景應用中,Llama 3.1 405B模型的整體性能,優於GPT-4o及Claude 3.5 Sonnet。Meta還更新了開源許可,允許開發者使用Llama模型(包括405B)的輸出以改進其他模型。儘管目前圖像、影片及語音整合功能還在開發,並未正式發布,但Meta指未來版本會整合這些功能。

筆者非常認同,開源AI能夠促進創新、降低成本和提高安全性。開發者亦可以利用開源模型來訓練、微調自己的模型,以滿足不同需求。
此外,開源模型的使用成本更低,效率更高,特別在運行推理任務時,成本約為封閉模型的一半,這使開發者能在自己的基礎設施上操作,加強數據安全。
開源AI代表着世界上最大的經濟契機和安全保障,也可以創造更大的經濟價值和更高的全球安全水平。至今為止,所有版本的Llama模型已超過3億次下載量,其廣泛受歡迎的程度和影響力已不言而喻。至於開源與閉源大模型之爭,其實也取決於數據開放程度和算力效率等。
(編者按:車品覺著作《覺悟.大數據》現已發售)
歡迎訂購:實體書、電子書
更多車品覺文章:
支持EJ Tech


Related Posts
Latest News
-
禁用AI|高盛禁虛擬面試期間用AI
高盛使用的視像面試平台HireVue,透過人工智能(AI)評估人才,以各種行為問題揭示求職者技能。高盛校園招募團隊據報最近發送一封電郵,提醒歐洲、中東及非洲地區的私人投資學院學生,要注意高盛HireVue面試的要求,包括閱讀該銀行的財務業績,並熟知其商業原則及核心價值,但禁止在面試過程中使用任何外部資源,包括ChatGPT或谷歌搜尋引擎。
- Posted June 16, 2025
- 0
-
中國自主研發AI晶片之路(方保僑)
中國科技企業在人工智能(AI)晶片領域的自主研發,近年來成為國內外關注的焦點。
- Posted June 16, 2025
- 0
-
懶人福音|星形藥丸持續一周釋放效力
對不少慢性病患者而言,往往忘記每天定時服藥,最終導致症狀惡化、病情復發及須住院治療。美國麻省理工學院衍生公司Lyndra Therapeutics開發一種藥丸,只須每星期服用一次,就能在胃內逐漸釋放藥力。
- Posted June 16, 2025
- 0
-
古籍訓練AI|哈佛逾3.8億頁文獻供AI訓練
美國廣播公司新聞(ABC News)報道,除了波士頓公共圖書館計劃外,即將開放收藏的大量舊報及政府文件,美國哈佛大學近日向AI研究人員開放館內藏書,包括近百萬本早在十五世紀出版的書籍,涵蓋254種語言。
- Posted June 16, 2025
- 0
-
AI智能交通|推進智能交通 不離數碼基建
國際汽車及航空工程師學會香港分會前任主席潘志健接受本報專訪時指出,AI可支援城市規劃、交通流量預測與模擬,例如模擬隧道封閉對人流與車流的影響,提前調動巴士等資源,讓政府更有前瞻地部署危機應變策略。
- Posted June 16, 2025
- 0
-
LexisNexis|AI法律助理攻港 助撰合約處理案例 全用本地內容訓練 附連結方便核實
律商聯訊(LexisNexis)是長年法律界主要資料與研究平台供應商,其新一代人工智能(AI)平台Lexis+ AI,內含專為法律工作流程設計的個人化助理Protégé,即將在下月正式登陸香港,成為亞洲首個上線地區。
- Posted June 16, 2025
- 0
-
小心漫遊數據「隱形兇手」(林國誠)
不少人即使已選購數據漫遊計劃,卻忽略了一個經常被低估的事項──手機作業系統在用戶不察覺的情況下,於背景自動使用大量數據,導致數據流量無聲無息地消耗掉,影響漫遊上網體驗。
- Posted June 13, 2025
- 0