開源AI創造經濟價值(車品覺)
本文作者車品覺,為香港科技園有限公司董事、香港大學中國商學院客座副教授、阿里雲資深顧問,為《信報》撰寫專欄「全民大數據」。
早前Meta發布最新的開源大型語言模型Llama 3.1系列,這系列模型包括8B、70B和405B三種參數規模。其中405B參數規模的模型,在多項基準測試表現出色,超越了OpenAI的GPT-4o,並可媲美其他領先的閉源模型,例如Claude 3.5 Sonnet。Meta創辦人朱克伯格表示,Llama 3.1版本是行業的一個轉折點,預示着開源人工智能(AI)將成為未來主流。

在此次發布中,Llama 3.1版本的模型不僅在規模上有所擴展,還增加了上下文窗口的大小,從原來的8K增至128K,擴大了15倍,同時支援8種語言。尤其是405B模型,使用了超過15萬億個Tokens訓練,期間採用了1.6萬顆H100 GPU(繪圖處理器),是首個能達到如此規模的模型。評估了超過150個基準數據集後,Llama 3.1 405B模型在常識推理、操作性、數學等任務的表現,可比擬GPT-4、GPT-4o和Claude 3.5 Sonnet。同時,規模較小的8B和70B模型表現,與其他同等規模的開源和閉源模型不遑多讓。
在實際場景應用中,Llama 3.1 405B模型的整體性能,優於GPT-4o及Claude 3.5 Sonnet。Meta還更新了開源許可,允許開發者使用Llama模型(包括405B)的輸出以改進其他模型。儘管目前圖像、影片及語音整合功能還在開發,並未正式發布,但Meta指未來版本會整合這些功能。

筆者非常認同,開源AI能夠促進創新、降低成本和提高安全性。開發者亦可以利用開源模型來訓練、微調自己的模型,以滿足不同需求。
此外,開源模型的使用成本更低,效率更高,特別在運行推理任務時,成本約為封閉模型的一半,這使開發者能在自己的基礎設施上操作,加強數據安全。
開源AI代表着世界上最大的經濟契機和安全保障,也可以創造更大的經濟價值和更高的全球安全水平。至今為止,所有版本的Llama模型已超過3億次下載量,其廣泛受歡迎的程度和影響力已不言而喻。至於開源與閉源大模型之爭,其實也取決於數據開放程度和算力效率等。
(編者按:車品覺著作《覺悟.大數據》現已發售)
歡迎訂購:實體書、電子書
更多車品覺文章:
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
善用提詞 學懂「用圖思考」(黃岳永)
生成式人工智能(GenAI)圖像工具快速發展,對習慣「看圖思考」的人士而言,絕對是一個福音。
- Posted December 16, 2025
- 0
-
織物喇叭|日本織布變身無線喇叭
日本茨城縣科企Sensia早前宣布,成功研發旗下織物喇叭Fabric Speaker的攜帶型版本(圖),實現小型無線化、便攜性與更高安全性,讓它能夠像流動裝置一樣,外攜或捲起使用,暫時未有售價及上市時間。
- Posted December 16, 2025
- 0
-
多層晶片|美研新型晶片 增效至少4倍
美國史丹福大學、卡內基美隆大學、賓夕法尼亞大學與麻省理工學院的工程師,與美國本土半導體晶圓代工廠SkyWater Technology合作,開發出一款新型的多層電腦晶片原型。
- Posted December 16, 2025
- 0
-
OpenAI薪酬制度|傳取消按員工年資贈股
《華爾街日報》報道,ChatGPT開發商OpenAI有傳近日調整員工薪酬制度,完全取消新入職員工股權「歸屬懸崖期」(Vesting Cliff)的限制。
- Posted December 16, 2025
- 0
-
本地科研成果|科大腦神經訓練 提升SEN童專注
香港科技大學團隊昨發布一項研究,發現非入侵式「腦神經反饋」(Neurofeedback)訓練,能顯著改善SEN兒童在專注力、情緒控制、壓力管理及睡眠質素等表現。
- Posted December 16, 2025
- 0
-
硬件性能到頂|GPU性能瀕極限 恐難達AGI
艾倫研究所的科學家、美國卡尼基美隆大學助教德特默斯最近一篇網誌寫道,GPU效能正迅速接近極限,不足以實現AGI,直指大部分討論都停留在哲學層面。
- Posted December 16, 2025
- 0
-
微軟蘇萊曼|AI記者將面世 盼實現超智能 診斷疾病成本更低
微軟人工智能(Microsoft AI)行政總裁蘇萊曼(Mustafa Suleyman)近日接受彭博專訪,提到流行關鍵字「超級智能」(Superintelligence),這種AI能在所有任務上,表現超越全人類總和。
- Posted December 16, 2025
- 0











