開源AI創造經濟價值(車品覺)
本文作者車品覺,為香港科技園有限公司董事、香港大學中國商學院客座副教授、阿里雲資深顧問,為《信報》撰寫專欄「全民大數據」。
早前Meta發布最新的開源大型語言模型Llama 3.1系列,這系列模型包括8B、70B和405B三種參數規模。其中405B參數規模的模型,在多項基準測試表現出色,超越了OpenAI的GPT-4o,並可媲美其他領先的閉源模型,例如Claude 3.5 Sonnet。Meta創辦人朱克伯格表示,Llama 3.1版本是行業的一個轉折點,預示着開源人工智能(AI)將成為未來主流。

在此次發布中,Llama 3.1版本的模型不僅在規模上有所擴展,還增加了上下文窗口的大小,從原來的8K增至128K,擴大了15倍,同時支援8種語言。尤其是405B模型,使用了超過15萬億個Tokens訓練,期間採用了1.6萬顆H100 GPU(繪圖處理器),是首個能達到如此規模的模型。評估了超過150個基準數據集後,Llama 3.1 405B模型在常識推理、操作性、數學等任務的表現,可比擬GPT-4、GPT-4o和Claude 3.5 Sonnet。同時,規模較小的8B和70B模型表現,與其他同等規模的開源和閉源模型不遑多讓。
在實際場景應用中,Llama 3.1 405B模型的整體性能,優於GPT-4o及Claude 3.5 Sonnet。Meta還更新了開源許可,允許開發者使用Llama模型(包括405B)的輸出以改進其他模型。儘管目前圖像、影片及語音整合功能還在開發,並未正式發布,但Meta指未來版本會整合這些功能。

筆者非常認同,開源AI能夠促進創新、降低成本和提高安全性。開發者亦可以利用開源模型來訓練、微調自己的模型,以滿足不同需求。
此外,開源模型的使用成本更低,效率更高,特別在運行推理任務時,成本約為封閉模型的一半,這使開發者能在自己的基礎設施上操作,加強數據安全。
開源AI代表着世界上最大的經濟契機和安全保障,也可以創造更大的經濟價值和更高的全球安全水平。至今為止,所有版本的Llama模型已超過3億次下載量,其廣泛受歡迎的程度和影響力已不言而喻。至於開源與閉源大模型之爭,其實也取決於數據開放程度和算力效率等。
(編者按:車品覺著作《覺悟.大數據》現已發售)
歡迎訂購:實體書、電子書
更多車品覺文章:
支持EJ Tech


Related Posts
Latest News
-
打擊網騙 促進智慧城市發展(方保僑)
香港特區政府展開2025年《施政報告》公眾諮詢,誠邀市民就多個政策範疇提出意見,其中打擊騙案及推動資訊科技業界發展,尤為社會關注。
- Posted June 23, 2025
- 0
-
大模型耗電|14開源大模型 DeepSeek最耗電
對人工智能(AI)而言,更密集的運算過程,會消耗更多能源,產生更多溫室氣體。
- Posted June 23, 2025
- 0
-
工作趨勢報告|AI代辦瑣碎任務 紓員工壓力
微軟(Microsoft)近日發表「工作趨勢指數特別報告」,顯示上班一族面對大量訊息及會議,無法有效集中專注力,近半人感覺混亂且碎片化,即使下班仍未能鬆懈。
- Posted June 23, 2025
- 0
-
ChatGPT新功能|增錄音功能 長達2小時
ChatGPT開發商OpenAI推出「錄音模式」(Record Mode),讓用戶直接在應用程式內錄製會議或語音筆記,現時在英語環境下效果最佳。
- Posted June 23, 2025
- 0
-
谷歌死機事故|雲端服務中斷 敲響企業警鐘
科企谷歌(Google)雲端服務在本月中,全球服務一度中斷約6小時。不少提供或使用人工智能(AI)服務的企業,均表示受事故影響。
- Posted June 23, 2025
- 0
-
香港教育城|冀當超級貨架 推動AI學習 加強基建支援 融入日常教學
本報專訪香港教育城行政總監林峯,探討香港推動AI教育的現況、挑戰與前景。他認為AI教育在香港已全面起步,大部分學校都引入相關課程及工具,未來則需要加強基建資源支援,推動AI全面融入日常教學。
- Posted June 23, 2025
- 0
-
城大啟動HK Tech 300國際創新創業千萬大賽 促進創新與國際化協同發展
香港城市大學(城大)於上月23日宣布啟動「HK Tech 300國際創新創業千萬大賽」(HK Tech 300國際大賽),進一步將HK Tech 300計劃的影響力擴展至世界各地。今次大賽將與來自九個國家及城市的11間大學、五間當地商會和初創培育機構合作,多國大學校長及代表當日應邀來港出席典禮,並希望可通過城大的科研及初創生態圈,協助當地初創落地香港,甚至拓展至內地及整個亞洲市場。
- Posted June 20, 2025
- 0