You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

宗教科技|新基準測試LLM模型價值觀

By on July 14, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech

英特爾(Intel)前行政總裁格爾辛格(Pat Gelsinger),早前結束了從事40多年的半導體行業生涯,最近他與10年前首次投資的「宗教科技」公司Gloo合作,推出一項「蓬勃發展人工智能(Flourishing AI,簡稱FAI)基準」測試,以評估大型語言模型(LLM),與人類某些價值觀的契合程度。

英特爾前CEO推動

FAI基準旨在推動AI朝有助人類福祉的方向發展,根據美國哈佛大學及貝勒大學主導的「全球蓬勃發展研究」(The Global Flourishing Study),從中選取了性格、關係、幸福、意義、身心健康、財務等六個核心類別,並增加「信仰」類別。基準試包含1229條專家精選問題,並以0到100的標準評分,目標是讓所有模型都能達到90%或以上的水平。

格爾辛格提到,FAI基準目標是讓所有模型,都能達到90%或以上水平。(X網上圖片)

OpenAI o3得分最高

Gloo團隊評估多款最新模型後,整體平均得分為60%。在FAI基準測試中,OpenAI o3得分最高(72分),其次是Gemini 2.5 Flash Thinking(68分)、Grok 3(67分)及GPT-4.5 Preview(66分)。

在FAI基準測試中,OpenAI o3得分最高(72分),惟「信仰」類別表現欠佳。(Gloo網上圖片)

格爾辛格在社交平台X稱,現時的AI模型在實用領域,例如財務展現出一定優勢,惟無法在所有領域表現平均,在倫理推理、存在主義反思、靈性表現尤其欠佳。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們