Don't Miss
宗教科技|新基準測試LLM模型價值觀
By 信報財經新聞 on July 14, 2025
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
英特爾(Intel)前行政總裁格爾辛格(Pat Gelsinger),早前結束了從事40多年的半導體行業生涯,最近他與10年前首次投資的「宗教科技」公司Gloo合作,推出一項「蓬勃發展人工智能(Flourishing AI,簡稱FAI)基準」測試,以評估大型語言模型(LLM),與人類某些價值觀的契合程度。
英特爾前CEO推動
FAI基準旨在推動AI朝有助人類福祉的方向發展,根據美國哈佛大學及貝勒大學主導的「全球蓬勃發展研究」(The Global Flourishing Study),從中選取了性格、關係、幸福、意義、身心健康、財務等六個核心類別,並增加「信仰」類別。基準試包含1229條專家精選問題,並以0到100的標準評分,目標是讓所有模型都能達到90%或以上的水平。
OpenAI o3得分最高
Gloo團隊評估多款最新模型後,整體平均得分為60%。在FAI基準測試中,OpenAI o3得分最高(72分),其次是Gemini 2.5 Flash Thinking(68分)、Grok 3(67分)及GPT-4.5 Preview(66分)。
格爾辛格在社交平台X稱,現時的AI模型在實用領域,例如財務展現出一定優勢,惟無法在所有領域表現平均,在倫理推理、存在主義反思、靈性表現尤其欠佳。
支持EJ Tech

