Don't Miss
Pokémon測試|電玩變大模型測評場
By 信報財經新聞 on January 27, 2026
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
愈來愈多人工智能(AI)公司,正在使用由任天堂(Nintendo)開發的經典電玩遊戲《精靈寶可夢》(Pocket Monster)作品,測試旗下AI模型的表現。
Anthropic應用AI主管赫希(David Hershey)早前向《華爾街日報》表示,「它為我們提供一種很棒的方式,可以直接看到模型表現,並以量化方式來評估它。」
科技巨擘Google去年發表Gemini 2.5技術報告時,甚至還直接設置專門章節與圖表,詳細介紹Gemini 2.5遊玩《精靈寶可夢》的情況。
讓《精靈寶可夢》成為測試AI模型利器的原因,主要在於它是沒有時間壓力的回合制遊戲,而人們對作品的認知度,進一步增加了其娛樂性與影響力。
Gemini長勝將軍 GPT稍遜
目前在實況直播平台Twitch上,可以看到最新的GPT-5.2、Claude Opus 4.5、Gemini 3 Pro等模型,都在努力挑戰不同版本的《精靈寶可夢》遊戲。
根據《時代》雜誌專欄作家皮萊(Tharin Pillay)觀察,暫時Gemini通關能力最強,甚至能夠做到長勝不敗,但Claude明顯在快速追趕,GPT未見什麼亮眼表現。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。




















