You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

Pokémon測試|電玩變大模型測評場

By on January 27, 2026

刊於信報財經新聞「CEO AI⎹ EJ Tech

愈來愈多人工智能(AI)公司,正在使用由任天堂(Nintendo)開發的經典電玩遊戲《精靈寶可夢》(Pocket Monster)作品,測試旗下AI模型的表現。

Anthropic應用AI主管赫希(David Hershey)早前向《華爾街日報》表示,「它為我們提供一種很棒的方式,可以直接看到模型表現,並以量化方式來評估它。」

科技巨擘Google去年發表Gemini 2.5技術報告時,甚至還直接設置專門章節與圖表,詳細介紹Gemini 2.5遊玩《精靈寶可夢》的情況。

遊玩《精靈寶可夢》時,Gemini通關能力最強。(Twitch影片擷圖)

讓《精靈寶可夢》成為測試AI模型利器的原因,主要在於它是沒有時間壓力的回合制遊戲,而人們對作品的認知度,進一步增加了其娛樂性與影響力。

Gemini長勝將軍 GPT稍遜

目前在實況直播平台Twitch上,可以看到最新的GPT-5.2Claude Opus 4.5Gemini 3 Pro等模型,都在努力挑戰不同版本的《精靈寶可夢》遊戲。

根據《時代》雜誌專欄作家皮萊(Tharin Pillay)觀察,暫時Gemini通關能力最強,甚至能夠做到長勝不敗,但Claude明顯在快速追趕,GPT未見什麼亮眼表現。

Claude遊玩《精靈寶可夢》時,明顯在快速追趕。(Twitch影片擷圖)

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們