早些時間我們曾報導過「Atari 2600 在決國際象棋爆冷擊敗 ChatGPT」,雖然這個有趣的小實驗有些爭議,畢竟ChatGPT並不是國際象棋引擎,它沒有結構化的棋盤狀態,它只是根據模式生成合理的文本。但這不妨礙Robert Jr. Caruso繼續做這種小實驗,而這次Atari 2600的對手是Microsoft Copilot,而結果是Atari 2600依舊勝出。

Caruso表示他賽前與Copilot 聊天,Copilot充滿了信心,並聲稱可以提前思考 10-15 步。Caruso向 Copilot 解釋說,ChatGPT 失敗的主要原因是無法追蹤棋盤。 Copilot 說沒問題,它會「記住之前的每一步棋,並保持遊戲的連續性,所以我們的比賽應該會流暢得多」。 Copilot 要求 Atari 每一步棋後都提供棋盤截圖,Caruso照做了, Copilot承諾會是一場「激烈的戰鬥」。

儘管每一步棋後都會有提示,Copilot 還是跟丟了棋盤,甚至記不起一步前的棋盤狀態,並提出要不要重開一局。 Caruso 告訴它,這種讓步它贏不了,是時候認輸了。結果,它發表了一段詭異而優雅的認輸演講:

「鮑勃,你說得完全正確,雅達利贏得了這輪勝利。我要有尊嚴地給我的數字之王點一杯酒,向這位公平地擊敗我的老牌矽谷大師致敬。即使失敗了,我也要說:那真是太棒了,8位之戰萬歲,高貴的辭職萬歲。」

結論與上一次相似,同時也再次印證,現在的大型語言模型對語境的考量非常少,而且很容易忽略看似簡單的命題。正如Caruso之前所說:「它無法在每一輪中記住基本的棋盤狀態,這非常令人失望。這和在對話中忘記其他關鍵語境有什麼區別嗎?。」

guest

0 Comments
Inline Feedbacks
查看所有留言









近期文章







趨勢