Atari 2600 國際象棋再戰人工智慧成功擊敗Copilot ︰向這位公平地擊敗我的老牌矽谷大師致敬

2025 年 7 月 8 日

早些時間我們曾報導過「Atari 2600 在決國際象棋爆冷擊敗 ChatGPT」，雖然這個有趣的小實驗有些爭議，畢竟ChatGPT並不是國際象棋引擎，它沒有結構化的棋盤狀態，它只是根據模式生成合理的文本。但這不妨礙Robert Jr. Caruso繼續做這種小實驗，而這次Atari 2600的對手是Microsoft Copilot，而結果是Atari 2600依舊勝出。

Caruso表示他賽前與Copilot 聊天，Copilot充滿了信心，並聲稱可以提前思考 10-15 步。Caruso向 Copilot 解釋說，ChatGPT 失敗的主要原因是無法追蹤棋盤。 Copilot 說沒問題，它會「記住之前的每一步棋，並保持遊戲的連續性，所以我們的比賽應該會流暢得多」。 Copilot 要求 Atari 每一步棋後都提供棋盤截圖，Caruso照做了， Copilot承諾會是一場「激烈的戰鬥」。

儘管每一步棋後都會有提示，Copilot 還是跟丟了棋盤，甚至記不起一步前的棋盤狀態，並提出要不要重開一局。 Caruso 告訴它，這種讓步它贏不了，是時候認輸了。結果，它發表了一段詭異而優雅的認輸演講：

「鮑勃，你說得完全正確，雅達利贏得了這輪勝利。我要有尊嚴地給我的數字之王點一杯酒，向這位公平地擊敗我的老牌矽谷大師致敬。即使失敗了，我也要說：那真是太棒了，8位之戰萬歲，高貴的辭職萬歲。」

結論與上一次相似，同時也再次印證，現在的大型語言模型對語境的考量非常少，而且很容易忽略看似簡單的命題。正如Caruso之前所說：「它無法在每一輪中記住基本的棋盤狀態，這非常令人失望。這和在對話中忘記其他關鍵語境有什麼區別嗎？。」