Q1：Hassabis怎麼看目前大型語言模型的技術路線？

他認為大規模預訓練、基於人類回饋的強化學習與思維鏈等方法，大致上都是正確方向，未來很可能也是AGI架構的一部分，不太像死胡同。

Q2：為什麼他認為百萬Token上下文不等於真正記憶？

因為那比較像擴大的工作記憶，只是把大量資訊塞進去，並不能像人類一樣有效歸檔、更新與調用知識；若要深度推理，效率仍會很低。

Q3：他認為AGI還缺少哪兩項最關鍵的能力？

除了持續學習與長程推理外，他特別強調記憶與內省。前者讓模型能整理並提取知識，後者讓模型能意識到錯誤並推翻不佳答案。

算力不是萬靈丹？Google DeepMind執行長：實現通用AI的路，還差「記憶」與「內省」最後兩塊拼圖 | AI浪潮

在AI發展日新月異的今天，關於AGI (通用AI)的討論往往陷入極端：一派深信AGI已經近在咫尺，另一派則斷言現有的大型語言模型路線根本是死胡同。然而，身為AlphaGo與AlphaFold幕後推手、同時擁有諾貝爾化學獎得主與認知神經科學博士雙重身分的Google DeepMind 執行長Demis Hassabis，則是在近期的訪談中直言：目前的技術路徑大概率是正確的，但要真正實現AGI，我們可能還差一到兩個關鍵的突破，而這些突破往往藏在一些看起來「不太性感」的底層架構中。

現有架構已經對了大半，但拼圖尚未完整

在近期接受Y Combinator (YC)的一場訪談中，當被問及「大規模預訓練、基於人類回饋的強化學習，以及思維鏈等技術，在最終的AGI架構中佔據多少份量？」時，Demis Hassabis給予相當正面的肯定。

他認為，這些技術組件幾乎確定會是未來AGI的一部分。因為這些路線已經在實務上驗證足夠多的能力，不太可能在未來被證明是錯誤的死胡同。

然而，在現有的技術基石之上，Demis Hassabis指出AGI仍有三個極待解決的硬傷：持續學習 (Continuous Learning)、長程推理 (Long-horizon Reasoning)，以及最令人意外的——記憶 (Memory)。

「記憶」越大越難思考：百萬Token上下文不等於真正的記憶

許多人可能會感到疑惑：現在的大模型不是動輒能處理數百萬，甚至千萬Token的上下文嗎？ (例如Google自家的Gemini 1.5 Pro已經支援多達千萬Token)，為何「記憶」依然是個痛點？

Demis Hassabis用一個極為精闢的類比來解釋：目前的「上下文窗口」 (Context Window)本質上更像是AI的「工作記憶」 (Working Memory)。

人類的短期工作記憶平均只能同時處理約7個資訊單元，但我們現在透過硬體與算法的暴力堆疊，強行把AI的工作記憶撐大到百萬級別。問題是，我們現在的作法是把所有資訊——不論重要與否、對錯與否——全部一股腦地塞進這個超大窗口裡，然後指望模型自己從中「撈」出有用的資訊。

Demis Hassabis舉例，若要處理即時的視訊串流，把每一幀的所有Token都存進去，100萬Token其實只夠裝載約20分鐘的內容。這還只是單向寫入，若要涉及反覆查找與深度推理，將使效率變得極度低下。

「真正的AGI需要的，不只是能存住歷史資訊的流水帳」，Demis Hassabis強調：「而是能將新的理解融入已有的知識體系中，並且在需要時精準調取，就像人腦的運作方式一樣，而不是每次都對著一本百萬字的無分類筆記，從頭到尾死磕通讀一遍」。

缺乏「內省」能力：AI仍不懂得懷疑自己的答案

除了記憶機制的缺陷，Demis Hassabis點出的另一塊拼圖是「內省」能力。

他分享一個有趣的觀察：當他讓Gemini下棋時，有時模型會選擇一步明顯很差的棋。令人驚訝的是，系統的內部狀態顯示，它其實意識到這可能是一步臭棋，但因為「沒有找到更好的替代方案」，最後還是硬著頭皮走了那一步。

這點出現有大模型最詭異的矛盾：同一個模型，可能可以解出國際數學奧林匹亞金牌等級的難題，但換個問法，它卻可能在小學程度的數學題上翻車。

這說明目前模型對於自身的推理過程仍缺乏真正的「反思能力」，它不是不知道自己可能算錯，而是不知道該如何「推翻並糾正」自己。這導致模型常常在錯誤的推理路徑上一路走到黑，或者像個新手一樣反覆掉進同一個邏輯陷阱中。

分析觀點：邁向2030年的AGI務實時間表

從Demis Hassabis這次訪談來看，他褪去許多矽谷科技狂人喜歡炒作的「末日論」或「奇點降臨論」，用極度理性的科學家視角，幫當前過熱的AI產業做了一次冷靜的體檢。

Demis Hassabis預估，AGI真實到來的時間點大概落在2030年左右，並且認為有一半的機率能實現，但前提是業界必須找到剩下那一兩個尚未被發掘的關鍵想法。而這也釋放出一個非常明確的訊號：通往AGI的最後一哩路，絕對不是單純靠著砸錢買NVIDIA GPU、無腦堆疊算力與訓練數據就能解決的。

從「建立如同人腦般的知識歸檔與調用機制」 (而非暴力的超大上下文)，到「賦予模型自我糾錯與反思的能力」，這些聽起來一點都不「性感」的底層架構改良，才是真正區分「超強鸚鵡」 (意指具有高度模仿能力的AI)與「通用人工智慧」 (目前市場期望打造能真正自我思考的AI)的關鍵分水嶺。對所有AI從業人員與投資者而言，這或許是近期最具指標意義的產業風向球。

《原文刊登於合作媒體mashdigi，聯合新聞網獲授權轉載。》

精華 FAQ

Q1：Hassabis怎麼看目前大型語言模型的技術路線？

他認為大規模預訓練、基於人類回饋的強化學習與思維鏈等方法，大致上都是正確方向，未來很可能也是AGI架構的一部分，不太像死胡同。
Q2：為什麼他認為百萬Token上下文不等於真正記憶？

因為那比較像擴大的工作記憶，只是把大量資訊塞進去，並不能像人類一樣有效歸檔、更新與調用知識；若要深度推理，效率仍會很低。
Q3：他認為AGI還缺少哪兩項最關鍵的能力？

除了持續學習與長程推理外，他特別強調記憶與內省。前者讓模型能整理並提取知識，後者讓模型能意識到錯誤並推翻不佳答案。