在AI發展日新月異的今天,關於AGI (通用AI)的討論往往陷入極端:一派深信AGI已經近在咫尺,另一派則斷言現有的大型語言模型路線根本是死胡同。然而,身為AlphaGo與AlphaFold幕後推手、同時擁有諾貝爾化學獎得主與認知神經科學博士雙重身分的Google DeepMind 執行長Demis Hassabis,則是在近期的訪談中直言:目前的技術路徑大概率是正確的,但要真正實現AGI,我們可能還差一到兩個關鍵的突破,而這些突破往往藏在一些看起來「不太性感」的底層架構中。
現有架構已經對了大半,但拼圖尚未完整
在近期接受Y Combinator (YC)的一場訪談中,當被問及「大規模預訓練、基於人類回饋的強化學習,以及思維鏈等技術,在最終的AGI架構中佔據多少份量?」時,Demis Hassabis給予相當正面的肯定。
他認為,這些技術組件幾乎確定會是未來AGI的一部分。因為這些路線已經在實務上驗證足夠多的能力,不太可能在未來被證明是錯誤的死胡同。
然而,在現有的技術基石之上,Demis Hassabis指出AGI仍有三個極待解決的硬傷:持續學習 (Continuous Learning)、長程推理 (Long-horizon Reasoning),以及最令人意外的——記憶 (Memory)。
「記憶」越大越難思考:百萬Token上下文不等於真正的記憶
許多人可能會感到疑惑:現在的大模型不是動輒能處理數百萬,甚至千萬Token的上下文嗎? (例如Google自家的Gemini 1.5 Pro已經支援多達千萬Token),為何「記憶」依然是個痛點?
Demis Hassabis用一個極為精闢的類比來解釋:目前的「上下文窗口」 (Context Window)本質上更像是AI的「工作記憶」 (Working Memory)。
人類的短期工作記憶平均只能同時處理約7個資訊單元,但我們現在透過硬體與算法的暴力堆疊,強行把AI的工作記憶撐大到百萬級別。問題是,我們現在的作法是把所有資訊——不論重要與否、對錯與否——全部一股腦地塞進這個超大窗口裡,然後指望模型自己從中「撈」出有用的資訊。
Demis Hassabis舉例,若要處理即時的視訊串流,把每一幀的所有Token都存進去,100萬Token其實只夠裝載約20分鐘的內容。這還只是單向寫入,若要涉及反覆查找與深度推理,將使效率變得極度低下。
「真正的AGI需要的,不只是能存住歷史資訊的流水帳」,Demis Hassabis強調:「而是能將新的理解融入已有的知識體系中,並且在需要時精準調取,就像人腦的運作方式一樣,而不是每次都對著一本百萬字的無分類筆記,從頭到尾死磕通讀一遍」。
缺乏「內省」能力:AI仍不懂得懷疑自己的答案
除了記憶機制的缺陷,Demis Hassabis點出的另一塊拼圖是「內省」能力。
他分享一個有趣的觀察:當他讓Gemini下棋時,有時模型會選擇一步明顯很差的棋。令人驚訝的是,系統的內部狀態顯示,它其實意識到這可能是一步臭棋,但因為「沒有找到更好的替代方案」,最後還是硬著頭皮走了那一步。
這點出現有大模型最詭異的矛盾:同一個模型,可能可以解出國際數學奧林匹亞金牌等級的難題,但換個問法,它卻可能在小學程度的數學題上翻車。
這說明目前模型對於自身的推理過程仍缺乏真正的「反思能力」,它不是不知道自己可能算錯,而是不知道該如何「推翻並糾正」自己。這導致模型常常在錯誤的推理路徑上一路走到黑,或者像個新手一樣反覆掉進同一個邏輯陷阱中。
分析觀點:邁向2030年的AGI務實時間表
從Demis Hassabis這次訪談來看,他褪去許多矽谷科技狂人喜歡炒作的「末日論」或「奇點降臨論」,用極度理性的科學家視角,幫當前過熱的AI產業做了一次冷靜的體檢。
Demis Hassabis預估,AGI真實到來的時間點大概落在2030年左右,並且認為有一半的機率能實現,但前提是業界必須找到剩下那一兩個尚未被發掘的關鍵想法。而這也釋放出一個非常明確的訊號:通往AGI的最後一哩路,絕對不是單純靠著砸錢買NVIDIA GPU、無腦堆疊算力與訓練數據就能解決的。
從「建立如同人腦般的知識歸檔與調用機制」 (而非暴力的超大上下文),到「賦予模型自我糾錯與反思的能力」,這些聽起來一點都不「性感」的底層架構改良,才是真正區分「超強鸚鵡」 (意指具有高度模仿能力的AI)與「通用人工智慧」 (目前市場期望打造能真正自我思考的AI)的關鍵分水嶺。對所有AI從業人員與投資者而言,這或許是近期最具指標意義的產業風向球。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
精華 FAQ
-
他認為大規模預訓練、基於人類回饋的強化學習與思維鏈等方法,大致上都是正確方向,未來很可能也是AGI架構的一部分,不太像死胡同。
-
因為那比較像擴大的工作記憶,只是把大量資訊塞進去,並不能像人類一樣有效歸檔、更新與調用知識;若要深度推理,效率仍會很低。
-
除了持續學習與長程推理外,他特別強調記憶與內省。前者讓模型能整理並提取知識,後者讓模型能意識到錯誤並推翻不佳答案。
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 Gmail帳號太中二怎麼修改?3步驟換掉Google ID、還有次數限制
📢 難尋4G 599吃到飽「問客服也沒用」!內行5招成功拿低價方案
📢追劇神技!Netflix「隱藏代碼」曝光 輸入5碼韓劇全跳出、還有星爺專屬彩蛋
📢 前進《動物森友會》Xpark海洋生物互動展!動森特典帽子超可愛
📢DJI Osmo Pocket 4開箱!獨旅6大實測福岡、糸島拍照攝影 還能拍富士山超勸敗
📢 小米Xiaomi 17T Pro開箱!徠卡長焦拍攝絕美人像、捕捉排球少年熱血瞬間

討論區