18+

終結資料孤島與搬移成本!Google Agentic Data Cloud是專為AI代理打造的跨雲資料湖倉與知識圖譜

▲Google提出專為「代理人時代」量身打造的AI原生資料架構「Agentic Data Cloud」
▲Google提出專為「代理人時代」量身打造的AI原生資料架構「Agentic Data Cloud」

當企業紛紛導入AI代理 (Agents),期望實現全面自動化時,往往會面臨一個致命的瓶頸:底層的資料架構跟不上AI的速度。在此次Google Cloud Next'26大會上,Google提出全新的「Agentic Data Cloud」願景,這項專為「代理人時代」量身打造的AI原生資料架構,宣告過去十年間專為人類規模設計的「被動式資料歸檔」 (Systems of intelligence),將正式轉型為能讓AI主動感知、推理,並且能即時行動的「行動系統」 (Systems of action)。

跨雲湖倉與極速引擎:打破供應商綁定的資料壁壘

在企業IT環境日益複雜的當下,資料往往散落在不同的雲端平台上。為了打破資料孤島 (Data silos),Google推出了兩項殺手級的底層更新:

• 跨雲資料湖倉 (Cross-Cloud Lakehouse):這項基於Apache Iceberg標準打造的架構,主打「零複製存取」 (Zero-copy access)。企業可以將資料原封不動地留在AWSAzure (預計今年稍晚支援)上,直接進行即時查詢。不僅省去高昂的資料搬移成本,更徹底消除了單一供應商綁定 (Vendor lock-in)的問題。同時,它也能無縫串接Databricks、Palantir、Salesforce、Snowflake等主流資料與AI平台,讓企業資料能有更大儲存彈性。

• Lightning Engine for Apache Spark:針對巨量資料運算,Google推出全新無伺服器 (Serverless)即時引擎。其運作速度比開源替代方案快上4.5倍,並且在處理大型資料集時,能提供超越主要競爭對手2倍的極致性價比。目前包含Flipkart、Lowe’s等企業皆已藉此大幅加速其Spark工作負載。

賦予AI語意理解能力:Knowledge Catalog與Data Agent Kit

AI模型最怕遇到用到品質不佳資料,造成「垃圾進,垃圾出」 (Garbage in, garbage out)的輸出品質影響問題。為了解決這個問題,Google在資料的「語意理解」上下了重本:

• Knowledge Catalog (知識型錄):這是針對企業打造的動態上下文圖譜,透過整合智慧儲存系統 (Smart Storage)與Object Context API,當檔案存入Google Cloud儲存平台的瞬間,系統就會自動為資料加上標籤,並且豐富其Metadata (詮釋資料)。接著,Knowledge Engine會利用Gemini模型自主定義資料邏輯,並且繪製出跨越整個企業的複雜關聯圖,等於是為AI代理準備一本詳盡說明的企業資料專屬字典,補足過去AI最缺乏的資料語意定義能力。

• Data Agent Kit:這是一套由Gemini驅動的資料科學編寫工具,讓從業人員不再需要從頭手寫程式碼,只需在IDE、Notebooks或代理終端機中「說出」業務目標,系統就會透過意圖驅動開發 (Intent-driven development)自動生成Python、Spark與SQL程式碼。

企業級的全能分析師:Deep Research Agent

在應用層面,Google宣布推出專為企業洞察設計的Deep Research Agent (深度研究代理)。

過去,Gemini Enterprise中的深度研究功能主要針對文件與SaaS (軟體即服務)系統,而此次接上BigQuery等核心資料平台,意味這名「虛擬分析師」能同時掌握企業的結構化與非結構化資料,不僅能回答諸如「造成我們供應鏈中斷的根本原因是什麼?」,或是「請對該地區進行財務審計」等極度複雜的商業問題,還能附上精準的來源引用資料 (Citations),將過去人類分析師需要耗費數週的工時,濃縮至幾分鐘內完成。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

本日熱門 本周最熱 本月最熱