18+

告別陪跑員與引導線!Google「Running Guide agent」以多代理AI助視障運動員獨立奔跑

對於盲人或低視力 (BLV)的運動員來說,想在戶外盡情奔跑,傳統上往往需要依賴陪跑員的牽引,或是沿著跑道上畫好的實體引導線。為了打破這層物理限制,Google展示其以AI 技術打造的全新無障礙科技——「Running Guide agent」(陪跑代理人)。

這項建構於Pixel 10 Pro 智慧型手機與Gemma 4模型之上的多代理 (Multi-agent)框架,能透過即時環境感知與低延遲語音回饋,引導視障跑者避開障礙、順利過彎。Google更透露,目前正積極測試將這套系統整合至智慧眼鏡 (Intelligent eyewear)中,目標是實現真正的「無輔助獨立奔跑」。

混合雙軌架構:確保高速運動下的絕對安全

Running Guide agent是基於Google先前的Project Guideline專案大幅進化而來。跑者需要將一部Pixel 10 Pro綁在胸前,讓手機鏡頭對準前方道路,系統則透過耳機傳送聽覺回饋。

考慮到「高速奔跑」對安全性的要求極高,Google為其設計了「混合雙軌架構」,確保在任何網路環境下都不會發生延遲:

裝置端離線分割模型 (On-device segmentation):這是保命的底層機制。完全仰賴Pixel 10內的自研晶片離線運作,確保超低延遲。它負責發出緊急的「停止」警告,並且透過左右耳的「滴答聲」來進行方向引導,即使在完全沒有網路訊號的地方也能穩定運作。

Gemma 4高階推理 (Advanced reasoning):這是負責理解複雜場景的「大腦」。為了避免過度消耗算力導致延遲,Google採用「智慧影格選擇」 (Smarter Frame Selection)技術。模型不會逐格分析影像,而是只在遇到地形突然改變或出現新障礙物等「高混亂」畫面時才啟動推理,並且提供精準的語音提示。

三大代理人協作:從出發到休息的無縫體驗

Running Guide agent並非單一程式,而是一個由三個子代理人協作的框架,完整涵蓋跑者的運動旅程:

規劃代理人 (Planner agent):跑前準備的總管。利用Gemma 4的呼叫功能抓取天氣與Google Maps 圖資,與跑者對話設定今日的訓練目標,並且校準電子的起跑線。

教練代理人 (Coach agent):跑步過程中的核心樞紐。它會將語音提示嚴格分級:危險 (DANGER)代表必須立即迴避;警告 (WARNING)提示附近有其他跑者或障礙物;注意 (NOTICE)則是預告前方的跑道彎曲。提示力求簡短、明確。

休息代理人 (Break agent):負責管理間歇訓練的休息時間,讓運動員能隨時暫停與恢復訓練。

未來展望:智慧眼鏡測試中,攜手在地社群

雖然目前胸前綁著Pixel 10 Pro的方案已相當成熟,但Google透露他們對未來的更大野心——準備將這套系統移植到「智慧眼鏡」上。

配戴智慧眼鏡不僅能提供更寬廣、更穩定的視野,大幅優化輸入給多模態模型的影像數據,還能進一步減輕跑者的裝備負擔。目前,智慧眼鏡的畫面將會直接串流至Pixel手機進行運算,實現硬體與環境AI的無縫融合。

此外,為了確保這項技術真正切合需求,Google已經與新加坡負責身心障礙與共融事務的專責機構SG Enable展開合作,讓工程團隊直接與低視力跑者進行真實環境的迭代測試。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

本日熱門 本周最熱 本月最熱