Google推出更多無障礙功能 藉由AI加強螢幕閱讀器的分析、互動功能

聯合新聞網 楊又肇

在蘋果因應5月16日的全球無障礙體認日 (Global Accessibility Awareness Day)推出諸多無障礙功能後,Google也同樣在全球無障礙體認日推出多款在Android、Chrome的無障礙功能

其中,Google將Gemini人工智慧技術整合至Android螢幕閱讀器「TalkBack」功能內,即使螢幕顯示內容沒有具體文字內容,依然可透過人工智慧方式生成圖像描述,甚至也能進一步針對描述內容進行提問,例如可回答圖像中人物穿著細節、穿戴配件等,另外也能透過此功能查詢購物服務呈現商品的材質、是否有額外折扣等。

而在新版「Expressive Captions」字幕功能,則是進一步利用人工智慧技術分析影片中人物說話語氣,並且讓生成字幕透過額外描述方式詮釋更多「情緒」,例如當賽事講解人員激動表達進球時高喊「精彩得分」時,生成字幕會在後續加上「~~~~!」之類的標點符號,或是加上相關聲音標籤,藉此呈現不同解說情緒,讓更多聽障者透過字幕也能感受講解人員當下激動情緒。

不過,此功能將僅先針對英語使用地區提供,包含美國、英國、加拿大、澳洲境內搭載Android 15以上的裝置均可使用。

藉由2019年啟用的「Euphonia」項目,讓非當地語言使用者也能順利使用語音辨識功能,例如讓非英語使用者在使用生澀的英語發音下達聲控指令時,依然可讓語音辨識功能正常識別運作。而「Euphonia」項目目前已經透過GitHub提供開源程式碼資源,讓更多人可以打造客製化應用服務,或是訓練不同語音識別效果。

另外,Google也透過其Google.org單位協助英國倫敦大學學院創建數位語言包容中心 (CDLI),改善非洲非英語使用者的語音辨識技術,其中建立10種非洲語言的開源資料集,並且建立新語音辨識模型,使其能應用在更多語音識別應用服務。

其他更新部分,則包含加入可讓身障者透過臉部表情操作Chromebook,並且在閱讀模式加入更多自訂選項,同時也能透過螢幕閱讀器「TalkBack」功能檢視螢幕顯示內容,或是透過字幕觀看影片,而透過OCR光學字元辨識技術更讓Chrome瀏覽器能更容易識別PDF文件內容,甚至能進一步選取、複製或搜尋PDF文件的文字內容,另外也能透過自動放大效果,讓視障者更容易透過Chrome瀏覽器檢視網頁內容。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

📌 數位新聞這裡看!

 訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢甩開悠遊卡?北捷10月開放多元支付閘門 1招真能用iPhone快速模式嗶進站
📢 手機壞掉不能換SIM卡?NCC疑新規定「90天2次」 他傻眼曝倒霉時間軸
📢 Switch 2完整拆解!Joy-Con 2控制器仍會遇上飄移問題
📢 TORRAS COOLiFY Cyber、COOLiFY 2S AI頸掛空調開箱!實測戶外超涼 還能解落枕
📢 他逛光華商場驚覺變無聊又被盤!過來人羞曝「朝聖攻略」:好吃又好玩
📢 iPhone 17改名iPhone 2025?他搖頭揭背後「藏大招」 賺錢金頭腦原理曝

楊又肇

曾任聯合新聞網 (udn.com)數位頻道記者,目前為自由寫手與Mas...

Google 無障礙 功能 語音 人工智慧 Android 視障 Android 15 新版 AI

推薦文章

留言