聊天機器人ChatGPT開啟生成式人工智慧(Generative AI)浪潮,LINE台灣工程團隊嘗試開發中文應用,預計在內容入口LINE TODAY提供文章摘要,未來也可能向用戶推薦感興趣的影音。
生成式AI可透過機器學習模型研究歷史數據,自行創建與合成資料,在短短幾秒鐘內生成各種文章、圖像、音檔或影片,對各個產業都帶來衝擊。
LINE台灣資料工程部資深經理蔡景祥接受中央社專訪表示,生成式AI的回答可提供從未想過的角度,LINE工程團隊測試結果常讓人感到驚訝。
蔡景祥認為,生成式AI可幫用戶閱讀大量資料、進行摘要,成為動腦夥伴,是相當好的工具。例如想廣告文案毫無頭緒時,過去需要大量閱讀或問朋友,現在透過與生成式AI互動,可自己慢慢釐清想法。
生成式AI也有限制,蔡景祥發現,如果問題太複雜或需要特定的背景知識,生成式AI就不一定能精確回答。
為迎接生成式AI應用到來,LINE自行研發SmartText自然語言處理平台,初版即可透過模型處理常見的文字自動化任務,例如文件分類、多標籤分類、主題偵測等,現已實際運用在LINE訊息查證、LINE TODAY主題標籤等服務。
此外,經過工程團隊的優化,SmartText自然語言處理平台2.0計畫將可執行更多元的自然語言處理任務,包含文章摘要、換句話說、問答、客製化廣告文案生成等。
蔡景祥說,目前LINE TODAY主題標籤可幫用戶快速抓到重點關鍵字,並橫向串連其他相關文章。不過,文章列表現在只展示標題,未來如果能提供自動生成的文章摘要,用戶在點擊文章連結前,就可多了解一點內容。
另一項嘗試開發的應用是影音推薦。蔡景祥指出,現實中有很多內容不是純文字格式,例如影片就包含文字標題、聲音和影像。LINE工程團隊正在進行多模態(multi model)研究,讓AI可同時讀懂不同格式的內容,未來再加入一些規則或定義關聯性,就有辦法向用戶推薦可能感興趣的影音。
談到中文自然語言處理技術的困難之處,蔡景祥點出「資料清理」和「標註」兩大挑戰表示,資料清理指的是透過人力篩選掉不希望AI學會的資料,這相當費時;資料標註同樣依賴人力,有些資料還需要相關知識背景,才能判斷如何標註。
至於生成式AI的前景,蔡景祥認為,目前生成式AI回答的內容比較「四平八穩」,如果用戶是長輩或兒童,可能需要一點「有溫度的設計」,例如語氣更柔和或更健談,若連台灣國語都能講,更會讓人倍感親切許多。