LINE攜手母公司NAVER打造「100億頁」日語模型 加速日本境內AI發展

聯合新聞網 楊又肇

稍早於日本舉辦的LINE Developer Day 2020活動中,LINE宣布與NAVER共同針對日語應用需求打造超巨大語言模型,藉由人工智慧處理運算呈現自然語言表現效果,並且能對應各類服務應用需求。

依照LINE說明,此項超巨大語言模型涵蓋超過1750億種參數變因、總計超過100億頁的日語資料量,相較現存以日語為主的語言模型更為龐大,同時日後也會持續擴展收錄資料量。

之所以建立此項超巨大日語語言模型,是因為目前市場同樣規模的語言模型多半是以英語為主,例如OpenAI提出的GPT系列語言模型,或是Google打造的T5語言模型,都是以目前全球最常使用的英語為基礎,此次宣布建構超具大規模的日語語言模型,便是希望推動更多以日語為主的自然語言應用服務,並且透過API方式讓更多服務可以直接串接使用,無須額外進行事先訓練。

由於此項語言模型已經先由LINE進行建構、訓練,因此已經能以相當自然形式詮釋日語內容,並且可完成自然對話等應用,希望藉此推廣更多以日語為基礎的人工智慧應用服務,並且加速更多日本境內人工智慧應用體驗。

而在此項超巨大日語語言模型背後,將透過運算量達700PFLOPS的超級電腦運作,預期可在未來一年內投入商業應用。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

超級電腦

推薦文章

留言