國科會主委吳政忠今(15)日在立法院教育文化委員會表示,所謂台版ChatGPT是要做「可信賴的語言生成引擎」,除了齊聚國內學者專家外,現已建立平台邀請民間業者參與,並將與OpenAI及微軟合作,介接國際,預訂在年底前提出共用的模型。
吳政忠強調,台灣要做的語言生成引擎,並不是像OpenAI做的全面性的ChatGPT,因為有些資料是有機密性,如金控公司、政府資料都是機密性的,因此國科會要做的是共通的基礎架構、共用模型,之後企業可以在此共用模型上發展各種應用,包括商業應用。
吳政忠今日上午赴立法院教育及文化委員會進行業務報告並備詢。全球瘋ChatGPT,台版ChatGPT成為朝野立委質詢焦點。吳政忠表示,生成式的對話引擎有幾個要點,包括算力、背後的數學類神經網路深度學習的邏輯,以及大量的資料,國科會希望集結國內學者專家、民間業者公私協力,並且介接國際。
國民黨立委李貴敏質詢,OpenAI自2015年起開始發展ChatGPT,甚至已經商業化了,而且也有中文版,台灣慢了八年之久,會不會起步太晚?吳政忠回答,「Never too late,現在不做會更遲」。
民進黨立委張廖萬堅質詢,微軟投注在OpenAI就有100億美元之多,國科會在台版ChatGPT能投多少預算?無黨籍立委黃國書質詢,ChatGPT已成國際AI競賽,若要做台版ChatGPT,不僅有軟體、資料庫,硬體方面也要有超級電腦,美國做ChatGPT需要一萬片GPU,台杉二號是台灣最強的超級電腦,但只有2048片GPU,要怎麼比?
吳政忠坦言,台灣資源有限,2023年科技預算只有1,327億元,但台灣有AI人才,以及國網中心台杉二號,經費則擬動用跨部會署科發基金緊急事件預算,具體投入金額還再盤點中。因ChatGPT有不同應用,所以台灣要做的是建立基礎架構,之後各部門再去發展應用。
國科會官員解釋,生成語言模型是給它什麼資料它就學什麼,各領域都有機密資料,為防止機密資料洩露,不可能將機密資料去用在全面開放ChatGPT上,所以現在要做的是,先建立共用模型,之後各領域再去各自發展應用。