史丹佛大學公布10款大型自然語言模型透明度指標：Llama 2排名最高，但仍不可信

2023-10-21 15:30 聯合新聞網楊又肇

史丹佛大學人本人工智慧學院 (Stanford University Human-Centered Artificial Intelligence,Stanford HAI)稍早公布10款被大量採用的大型自然語言模型透明度指標，其中獲得最高分的是Meta旗下Llama 2，而排名最低的則是亞馬遜旗下Titan Text，至於OpenAI的GPT-4則在排名第四，Google的PaLM 2則位居第五，在Stability.ai排名之後。

不過，報告中也指出即便Llama 2在10款大型自然語言模型中的透明度排名第一，但實際上的透明度僅有54%，而Google的PaLM 2也僅有40%透明度，作為商用的亞馬遜Titan Text透明度更僅有12%。

此指標報告的透明度計算方式，包含業者是否對外公布模型運作模式、規模及架構等，另外也包是否提供相關監控機制及補救調整方式，而透明度高低更意味使用者能信賴大型自然語言模型的程度。而從負責使指標報告製作的史丹佛大學人本人工智慧學院基礎模型研究中心看法認為，當前列入計算的大型自然語言模型實際上都無法完全信賴，並不建議企業或政府機構運用此類模型打造服務。

史丹佛大學人本人工智慧學院總計制定100項用於評估大型自然語言模型透明度的指標，其中約三分之一用於評估模型如何被建立、訓練使用資料、建立模型時花費人力等，而其他三分之一則包含模型實際運作表現、可信度、風險程度，以及改善方式，剩餘三分之一則包含提供模型的業者採取政策、業者是否針對受影響情況提供協助等。

《原文刊登於合作媒體mashdigi，聯合新聞網獲授權轉載。》

📌 數位新聞搶鮮看！

　訂閱《科技玩家》YouTube頻道！
💡 追新聞》》在Google News按下追蹤，科技玩家好文不漏接！
📢 Apple Pay、信用卡搭北捷「只扣1元」是沒刷到嗎？官方曝扣款規則秒懂
 📢 iPhone來電畫面有2種！設計巧思超貼心滑動接聽、拒接方法一次看
 📢 DJI Mic Mini 2開箱！實測ASMR、降噪收音驚豔彩色磁吸前蓋可更換
 📢北捷Apple Pay信用卡嗶進站變「深蹲感應區」！官方曝設計原因：會再調整
 📢獨／STUDIO A遇蘋果漲價要求「補差價」 4關鍵自保：店家不一定免責
 📢 LINE免費貼圖4款！「蛤」字必下載爽用半年、熊大兔兔動態圖超Q

楊又肇

曾任聯合新聞網 (udn.com)數位頻道記者，目前為自由寫手與Mas...

人工智慧 Llama OpenAI

史丹佛大學公布10款大型自然語言模型透明度指標：Llama 2排名最高，但仍不可信

楊又肇

推薦文章

「悠遊卡比西瓜卡慢半拍」日網友超不解！網曝關鍵原因

LINE免費貼圖7款！LV精品款用到明年1月諧音哏「熱到兔」ㄅ級分快下載

國家級「行動斷網」演習完整指引！NCC揭3重點：勿用手機處理重要工作

《奧德賽》掀IMAX影廳搶票潮！為何影迷瘋美麗華解密電影院銀幕畫面差異

住飯店YouTube忘了登出怎麼辦？教你用Google帳戶遠端強制退出

用悠遊卡搭北捷…iPhone放口袋卻重複扣款！官方曝解法

史丹佛大學公布10款大型自然語言模型透明度指標：Llama 2排名最高，但仍不可信

楊又肇

推薦文章

「悠遊卡比西瓜卡慢半拍」日網友超不解！網曝關鍵原因

LINE免費貼圖7款！LV精品款用到明年1月 諧音哏「熱到兔」ㄅ級分快下載

國家級「行動斷網」演習完整指引！NCC揭3重點：勿用手機處理重要工作

《奧德賽》掀IMAX影廳搶票潮！為何影迷瘋美麗華 解密電影院銀幕畫面差異

住飯店YouTube忘了登出怎麼辦？教你用Google帳戶遠端強制退出

用悠遊卡搭北捷…iPhone放口袋卻重複扣款！官方曝解法

LINE免費貼圖7款！LV精品款用到明年1月諧音哏「熱到兔」ㄅ級分快下載

《奧德賽》掀IMAX影廳搶票潮！為何影迷瘋美麗華解密電影院銀幕畫面差異