史丹佛大學公布10款大型自然語言模型透明度指標:Llama 2排名最高,但仍不可信

聯合新聞網 楊又肇

史丹佛大學人本人工智慧學院 (Stanford University Human-Centered Artificial Intelligence,Stanford HAI)稍早公布10款被大量採用的大型自然語言模型透明度指標,其中獲得最高分的是Meta旗下Llama 2,而排名最低的則是亞馬遜旗下Titan Text,至於OpenAI的GPT-4則在排名第四,Google的PaLM 2則位居第五,在Stability.ai排名之後。

不過,報告中也指出即便Llama 2在10款大型自然語言模型中的透明度排名第一,但實際上的透明度僅有54%,而Google的PaLM 2也僅有40%透明度,作為商用的亞馬遜Titan Text透明度更僅有12%。

此指標報告的透明度計算方式,包含業者是否對外公布模型運作模式、規模及架構等,另外也包是否提供相關監控機制及補救調整方式,而透明度高低更意味使用者能信賴大型自然語言模型的程度。而從負責使指標報告製作的史丹佛大學人本人工智慧學院基礎模型研究中心看法認為,當前列入計算的大型自然語言模型實際上都無法完全信賴,並不建議企業或政府機構運用此類模型打造服務。

史丹佛大學人本人工智慧學院總計制定100項用於評估大型自然語言模型透明度的指標,其中約三分之一用於評估模型如何被建立、訓練使用資料、建立模型時花費人力等,而其他三分之一則包含模型實際運作表現、可信度、風險程度,以及改善方式,剩餘三分之一則包含提供模型的業者採取政策、業者是否針對受影響情況提供協助等。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

📌 數位新聞這裡看!

 訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 「找車位神器」3秒搜出停車格!5縣市可用 駕駛實測嘆:相見恨晚
📢網紅「小周牙醫」歧視同志言論挨轟!道歉被網抓包IG、YT秒做1事:沒誠意
📢 Switch 2台北體驗會7/5登場!抽選制、超詳細報名規則曝
📢 ASUS VivoWatch 6 AERO智慧手環開箱!指尖量心電圖 睡眠追蹤曝「9成全淺眠」
📢 YouTube會員台灣便宜雙人方案來了!價格比印度貴近4倍 規則一次看
📢 獨/等到iPhone嗶進站!蘋果iOS18.4開放台灣NFC交易 悠遊卡公司回應了

楊又肇

曾任聯合新聞網 (udn.com)數位頻道記者,目前為自由寫手與Mas...

人工智慧 Llama OpenAI

推薦文章

留言