18+

史丹佛大學公布10款大型自然語言模型透明度指標:Llama 2排名最高,但仍不可信

史丹佛大學人本人工智慧 學院 (Stanford University Human-Centered Artificial Intelligence,Stanford HAI)稍早公布10款被大量採用的大型自然語言模型透明度指標,其中獲得最高分的是Meta旗下Llama 2,而排名最低的則是亞馬遜旗下Titan Text,至於OpenAI 的GPT-4則在排名第四,Google的PaLM 2則位居第五,在Stability.ai排名之後。

不過,報告中也指出即便Llama 2在10款大型自然語言模型中的透明度排名第一,但實際上的透明度僅有54%,而Google的PaLM 2也僅有40%透明度,作為商用的亞馬遜Titan Text透明度更僅有12%。

此指標報告的透明度計算方式,包含業者是否對外公布模型運作模式、規模及架構等,另外也包是否提供相關監控機制及補救調整方式,而透明度高低更意味使用者能信賴大型自然語言模型的程度。而從負責使指標報告製作的史丹佛大學人本人工智慧學院基礎模型研究中心看法認為,當前列入計算的大型自然語言模型實際上都無法完全信賴,並不建議企業或政府機構運用此類模型打造服務。

史丹佛大學人本人工智慧學院總計制定100項用於評估大型自然語言模型透明度的指標,其中約三分之一用於評估模型如何被建立、訓練使用資料、建立模型時花費人力等,而其他三分之一則包含模型實際運作表現、可信度、風險程度,以及改善方式,剩餘三分之一則包含提供模型的業者採取政策、業者是否針對受影響情況提供協助等。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

延伸閱讀

用VR裝置Quest 3擺弄holo祭司引粉絲反彈!模型作者也反應 推主刪影片致歉

濃縮的鐵道情懷 CK124蒸汽火車頭悠遊卡開放預購

為什麼地震無法預報? 氣象署解惑:只能發生後預警

圖輯/突襲以色列準備已久?哈瑪斯曝光的「Strong Pillar」演習行動

本日熱門 本周最熱 本月最熱