世界頂尖AI 團隊正努力解決在他們大型語言模型(LLM)中一種關鍵的資安漏洞 ,避免網路犯罪分子利用這種漏洞,發動所謂的「間接提示注入攻擊 」。
Google DeepMind、Anthropic、OpenAI與微軟等公司正努力阻止這種攻擊。在這種攻擊中,第三方會在網站或電郵中隱藏指令 ,誘使AI模型洩露機密資料等未經授權的資訊。
AI新創公司Anthropic的威脅情報團隊主管克萊茵說:「AI目前已被駭客 份子用於攻擊流程的每一個環節。」
各大AI團隊正利用多種方法,包括聘請外部測試人員與使用AI驅動工具,來偵測並減少其AI技術被惡意使用。但專家警告,業界還沒找到方法來阻止間接提示注入攻擊。部分問題在於,LLM被設計為必須遵循指令,然而目前無法分辨使用者輸入的指令是合法或不可信賴。這也是為什麼AI模型容易被「越獄」,因為使用者可提示LLM忽略其安全防護。
克萊茵表示,Anthropic與外部測試人員合作,讓其Claude模型加強抵抗間接提示注入攻擊,並使用AI工具來偵測疑似攻擊的情形,「當我們發現惡意使用時,會依據信任程度自動觸發某些介入程序,或送交人工審查」。
Google DeepMind則採用稱為「自動化紅隊演練」技術,讓公司內部研究人員以逼真的方式持續攻擊其Gemini模型,以發掘潛在安全弱點。
英國國家網路安全中心在5月警告,這種漏洞提高了風險,可能讓成千上百萬使用LLM與聊天機器人的公司與個人承受高度複雜的網路釣魚攻擊與詐騙 。
LLM還有另一個重大弱點,外部人士可在用於AI訓練的資料中植入惡意內容,為模型創造後門。上月一份新研究顯示,這類所謂「對資料下毒攻擊」比先前所想更容易執行。
駭客專家指出,近年來AI的進展已擴大網路犯罪產業。AI為業餘駭客提供廉價工具來撰寫惡意軟體,包括迅速生成尚未被偵測的新型惡意程式碼,使防範更為困難。
麻省理工學院(MIT)研究人員一項最新研究發現,他們調查的勒索軟體攻擊中有80%使用了AI;在2024 年,AI相關網路釣魚詐騙與深偽(deepfake)詐欺案件也增加60%,包括逼真的語音詐騙。
AI工具也被駭客用來蒐集受害者的線上資訊。LLM能高效率掃描網路上某人的公開帳號、圖片,甚至找到其語音片段。Visa的風險與客戶服務長Paul Fabara表示,這些資訊可用於策劃精密的社交工程攻擊以進行金融詐欺。
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 vivo X300 Ultra手機開箱!實測增距鏡變身鳥類學家 拍得到101內部海報
📢 iPhone 18 Pro三大升級亮點曝!多項「歷代最佳」成換機大誘因
📢 LINE免費貼圖5款!毛小孩集合 快用「勸敗買買圖」慫恿朋友瞎拼
📢 Sony Xperia 1 VIII開箱!5亮點礦石機身+新望遠鏡頭 實測AI攝影助理聰明
📢 「旅遊eSIM」三大電信都可申請!整理日本漫遊方案差異一次看
📢 便宜資費懶人包/5G 399元比4G便宜 新方案「每月加100」上網升級

討論區