【資料圖】
7月6日,大數據協同安全技術國家工程研究中心(BDS國家工程中心)官網發布國內首份《大語言模型提示注入攻擊安全風險分析報告》。報告面向大語言模型的提示注入攻擊和防御技術展開研究,并通過構建了包含36000條的提示注入攻擊驗證數據的數據集,覆蓋3類典型攻擊方法和6類安全場景,用于對大語言模型的提示注入攻擊風險測評。測評結果顯示,目前的大型語言模型普遍面臨提示注入攻擊安全風險,包括在自動問答系統中誤導用戶,或者通過對話系統中的輸入操縱回答結果。報告指出,提示注入攻擊已成大模型安全威脅之首,建議從安全測評、安全防御、安全監測預警等方面,多維度提升大模型的安全性。
(文章來源:界面新聞)
標簽: