在生成式 AI 的快速發展過程中,安全性和準確性成為了至關重要的課題。先前的文章中,我們曾經解析Amazon BedRock 的新功能,其中更提及GuardRail的服務。Amazon Bedrock 推出的守護措施(Guardrails),提供了一套強大的工具,幫助企業在使用自定義或第三方基礎模型(FMs)構建應用時,能夠有效檢測和防止虛假消息(hallucinations),並確保數據隱私和內容的合規性,博弘雲端將透過本文帶您掌握生成式AI安全合規的全解析!
Amazon BedRock Guardrail 新增兩項保護措施
Amazon Bedrock 的 Guardrail 提供了產業領先的安全保護功能,能夠讓客戶根據應用程式的需求,以及企業內部的AI治理規則,來去實施制定安全防護措施。Guardrail 最主要的功用在於協助企業過濾不良的內容、封鎖提示詞的攻擊,以及移除與隱私相關的資訊。
不僅如此,Amazon BedRock Guardrail 能夠在模型的原生能力之上增加額外的過濾層級,從數據調查來看,這些措施可以阻止高達85%的有害內容,並對檢索增強生成(RAG)和摘要工作負載中虛假反應進行75%以上的過濾。不過令人好奇的是,AWS如何運用 Guardrail 的技術協助企業過濾資訊?
過濾內容
內容過濾器允許企業在AWS的介面當中設置不同的過濾閾值,以過濾仇恨言論、侮辱、暴力等不當內容。這些過濾器可以在使用者輸入和模型響應中自動檢測和阻止被限制的內容,確保生成的響應沒有涵蓋不適當的訊息。舉例來說,一個電商網站的線上AI客服助手,可以被設計成避免使用仇恨言論或侮辱性語言的工具,導致後續的對話出現不雅的字眼。
遮蔽敏感資訊
為了保護使用者的隱私,Guardrail 可以檢測並遮蔽包含與個人身份資訊(PII)相關的內容。企業可以選擇預定義的PII類型或自定義的敏感資訊類型,根據需求來拒絕或編輯包含敏感信息的輸入或響應。舉例來說,客戶管理中心在運用Amazon BedRock 服務生成客服報告摘要的過程中,可以遮蔽使用者的個人資訊,在安全的情況下使用這些資料,以確保符合資安稽核的需求。
打擊虛假訊息 Guardrail 提升生成資訊正確性!
生成式 AI 應用的另一大挑戰,是防止虛假消息(Hallucination)的生成。Amazon Bedrock 的Guardrail 將支援上下文依據檢查,可以在響應中檢測和過濾虛假資訊。這些檢查可以應用在RAG、摘要生成和對話當中,使用源頭訊息作為參考,來驗證模型的響應是否準確,確保生成的內容真實可靠。舉例來說,企業可以使用 Amazon Bedrock 的知識庫進行上下文依據檢查,以部署可靠的檢索增強生成(RAG)應用。透過檢查過濾出沒有依照企業資料庫的錯誤回應,從企業資料庫所檢索到的結果作為參考依據,並通過上下文依據檢查策略來驗證模型的回應。
不僅如此,Amazon BedRock 更可以讓您客製化這些檢測虛假資訊的防護措施。Amazon Bedrock 的Guardrail 讓企業可以根據其應用需求和負責任的AI政策,自定義安全和隱私保護措施。這些守護措施可以應用在所有的Amazon Bedrock大語言模型(LLMs)以及自定義的模型。企業可以創建多個 Guardrail 守護措施,配置不同的控制組合,並在不同的應用和使用案例中使用。這些Guardrail守護措施還可以與Amazon Bedrock的Agents和知識庫集成,構建符合企業AI政策的生成式AI應用。
隨著生成式AI的發展,資安這一環也成為不可或缺的保護角色。根據 Forrester 保障生成式 AI 安全的報告指出,有67%的企業決定採用生成式AI,卻沒有考量到背後所帶來的資安風險。博弘雲端的不僅有生成式AI的解決方案,更有完善的資安小組,協助企業部署生成式AI解決方案,並強化企業在運用新科技時的資訊安全,達到既保障生成式AI安全應用的重要法則!