資策會數位轉型研究院─FIND中心

檢索增強生成（Retrieval-augmented generation，RAG）正以前所未有的速度改變大型語言模型（Large Language Model，LLM）的應用面貌。RAG透過整合外部知識庫讓LLM不再只是憑空想像而能即時汲取相關資訊，提升回應的準確性、可靠性和時效性。然而，這項技術同時也帶來了全新的安全挑戰，根據彭博最新研究報告揭露了一個驚人事實：RAG不僅沒有讓AI更安全，反而潛藏新的越獄風險。更令人擔憂的是，趨勢科技的調查發現，全球有超過3,000台RAG核心元件完全暴露在網路上，形同將系統曝露於高風險環境。

圖1：RAG運作原理圖
圖片來源：本文作者由AI 生成（Claude）

RAG運作原理

RAG結合了資料檢索與語言生成模型的能力，讓LLM能即時引用外部知識庫的資訊來回答問題。簡單來說，就是讓AI不只靠自己想，而是先去查詢再回答。

RAG的核心流程如下：

知識來源：彙整文字文件、資料庫或知識圖譜等多元資料構建成專屬知識庫。
索引與嵌入：將資訊轉為語意向量、捕捉語義，方便系統快速進行比對。
向量資料庫：儲存嵌入資料，支援高效的檢索系統。
檢索器：根據查詢問題，從向量資料庫找出最相關的資料內容。
生成器：整合查詢與檢索內容，生成精準回應。

整個過程就像給LLM裝上了一個超級搜尋引擎，讓AI能夠回答特定問題，大幅提升了實用性。

RAG的安全挑戰

RAG 帶來了許多便利，但它複雜架構也帶來了新的安全風險：

模型越獄風險
研究顯示，當 RAG 將大量知識引入模型中可能因上下文提示意外觸發LLM給出不當的回應。本意為提升安全性的知識庫，卻可能因大量文件而讓模型生成不安全回應，形同越獄。
資料洩露與隱私
RAG系統中常常會複製敏感資料到新的儲存空間，例如向量資料庫儲存的嵌入可能透過「反向攻擊」還原敏感資訊。不當處理還可能導致用戶間資料交叉洩露，甚至敏感資訊被未經授權地存取。
資料投毒與竄改
惡意資料可被注入知識庫，影響輸出結果；攻擊者也可能直接篡改向量資料庫，誤導模型導致模型產生錯誤或惡意的回應。
存取控制不足
權限管理不當，或是過度分享資料，都可能讓機密資料暴露給不該存取的人。許多儲存和快取系統的保護不足，也可能導致客戶資料互相洩露。
元件暴露
許多RAG相關伺服器（如 llama.cpp、Ollama、ChromaDB）和Weaviate伺服器，未受保護地暴露於網際網路，缺乏基本的認證機制，讓攻擊者可以輕易讀取、篡改甚至刪除儲存的文件，導致機密資料外洩、服務中斷。

緩解策略

為安全部署RAG，企業可採取以下措施：

輸入過濾：掃描上傳檔案，過濾提示注入，修訂個人身份資訊（Personally Identifiable Information，PII）。
嚴格存取控制：採用角色存取控制（Role-based Access Control，RBAC）和最低權限原則，限制知識庫訪問。
資料加密：加密靜態與傳輸中的資料，探索同態加密或差分隱私等進階技術。
持續監控：即時監測異常檢索模式，快速應對威脅。
零信任原則：僅允許預批准連線，強化雲端部署安全。
紅隊演練：模擬攻擊，識別提示注入或資料投毒等弱點。
事實核查：內建自我檢查，驗證輸出準確性，減少幻覺。

結論

RAG技術為AI帶來革命性進步已廣泛應用於智慧客服、企業知識搜尋與金融報告生成等領域；但其安全挑戰不容忽視。從模型越獄到元件暴露，企業需採取多層次策略，結合嚴格驗證、加密、監控與零信任原則，才能在釋放RAG潛力的同時，保護資料與系統安全。隨著AI技術演進，持續審計與客製化安全方案將是成功關鍵。未來，如何設計具備內建風險意識的RAG架構，將成為安全AI系統的關鍵指標。

封面圖片來源：本文作者以AI 生成（ChatGPT）

參考資料來源：

邁向代理式 AI 之路：暴露在外的基石
 https://www.trendmicro.com/zh_tw/research/24/k/agentic-ai.html
【臺灣資安大會直擊】LLM從訓練資料蒐集到投入應用階段都有風險，專家盤點4大類13種攻擊手法
 https://www.ithome.com.tw/news/168752
AI本地部署的天坑？RAG曝出重大安全漏洞
 https://www.secrss.com/articles/78300
Security Risks with RAG Architectures
https://ironcorelabs.com/security-risks-rag/
UNDERSTANDING AND MITIGATING RISKS OF GENERATIVE AI
IN FINANCIAL SERVICES
https://assets.bbhub.io/company/sites/51/2025/04/arXiv-Understanding-and-Mitigating-Risks-of-Generative-AI-in-Financial-Services-FINAL-4-25-25.pdf

安全與創新如何兼得？RAG技術面臨釋放AI潛力與應對安全兩大挑戰

安全與創新如何兼得？RAG技術面臨釋放AI潛力與應對安全兩大挑戰