Chapter 3

LLM、Embedding 與 RAG：為 agent 建立可靠上下文

LLM 負責「說」，embedding 負責「找」，RAG 則把找到的資料固定成 prompt，這樣 agent 才不會憑空回答。

← 回章節導覽第 1 章第 2 章第 3 章第 4 章第 5 章第 6 章第 7 章第 8 章第 9 章第 10 章

對話復刻：LLM 是 embedding 嗎？

你問：「LLM 本身就是 embedding 嗎？」這是很多初學者的直覺。

LLM 的訓練目標像是 next token prediction 或 instruction following，它的輸出是一段文字；embedding 的訓練則專注在把文字映射為高維向量，方便用距離表示語意接近度。

LLM 擅長生成與推理，embedding 擅長比較與檢索。Embedding 不會自己寫答案，LLM 不會自動找資料，兩者合作時才能做出有根據的回覆。

能力	LLM（說）	Embedding（找）
輸出	文字 + 機率分布	高維向量
用途	理解指令、生成答案、改寫與推理	語意搜尋、相似度比較、索引文檔
在 agent 流程的角色	把檢索到的內容整理成自然語言回答	把 md 文件庫和問題轉成座標，被用來找最 relevant 的段落

LLM 只是根據機率推測下一句，如果沒有真實的上下文就容易憑空補完，造成幻覺。
RAG 讓 agent 先用 embedding 對 md 文件庫做 semantic search，找到最 relevant 的段落，再把這些段落塞進 prompt。
LLM 會「看到真實資料」再回答，有了來源，它就比較少憑空猜。這是把 uncertainty 降為可驗證 context 的過程。
因此 agent 的 prompt 可以加上限制：「只用這些段落回答，並標註來源」，進一步壓低無根據回覆的機率。

embedding 負責找資料、LLM 負責說話，RAG 是兩者的協作流程。

LLM 是說話的模型、embedding 是找資料的表示法，RAG 把找到的資料固定成 prompt；在你的 Markdown 文件庫裡，這樣的分工就能讓 agent 回答更有根據。

Q：在 RAG 流程裡，embedding 最主要的工作是什麼？