Chapter 5

模型選型與成本觀念:速度 / 品質 / 價格 / 上下文長度

選模型不是挑最強,而是挑最合適。這章教你用可落地的方式取捨。

四維度評估框架

實務選型建議(先能用再優化)

常見取捨策略

把模型取捨拆成可執行的決策卡。先看主策略,再看適用時機與升級路徑。

Practical Playbook
速度優先 / 成本優先

策略 A:預設小模型

先用快、便宜的模型把大多數請求吃掉,只有不夠穩的案例才升級。

  • 適合客服、FAQ、常見查詢這種高頻低風險任務。
  • 若信心不足、品質不達標,再升級大模型重跑。
任務拆分 / 職責分工

策略 B:雙模型管線

讓便宜模型負責分類與路由,昂貴模型只處理真正需要生成與推理的部分。

模型 1:分類 / 路由 模型 2:生成 / 推理
  • 適合工作流明確、步驟可拆的產品。
  • 可以同時兼顧成本控管與整體品質穩定度。
正確性優先 / 降低幻覺

策略 C:先檢索再生成(RAG)

先把資料找出來,再要求模型整理回答,讓輸入更精準、上下文更乾淨。

  • 降低幻覺,同時避免無意義的長輸入。
  • 適合知識庫問答、文件查詢、內部資料輔助決策。

成本控制清單

1 分鐘小測驗

Q:如果你的產品需要「快速回應 + 控成本」,優先策略是?