速度優先 / 成本優先
策略 A:預設小模型
先用快、便宜的模型把大多數請求吃掉,只有不夠穩的案例才升級。
- 適合客服、FAQ、常見查詢這種高頻低風險任務。
- 若信心不足、品質不達標,再升級大模型重跑。
選模型不是挑最強,而是挑最合適。這章教你用可落地的方式取捨。
把模型取捨拆成可執行的決策卡。先看主策略,再看適用時機與升級路徑。
先用快、便宜的模型把大多數請求吃掉,只有不夠穩的案例才升級。
讓便宜模型負責分類與路由,昂貴模型只處理真正需要生成與推理的部分。
先把資料找出來,再要求模型整理回答,讓輸入更精準、上下文更乾淨。
Q:如果你的產品需要「快速回應 + 控成本」,優先策略是?