Agent-era prompting
模型越能自主執行,
任務邊界越要清楚。
社群流傳的「Fable 5 Prompt」圖像把提示詞拆成 Context、Request、Output Format、Constraints 與 Checkpoint。這不是已獲 Anthropic 證實的內部格式,但它點出一個實用方向:對 Claude、Codex 或其他能使用工具、跨多步驟工作的 Agent 而言,價值不在堆疊角色設定或教它逐句思考,而在把目標、可用資訊、交付物、邊界與停點說清楚。靈感來源:RealCodedAlpha 原始貼文
01
五個部分是一份最小任務契約
Context 讓模型理解「為誰、在什麼情境、已知什麼」;Request 用清楚動詞定義要完成的工作;Output Format 把結果變成可驗收的交付物;Constraints 指出不能假設、不能更動與不能跨越的界線;Checkpoint 則把必須交回人類判斷的時機寫成明確條件。這五部分的作用不是增加篇幅,而是減少模型必須自行猜測的空間。
OpenAI 的 Agent 指南同樣把 instructions 與 guardrails 視為基礎元件,並指出清楚、結構化的指令能減少歧義;Anthropic 則建議先採用最簡單、可組合的模式,只在任務真的需要時才增加複雜度。參考:OpenAI · A practical guide to building agents、Anthropic · Building effective agents
02
任務邊界決定 Agent 可以自主到哪裡
強模型可以自己規劃步驟、選擇工具、從錯誤中修正並持續執行,但「能決定怎麼做」不等於「可以自行改變要做什麼」。一份好的 prompt 應區分目標與手段:目標、不可跨越的範圍、可使用的資料與驗收標準由人定義;範圍內可逆、低風險的實作細節,才交給 Agent 自主處理。
清楚的邊界不是限制模型能力,而是把自主權放在正確的位置。
Anthropic 將 Agent 描述為能動態主導流程與工具使用的系統:任務清楚後,它可以獨立規劃與操作,並根據工具結果或程式執行等環境證據判斷進度。NIST AI RMF 也要求明確記錄目標使用範圍、human-AI 角色、監督責任與風險容忍度。參考:Anthropic · Building effective agents、NIST · AI RMF Core
03
Checkpoint 是停車線,不是每一步的報到
Checkpoint 應該回答:「發生什麼情況時,Agent 必須先停下來取得我的決定?」條件越具體,Agent 越能在安全範圍內持續工作。若只寫「有問題就問我」,模型可能過度中斷;若完全不寫,它又可能在資訊不足或風險升高時自行猜測。
-
01
涉及不可逆或高風險操作
例如刪除資料、正式發布、付款、改變權限,或任何難以回復且會影響他人的動作。
-
02
任務範圍發生實質變化
例如必須新增原本未授權的功能、接觸新的系統,或為了完成工作而改寫原定目標。
-
03
缺少只有使用者能提供的關鍵資訊
例如業務規則、憑證、選擇偏好或無法從現有檔案與可用工具查證的決策。
OpenAI 建議對敏感、不可逆或高風險行動啟用人類監督,也可在超過重試或失敗門檻時轉交使用者;OpenAI Agents SDK 的 approval flow 則示範了「暫停、保留狀態、取得決定、從原處繼續」的實作方式。Anthropic 也明確指出 Agent 可在 checkpoint 或 blocker 才暫停。參考:OpenAI · Agent guide、OpenAI Agents SDK · Human-in-the-loop、Anthropic · Building effective agents
04
其他情況,應讓 Agent 繼續完成
可以繼續
- 範圍內、可逆的技術選擇
- 能從檔案、測試或工具查證的資訊
- 失敗後可安全重試或調整的方法
- 不改變目標的局部實作細節
必須停下
- 不可逆、敏感或影響外部狀態的行動
- 需求或授權範圍需要擴張
- 缺少只有使用者知道的關鍵決定
- 超過預先定義的失敗或重試門檻
這個區分能避免兩種極端:Agent 每做一步就停下來,讓自動化失去意義;或一路自行補假設,直到產出偏離真正目標。好的 checkpoint 同時保留速度與控制權。
05
注意:Prompt 不能取代驗證與風險控制
- 不要把 Constraints 和 Checkpoint 混在一起。前者是持續有效的邊界,後者是觸發暫停的條件。
- 不要把內部思考步驟寫成僵硬劇本。描述成果與證據,讓模型在邊界內選擇方法。
- 不要用 checkpoint 取代測試。要求程式測試、引用、檔案 diff 或可重複的驗收證據。
- 不要聲稱所有任務都能全自動。任務風險、工具權限與外部影響不同,監督強度也應不同。
Agent 會跨多輪呼叫工具並改變環境,因此錯誤可能逐步累積。Anthropic 建議用 eval 先定義成功並維持品質;NIST 也要求部署前測試、運作中監測,以及可重複的衡量與文件。換句話說,prompt 是任務契約的入口,真正可靠的執行仍要靠測試、觀察與可追溯證據。參考:Anthropic · Demystifying evals for AI agents、NIST · AI RMF Core