Prompt Forge｜提示詞練習工坊

Agent-era prompting

模型越能自主執行，
任務邊界越要清楚。

社群流傳的「Fable 5 Prompt」圖像把提示詞拆成 Context、Request、Output Format、Constraints 與 Checkpoint。這不是已獲 Anthropic 證實的內部格式，但它點出一個實用方向：對 Claude、Codex 或其他能使用工具、跨多步驟工作的 Agent 而言，價值不在堆疊角色設定或教它逐句思考，而在把目標、可用資訊、交付物、邊界與停點說清楚。靈感來源：RealCodedAlpha 原始貼文

五個部分是一份最小任務契約

Context 讓模型理解「為誰、在什麼情境、已知什麼」；Request 用清楚動詞定義要完成的工作；Output Format 把結果變成可驗收的交付物；Constraints 指出不能假設、不能更動與不能跨越的界線；Checkpoint 則把必須交回人類判斷的時機寫成明確條件。這五部分的作用不是增加篇幅，而是減少模型必須自行猜測的空間。

Context提供必要背景，不傾倒無關資料。

Request說清楚要完成什麼，而非只描述主題。

Output定義格式、篇幅、欄位與驗收方式。

Constraints界定不可假設、不可更動與禁止事項。

Checkpoint只保留需要人類裁決的停點。

OpenAI 的 Agent 指南同樣把 instructions 與 guardrails 視為基礎元件，並指出清楚、結構化的指令能減少歧義；Anthropic 則建議先採用最簡單、可組合的模式，只在任務真的需要時才增加複雜度。參考：OpenAI · A practical guide to building agents、Anthropic · Building effective agents

任務邊界決定 Agent 可以自主到哪裡

強模型可以自己規劃步驟、選擇工具、從錯誤中修正並持續執行，但「能決定怎麼做」不等於「可以自行改變要做什麼」。一份好的 prompt 應區分目標與手段：目標、不可跨越的範圍、可使用的資料與驗收標準由人定義；範圍內可逆、低風險的實作細節，才交給 Agent 自主處理。

清楚的邊界不是限制模型能力，而是把自主權放在正確的位置。

Anthropic 將 Agent 描述為能動態主導流程與工具使用的系統：任務清楚後，它可以獨立規劃與操作，並根據工具結果或程式執行等環境證據判斷進度。NIST AI RMF 也要求明確記錄目標使用範圍、human-AI 角色、監督責任與風險容忍度。參考：Anthropic · Building effective agents、NIST · AI RMF Core

Checkpoint 是停車線，不是每一步的報到

Checkpoint 應該回答：「發生什麼情況時，Agent 必須先停下來取得我的決定？」條件越具體，Agent 越能在安全範圍內持續工作。若只寫「有問題就問我」，模型可能過度中斷；若完全不寫，它又可能在資訊不足或風險升高時自行猜測。

01
涉及不可逆或高風險操作
例如刪除資料、正式發布、付款、改變權限，或任何難以回復且會影響他人的動作。
02
任務範圍發生實質變化
例如必須新增原本未授權的功能、接觸新的系統，或為了完成工作而改寫原定目標。
03
缺少只有使用者能提供的關鍵資訊
例如業務規則、憑證、選擇偏好或無法從現有檔案與可用工具查證的決策。

OpenAI 建議對敏感、不可逆或高風險行動啟用人類監督，也可在超過重試或失敗門檻時轉交使用者；OpenAI Agents SDK 的 approval flow 則示範了「暫停、保留狀態、取得決定、從原處繼續」的實作方式。Anthropic 也明確指出 Agent 可在 checkpoint 或 blocker 才暫停。參考：OpenAI · Agent guide、OpenAI Agents SDK · Human-in-the-loop、Anthropic · Building effective agents

其他情況，應讓 Agent 繼續完成

可以繼續

範圍內、可逆的技術選擇
能從檔案、測試或工具查證的資訊
失敗後可安全重試或調整的方法
不改變目標的局部實作細節

必須停下

不可逆、敏感或影響外部狀態的行動
需求或授權範圍需要擴張
缺少只有使用者知道的關鍵決定
超過預先定義的失敗或重試門檻

這個區分能避免兩種極端：Agent 每做一步就停下來，讓自動化失去意義；或一路自行補假設，直到產出偏離真正目標。好的 checkpoint 同時保留速度與控制權。

注意：Prompt 不能取代驗證與風險控制

不要把 Constraints 和 Checkpoint 混在一起。前者是持續有效的邊界，後者是觸發暫停的條件。
不要把內部思考步驟寫成僵硬劇本。描述成果與證據，讓模型在邊界內選擇方法。
不要用 checkpoint 取代測試。要求程式測試、引用、檔案 diff 或可重複的驗收證據。
不要聲稱所有任務都能全自動。任務風險、工具權限與外部影響不同，監督強度也應不同。

Agent 會跨多輪呼叫工具並改變環境，因此錯誤可能逐步累積。Anthropic 建議用 eval 先定義成功並維持品質；NIST 也要求部署前測試、運作中監測，以及可重複的衡量與文件。換句話說，prompt 是任務契約的入口，真正可靠的執行仍要靠測試、觀察與可追溯證據。參考：Anthropic · Demystifying evals for AI agents、NIST · AI RMF Core

把模糊需求，整理成
模型能執行的提示詞。

建立你的提示詞

載入完整範例

先說明背景是什麼

模型到底要完成什麼

結果要怎麼交付

哪些不能假設、不能越界

什麼時候該停下來問你

模型越能自主執行，
任務邊界越要清楚。

五個部分是一份最小任務契約

任務邊界決定 Agent 可以自主到哪裡

Checkpoint 是停車線，不是每一步的報到

其他情況，應讓 Agent 繼續完成

注意：Prompt 不能取代驗證與風險控制

把模糊需求，整理成模型能執行的提示詞。

建立你的提示詞

載入完整範例

先說明背景是什麼

模型到底要完成什麼

結果要怎麼交付

哪些不能假設、不能越界

什麼時候該停下來問你

五個部分是一份最小任務契約

任務邊界決定 Agent 可以自主到哪裡

Checkpoint 是停車線，不是每一步的報到

其他情況，應讓 Agent 繼續完成

注意：Prompt 不能取代驗證與風險控制

把模糊需求，整理成
模型能執行的提示詞。