
【CCA Foundations対策 / Claude API編 #13】エスカレーションと反復改善——自律解決の判断設計
エージェントがいつ自律解決してよくいつ人間にエスカレーションすべきかの判断基準を解説。ポリシーギャップを唯一の確実なエスカレーション基準として捉え、evaluator-optimizerパターンによる自己評価と複数懸念事項の並列処理設計まで。CCA試験Domain 1をカバー。
続きを読む →$ ls blog/tag/
3件の記事

エージェントがいつ自律解決してよくいつ人間にエスカレーションすべきかの判断基準を解説。ポリシーギャップを唯一の確実なエスカレーション基準として捉え、evaluator-optimizerパターンによる自己評価と複数懸念事項の並列処理設計まで。CCA試験Domain 1をカバー。
続きを読む →
マルチエージェントシステムの信頼性を高める2つの設計パターンを解説。lost-in-the-middle対策(primacy effect・verbose output削減)と情報のprovenance管理(conflict annotation・coverage注釈・構造化エラー伝播)。CCA試験Domain 1・Domain 5をカバー。
続きを読む →
Claude Codeのセッション管理(--resume・fork_session・named sessions・context isolation)とconfidence scoringの設計パターンを解説。長期タスクの中断・再開、並行探索、信頼スコアのキャリブレーションとstratified samplingによるエラーレート計測。CCA試験Domain 3・Domain 5をカバー。
続きを読む →