サブエージェント8個で20万トークン溶かした話──Claude Code失敗談

サブエージェントを8個並べれば最強のAIライティングシステムができる──そう信じていた時期が私にもありました。

結果は1セッション20万トークン消費という惨劇でした。

この記事では、なぜそうなったのか、どう改善したのかを包み隠さずお伝えします。

サブエージェント8個、壮大な失敗の始まり

Claude Codeでブログ執筆システムを構築しようとしていました。

「専門家を増やせば品質が上がるはずだ」という安易な発想で、以下の8個のサブエージェントを用意しました。

  • interviewer: ヒアリング担当
  • seo-strategist: SEO戦略立案
  • outline-planner: 見出し構成設計
  • ghostwriter: 記事執筆
  • editor: 編集・校正
  • fact-checker: 事実確認
  • critic: 批評・改善提案
  • summarizer: 要約生成

一見すると完璧な布陣です。

それぞれが専門性を発揮して、高品質な記事が生まれる予定でした。

トークン爆発の数字──通常3〜5万が20〜30万に

現実は厳しいものでした。

通常なら3〜5万トークンで済む記事執筆が、20〜30万トークンに膨れ上がったのです。

コストにして5〜8倍の増加です。

しかも、レスポンスは遅く、途中で何をやっているか分からなくなる。

「考えている感」だけが残る地獄でした。APIコストを見るたびに胃が痛くなりました。

爆発の3大原因を特定した

原因を調査した結果、3つの問題が見つかりました。

原因1:全エージェントに全文コンテキストを渡していた

これが最大の元凶でした。interviewerの結果をseo-strategistに渡す。

seo-strategistの結果とinterviewerの結果をoutline-plannerに渡す。

さらにその全部をghostwriterに渡す──。同じ文脈を何度も読み直させていたのです。

原因2:受け渡しが多すぎた

8個のエージェント間で情報を受け渡すたびに、コンテキストが膨張していきました。

N個のエージェントがあれば、最悪N×(N-1)/2回の受け渡しが発生します。

原因3:レビューループの指数関数的増加

critic→editor→criticのようなレビューループを設けたところ、修正のたびにトークンが積み上がっていきました。

3回のループで3倍ではなく、コンテキストが蓄積するので指数関数的に増加します。

対策①:サブエージェント数を減らす

7〜8個から2〜3個に削減しました。常駐させるのはinterviewerとghostwriter程度です。

「でも、それで品質は下がらないの?」と思われるかもしれません。

実際には、役割が分散しすぎると各エージェントの出力がぼやけます。

1つのエージェントに明確な役割を与えた方が、むしろ精度が上がりました。

※今は結果的には5つになりましたが、最初は2-3から始めるのがよいでしょう。

対策②:スキルに置き換える

これは最近の話なんですが、fact-checkerやsummarizerのような定型作業は、サブエージェントではなくスキルに置き換えました。

スキルとは、特定のタスクを実行する軽量な仕組みです。

サブエージェントのように独立したコンテキストを持たないため、トークン消費を抑えられます。

詳しくはサブエージェントに何を任せて何を任せないかで解説しています。

「それ、本当に考えさせたい作業?」──この問いを挟むだけで、サブエージェントにすべきかスキルにすべきか判断できます。

対策③:コンテキストの渡し方を変える

全文を渡すのをやめました。

代わりに以下のルールを設けています。

  • 要点だけ箇条書きで渡す: 前のエージェントの出力を全文ではなく、要約した形で渡す
  • 「今回見てほしい部分」を明示: 何を判断してほしいのか、どこをチェックしてほしいのかを具体的に指示
  • 不要な履歴は切り捨てる: 3ステップ前の情報が本当に必要か常に問い直す

CLAUDE.mdの育て方でも触れていますが、コンテキスト管理はAI開発の要です。

渡す情報を絞ることで、トークン消費だけでなく精度も向上しました。

結論:適切なサブエージェント数の目安

私の経験から導いた目安は以下の通りです。

  • 常時稼働: 1〜2個
  • 最大でも: 3〜5個

たぶんですが、よくある作業の場合は、それ以上は思考が分散し、文脈が汚れ、コストが跳ねます。

サブエージェントを増やしたくなったら、まず「それ、本当に考えさせたい作業?」と自問してください。

定型チェックならスキルで十分です。

レビューループを入れるなら、1回で済むよう指示を明確にしてください。

結果として、トークン消費は70〜80%削減できました。

Claude API/Pro/Maxのコスト最適化と組み合わせれば、さらに効率的な運用が可能だと思います。

同じ失敗をする人が一人でも減れば、参考になれば幸いです。

参考文献