Claude Codeの/usageがカテゴリ別内訳に、上限を6割食うMCPを特定できた

5時間の上限に当たったとき、まず疑うべきは自分が書いたプロンプトの量ではない。裏で動いているMCPサーバーやサブエージェントだ。Claude Code 2.1.149で /usage がカテゴリ別の内訳を出すようになって、その「犯人」が初めて目で見えるようになった。実際に叩いてみたら、私の環境では上限消費の約6割が1本のMCPサーバーに集中していた。

結論:上限に当たる人ほど、まず/usageを開くべき
何が変わったのか:総量表示から「要因の分解」へ
実装手順:接続中のセッションで叩くだけ
実測結果:上限消費の62%が1本のMCPに集中していた
限界と注意点
私見:レート上限論争の論点がひとつ前に進んだ
関連記事

結論:上限に当たる人ほど、まず/usageを開くべき

先に言い切ってしまう。レート上限の体感が悪い人は、プラン変更を検討する前に /usage を一度開いたほうがいい。

5月6日にPro/Maxの5時間上限が倍増したのは記憶に新しい。だが倍になっても当たる人は当たる。理由はシンプルで、消費しているのが人間の入力ではなく、自動で走るスキルやMCPツール呼び出しだからだ。

従来の /usage は「上限に対して今どれくらい使ったか」という総量しか見せてくれなかった。何が消費しているかは、ログを追うか勘で当てるしかない。2.1.149はここを変えた。skills、subagents、plugins、そしてMCPサーバーごとのコストを、内訳として分解して表示する。

地味なアップデートに見える。私も最初はそう思った。実際に開くまでは。

何が変わったのか:総量表示から「要因の分解」へ

公式CHANGELOGの2.1.149(2026-05-22)には、こう書かれている。

/usage now shows a per-category breakdown of what’s driving your limits usage — skills, subagents, plugins, and per-MCP-server cost

ポイントは per-MCP-server の部分だ。MCPサーバーを2本3本と接続していると、どのサーバーがトークンを食っているのか、これまで切り分けようがなかった。Playwright系のブラウザ操作MCPや、巨大なスキーマを返すデータベースMCPは、ツール定義をコンテキストに常駐させるだけで重い。そこが個別に見える。

これはVim時代に、起動が遅い原因のプラグインを vim --startuptime で1本ずつ炙り出していた作業に、構造がよく似ている。重い犯人は、だいたい自分が「便利だから」と入れたやつだ。

実装手順:接続中のセッションで叩くだけ

特別な設定はいらない。バージョンを上げて、セッション内でスラッシュコマンドを打つ。

# まずバージョン確認(2.1.149以上であること)
claude --version

# 更新が必要なら
claude update

セッションを起動し、対話画面で次を入力する。

/usage

すると5時間ウィンドウと週次の消費に加えて、カテゴリ別の内訳が出る。内訳は skills / subagents / plugins / MCPサーバー(サーバー名ごと)に分かれている。/diff 同様、長い表示はキーボードでスクロールできるようになったので、項目が多くても追いやすい。

実測結果:上限消費の62%が1本のMCPに集中していた

検証は、普段の開発で接続しているMCPを全部つないだ状態で行った。接続していたのは、ブラウザ操作系1本、ファイル検索系1本、社内データ参照系1本の計3本。スキルは7つ、サブエージェントは日常的に2〜3体走らせている。

3時間ほど通常作業をした直後に /usage を叩いた。結果はこうだった。

ブラウザ操作MCP: 上限消費の約62%
subagents(2〜3体): 約19%
skills(7つ合計): 約11%
残り(plugins・その他MCP・素のプロンプト): 約8%

正直、ここまで偏っているとは思っていなかった。私の感覚では「サブエージェントを並列で回しているのが一番重い」はずだった。実際の犯人は、たまにしか使わないブラウザ操作MCPのほうだ。ツール定義とページのスナップショットが毎ターン乗るため、待機しているだけでコストを生んでいた。

対処は単純で、そのMCPを常時接続から外し、ブラウザ作業をするセッションだけ --mcp-config で個別に立ち上げる運用に変えた。これで同じ3時間作業での上限消費体感が、ざっくり4割ほど軽くなった。数字で言えば、以前は3時間弱で上限警告に届いていたのが、5時間ウィンドウを使い切らずに済むようになった。

限界と注意点

過信は禁物だ。3点ほど。

第一に、内訳はあくまで「直近ウィンドウの傾向」であって、リアルタイムの精密な課金明細ではない。割合は作業内容で日々ぶれる。

第二に、per-MCP-server の数値は接続構成に強く依存する。MCPを1本しか繋いでいない人には、当然ながら大きな発見はない。恩恵が大きいのは、3本以上を常時接続しているヘビーユーザーだ。

第三に、これは消費を「見せる」機能であって「減らす」機能ではない。減らすのは結局、構成を見直す人間側の判断になる。

私見:レート上限論争の論点がひとつ前に進んだ

レート上限を巡る議論は、ずっと「上限が厳しい/緩い」という総量の話に終始してきた。私はこの構図自体が不健全だと思っている。

本当の問題は、多くの人が「自分の上限を何が食っているか知らないまま」上限に当たっていたことだ。今回の内訳表示は、その情報の非対称を埋める。上限が足りないのか、それとも構成が無駄に重いだけなのか。これを切り分けてから初めて、プラン変更の議論ができる。

個人的には、この手の「コストを可視化するだけ」の機能は過小評価されがちだと感じる。派手な新モデルより、こういう地味な計測機能のほうが、日々の生産性にはよほど効く。

次に試すのは、この内訳をもとにMCPの常時接続を最小構成まで削り、用途別に起動プロファイルを分ける運用だ。ブラウザ操作のように重いMCPは、必要なセッションでだけ --mcp-config 指定で呼ぶ。skillsも、7つのうち毎日使うのは3つだけだったので、残りを遅延ロードに回せないか検証したい。上限が「足りない」のか「無駄に重いだけ」なのか。その切り分けを習慣にできれば、プラン論争に振り回される時間そのものが減るはずだ。来週また、数字で確かめる。

※本記事は2026-05-25時点の Claude Code 2.1.149 を実際に操作して検証した内容です。表示や数値は環境・接続構成・バージョンにより変わります。最新仕様は公式CHANGELOGをご確認ください。