Claude API & Claude Code 活用
0 / 6 完了 (0%
← Claude API & Claude Code 活用
LESSON 06 / 06

本番運用:エラー処理・レート制限・モニタリング

所要時間 12分 更新: 2026年4月29日 上級レベル

本コースの最終レッスンでは、Claude API を本番環境で安定稼働させるための実務知識をまとめます。

主要なエラー種別

  • 400 Bad Request:パラメータ誤り。入力検証で防ぐ
  • 401 Unauthorized:APIキー誤り。シークレット管理を確認
  • 429 Rate Limit:レート制限超過。リトライ必要
  • 500 系Anthropic 側障害。指数バックオフでリトライ
  • 529 Overloaded:負荷集中。少し待ってリトライ

リトライ戦略

import time
from anthropic import Anthropic, APIStatusError

client = Anthropic()

def call_with_retry(messages, max_retries=5):
    for attempt in range(max_retries):
        try:
            return client.messages.create(
                model="claude-sonnet-4-5",
                max_tokens=1024,
                messages=messages,
            )
        except APIStatusError as e:
            if e.status_code in (429, 500, 502, 503, 504, 529):
                wait = 2 ** attempt  # 指数バックオフ
                time.sleep(wait)
                continue
            raise
    raise RuntimeError("max retries exceeded")

公式SDKは内部でリトライを実装しているため、追加処理は最小限でもOKです。

レート制限の理解

Claude API のレート制限は3つの軸:

  • RPM:Requests per minute(1分あたりリクエスト数)
  • ITPM:Input tokens per minute
  • OTPM:Output tokens per minute

使用ティアごとに上限が異なり、利用実績に応じて自動昇格します。

モニタリングの基本指標

  • リクエスト数(成功/失敗)
  • p50・p95・p99 レイテンシ
  • トークン使用量(入力・出力・キャッシュ)
  • 1リクエストあたりコスト
  • エラー率(種別ごと)

Anthropic Console でも基本メトリクスは確認できますが、本番ではDatadog/Grafanaなどへ統合が推奨です。

コスト暴走を防ぐ仕組み

  • Console で月次予算アラートを設定
  • ユーザーごとの使用上限をアプリ側でも実装
  • 長すぎる会話履歴を自動切り詰め
  • キャッシュヒット率を監視(70%以上が目安)

コース修了おめでとうございます

本コース「Claude API & Claude Code 活用」はこれで完了です。プロンプトエンジニアリング・API活用・エージェント構築・運用設計まで、実務で必要な全領域を一通りカバーしました。あとは作りたいプロダクトを定め、手を動かすのみです。

やってみよう(演習)

  1. 指数バックオフのリトライを実装する
  2. 1リクエストあたりコストを計測する
  3. 簡易ダッシュボード(Console確認+自前ログ)を整備する

到達度チェックリスト

  • 主要エラー(429/500/529)への対処を実装できる
  • RPM/ITPM/OTPM の意味を説明できる
  • 予算アラートを設定した

よくある失敗パターン

  • リトライをしないため、一時的な 529 エラーで処理が止まる
  • コスト監視を後回しにして、月末に巨額請求が来る
  • ユーザー単位のレート制限を実装せず、特定ユーザーが API 配分を独占する

よくある質問(Q&A)

Q. 公式 SDK のリトライ機能で十分ですか?

A. 基本的には十分です。SDK が指数バックオフで自動リトライします。独自要件があれば追加実装を。

Q. コストアラートの推奨閾値は?

A. 月予算の 50% / 80% / 100% の3段階が標準的。100% で自動停止する仕組みも検討を。

Q. ユーザーごとのレート制限はどう実装しますか?

A. Redis 等のカウンタで「ユーザーID + 時間窓」を管理する典型的な token bucket / sliding window 方式が有効です。

よくある質問

この記事に関連する質問と答えをまとめました。

Q.本番運用で最初に対応すべき項目は?
A.
エラー処理(リトライ・指数バックオフ)、レート制限の対応、監視・ロギング、コスト管理、フォールバック戦略の5点です。これらが揃わないまま本番投入すると、ほぼ確実に障害を起こします。
Q.Anthropic API の障害対応は?
A.
Anthropic の status.anthropic.com で稼働状況を確認できます。サーキットブレーカ・リトライ・他モデルや他ベンダーへのフォールバックを実装しておくのが定石です。

理解度チェック(クイズ)

このレッスンの理解度を確認してみましょう。全問終わると最高記録が保存されます。

読み込み中…