Claude API & Claude Code 活用
0 / 6 完了
(0%)
LESSON 06
/ 06
本番運用:エラー処理・レート制限・モニタリング

本コースの最終レッスンでは、Claude API を本番環境で安定稼働させるための実務知識をまとめます。
主要なエラー種別
- 400 Bad Request:パラメータ誤り。入力検証で防ぐ
- 401 Unauthorized:APIキー誤り。シークレット管理を確認
- 429 Rate Limit:レート制限超過。リトライ必要
- 500 系:Anthropic 側障害。指数バックオフでリトライ
- 529 Overloaded:負荷集中。少し待ってリトライ
リトライ戦略
import time
from anthropic import Anthropic, APIStatusError
client = Anthropic()
def call_with_retry(messages, max_retries=5):
for attempt in range(max_retries):
try:
return client.messages.create(
model="claude-sonnet-4-5",
max_tokens=1024,
messages=messages,
)
except APIStatusError as e:
if e.status_code in (429, 500, 502, 503, 504, 529):
wait = 2 ** attempt # 指数バックオフ
time.sleep(wait)
continue
raise
raise RuntimeError("max retries exceeded")
公式SDKは内部でリトライを実装しているため、追加処理は最小限でもOKです。
レート制限の理解
Claude API のレート制限は3つの軸:
- RPM:Requests per minute(1分あたりリクエスト数)
- ITPM:Input tokens per minute
- OTPM:Output tokens per minute
使用ティアごとに上限が異なり、利用実績に応じて自動昇格します。
モニタリングの基本指標
- リクエスト数(成功/失敗)
- p50・p95・p99 レイテンシ
- トークン使用量(入力・出力・キャッシュ)
- 1リクエストあたりコスト
- エラー率(種別ごと)
Anthropic Console でも基本メトリクスは確認できますが、本番ではDatadog/Grafanaなどへ統合が推奨です。
コスト暴走を防ぐ仕組み
- Console で月次予算アラートを設定
- ユーザーごとの使用上限をアプリ側でも実装
- 長すぎる会話履歴を自動切り詰め
- キャッシュヒット率を監視(70%以上が目安)
コース修了おめでとうございます
本コース「Claude API & Claude Code 活用」はこれで完了です。プロンプトエンジニアリング・API活用・エージェント構築・運用設計まで、実務で必要な全領域を一通りカバーしました。あとは作りたいプロダクトを定め、手を動かすのみです。
やってみよう(演習)
- 指数バックオフのリトライを実装する
- 1リクエストあたりコストを計測する
- 簡易ダッシュボード(Console確認+自前ログ)を整備する
到達度チェックリスト
- 主要エラー(429/500/529)への対処を実装できる
- RPM/ITPM/OTPM の意味を説明できる
- 予算アラートを設定した
よくある失敗パターン
- リトライをしないため、一時的な 529 エラーで処理が止まる
- コスト監視を後回しにして、月末に巨額請求が来る
- ユーザー単位のレート制限を実装せず、特定ユーザーが API 配分を独占する
よくある質問(Q&A)
Q. 公式 SDK のリトライ機能で十分ですか?
A. 基本的には十分です。SDK が指数バックオフで自動リトライします。独自要件があれば追加実装を。
Q. コストアラートの推奨閾値は?
A. 月予算の 50% / 80% / 100% の3段階が標準的。100% で自動停止する仕組みも検討を。
Q. ユーザーごとのレート制限はどう実装しますか?
A. Redis 等のカウンタで「ユーザーID + 時間窓」を管理する典型的な token bucket / sliding window 方式が有効です。
よくある質問
この記事に関連する質問と答えをまとめました。
Q.本番運用で最初に対応すべき項目は?
A.
エラー処理(リトライ・指数バックオフ)、レート制限の対応、監視・ロギング、コスト管理、フォールバック戦略の5点です。これらが揃わないまま本番投入すると、ほぼ確実に障害を起こします。
Q.Anthropic API の障害対応は?
A.
Anthropic の status.anthropic.com で稼働状況を確認できます。サーキットブレーカ・リトライ・他モデルや他ベンダーへのフォールバックを実装しておくのが定石です。
理解度チェック(クイズ)
このレッスンの理解度を確認してみましょう。全問終わると最高記録が保存されます。
読み込み中…