ひとことで言うと
単位時間あたりに API を呼べる回数の制限。
レート制限は、一定時間内にAPIを呼び出せる回数や量に上限を設ける仕組みです。サーバへの過剰なアクセスを防ぎ、すべての利用者が安定してサービスを使えるようにするための保護策で、ほとんどの商用APIに設定されています。上限を超えると、一時的にエラー(多くは「429」という応答)が返されます。
ClaudeなどのAI APIにも、1分あたりのリクエスト数や処理できるトークン量に制限があります。大量のデータを一気に処理しようとすると上限に当たりやすいため、実務では少し待って再試行する「指数バックオフ」や、リクエストを分割・間引く工夫が使われます。制限値はプランや契約によって引き上げられることが多いので、規模が大きい用途では事前に上限を確認しておくと安心です。