レート制限
現在のレート制限ポリシー
現在、当社のレート制限ルールは以下の通りです:
各ユーザーは一度に1つのリクエストしか開始できません。この制限を超えるリクエストは429エラーコードを返します。
現在のサービスは無料で利用できますが、リソースを適切に使用し、不必要な高同時リクエストは避けてください。
同時実行制限 | 説明 |
---|---|
ストリーミングリクエスト | アクティブにキャンセルされた後、トークンは即座に解放されます。効率を向上させるためにストリーミングリクエストを推奨します。 |
非ストリーミングリクエスト | アクティブにキャンセルされた後も、モデルはバックグラウンドで実行を続け、トークンは完了後にのみ解放されます。 |
推奨使用方法
ストリーミングリクエストを優先:ストリーミングリクエストはアクティブにキャンセルされた後、トークンを即座に解放するため、より効率的なリソース利用が可能です。