メインコンテンツまでスキップ

レート制限

現在のレート制限ポリシー

現在、当社のレート制限ルールは以下の通りです:
各ユーザーは一度に1つのリクエストしか開始できません。この制限を超えるリクエストは429エラーコードを返します。
現在のサービスは無料で利用できますが、リソースを適切に使用し、不必要な高同時リクエストは避けてください。

同時実行制限説明
ストリーミングリクエストアクティブにキャンセルされた後、トークンは即座に解放されます。効率を向上させるためにストリーミングリクエストを推奨します。
非ストリーミングリクエストアクティブにキャンセルされた後も、モデルはバックグラウンドで実行を続け、トークンは完了後にのみ解放されます。

推奨使用方法

ストリーミングリクエストを優先:ストリーミングリクエストはアクティブにキャンセルされた後、トークンを即座に解放するため、より効率的なリソース利用が可能です。