オープンソースの負荷テスト ツールである Locust は、HTTP およびその他のプロトコルの負荷テストによく使用されるフレームワークです。開発者に優しいアプローチにより、通常の Python コードでテストを定義できます。
Locust テストは、コマンド ラインまたは Web ベースの UI を使用して実行できます。スループット、応答時間、エラーはリアルタイムで表示したり、後の分析のためにエクスポートしたりできます。
https://docs.locust.io/en/stable/what-is-locust.html
このコード リポジトリでは、実稼働要件を評価するために LLM API で負荷テストを実行する方法の例を提供します。コードは SageMaker Notebook 内で開発され、コマンド ライン インターフェイスを利用して SageMaker と Bedrock LLM API の両方で負荷テストを実施します。
locustfile.py が適切に構成されたら、コマンド ラインでコマンドを実行して負荷テストを開始できます。これにより、特定の要件に応じて、さまざまなレベルのスループットでシステムをテストできます。
locust --headless --users 30 --spawn-rate 30 --run-time 120 --csv ./benchmark_metric/benchmark_u30
タイプ | 名前 | # 件の要求 | # 失敗します | 平均 | 分 | マックス | メッド | 要求/秒 | 失敗/秒 |
---|---|---|---|---|---|---|---|---|---|
[送信] | プロンプト | 390 | 0 (0.00%) | 9232 | 2037年 | 10282 | 9800 | 3.25 | 0.00 |
集約された | 390 | 0 (0.00%) | 9232 | 2037年 | 10282 | 9800 | 3.25 | 0.00 |
sagemaker_jumpstart_loadtest.ipynb
を使用して SageMaker モデルを負荷テストし、 bedrock_loadtest.ipynb
を使用して Bedrock モデルを負荷テストする例を参照してください。
詳細については、「貢献」を参照してください。
このライブラリは、MIT-0 ライセンスに基づいてライセンスされています。 LICENSE ファイルを参照してください。