W&B の モデル Artifacts を NVIDIA NeMo Inference Microservice (NIM) にデプロイします。これを行うには、W&B Launch を使用します。W&B Launch は、モデル Artifacts を NVIDIA NeMo Model に変換し、実行中の NIM/Triton サーバーにデプロイします。 W&B Launch は現在、以下の互換性のあるモデルタイプを受け入れています。Documentation Index
Fetch the complete documentation index at: https://wb-21fd5541-update-training-api-26.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
デプロイ時間は、モデルやマシンのタイプによって異なります。ベースの Llama2-7b 設定では、Google Cloud の
a2-ultragpu-1g で約1分かかります。Quickstart
-
まだ作成していない場合は、 Launch キューを作成 してください。以下にキュー設定の例を示します。

-
プロジェクト 内にこのジョブを作成します。
-
GPU マシンで エージェント を起動します。
-
Launch UI から、希望の設定でデプロイ用の Launch ジョブを送信します。
- CLI から送信することも可能です。

- CLI から送信することも可能です。
-
Launch UI でデプロイ プロセスの進行状況を追跡できます。

-
完了したら、すぐにエンドポイントに curl を実行して モデル をテストできます。モデル 名は常に
ensembleになります。