다음 페이지에서는 Launch 큐 옵션을 설정하는 방법에 대해 설명합니다.Documentation Index
Fetch the complete documentation index at: https://wb-21fd5541-update-training-api-26.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
Queue Config Templates 설정하기
Queue Config Templates를 사용하여 컴퓨팅 소비에 대한 가드레일을 관리하고 관리하세요. 메모리 소비, GPU, 런타임 기간과 같은 필드에 대해 기본값, 최소값 및 최대값을 설정할 수 있습니다. 설정 템플릿을 사용하여 큐를 구성하면, 팀의 멤버는 사용자가 정의한 특정 범위 내에서만 필드를 변경할 수 있습니다.큐 템플릿 구성하기
기존 큐에서 템플릿을 구성하거나 새 큐를 생성할 수 있습니다.- W&B Launch 앱으로 이동합니다.
- 템플릿을 추가하려는 큐 이름 옆의 View queue를 선택합니다.
- Config 탭을 선택합니다. 여기에서 큐가 생성된 시기, 큐 설정, 기존의 launch-time 재정의(overrides)와 같은 정보를 볼 수 있습니다.
- Queue config 섹션으로 이동합니다.
- 템플릿을 생성하려는 설정 키-값(key-values)을 식별합니다.
- 설정의 값을 템플릿 필드로 바꿉니다. 템플릿 필드는
{{variable-name}}형식을 취합니다. - Parse configuration 버튼을 클릭합니다. 설정을 파싱하면, W&B는 생성된 각 템플릿에 대해 큐 설정 아래에 자동으로 타일을 생성합니다.
- 생성된 각 타일에 대해, 먼저 큐 설정이 허용할 수 있는 데이터 타입(string, integer 또는 float)을 지정해야 합니다. 이를 위해 Type 드롭다운 메뉴에서 데이터 타입을 선택합니다.
- 데이터 타입에 따라 각 타일 내에 나타나는 필드를 완성합니다.
- Save config를 클릭합니다.
launch config
InstanceType에 대한 템플릿 필드를 추가하면 설정은 다음과 같이 바뀝니다.
launch config
aws-instance라는 라벨이 붙은 새 타일이 나타납니다.
거기서 Type 드롭다운의 데이터 타입으로 String을 선택합니다. 그러면 사용자가 선택할 수 있는 값을 지정할 수 있는 필드가 채워집니다. 예를 들어, 다음 이미지에서 팀의 관리자는 사용자가 선택할 수 있는 두 가지 AWS 인스턴스 유형(ml.m4.xlarge 및 ml.p3.xlarge)을 설정했습니다.

Launch 잡 동적 구성하기
큐 설정은 에이전트가 큐에서 잡을 꺼낼 때(dequeue) 평가되는 매크로를 사용하여 동적으로 구성할 수 있습니다. 다음 매크로를 설정할 수 있습니다.| 매크로 | 설명 |
|---|---|
${project_name} | Run 이 실행되는 Project 의 이름입니다. |
${entity_name} | Run 이 실행되는 Project 의 소유자입니다. |
${run_id} | 실행되는 Run 의 ID입니다. |
${run_name} | 실행 중인 Run 의 이름입니다. |
${image_uri} | 이 Run 을 위한 컨테이너 이미지의 URI입니다. |
앞의 표에 나열되지 않은 커스텀 매크로(예:
${MY_ENV_VAR})는 에이전트의 환경에서 가져온 환경 변수로 대체됩니다.가속기(GPU)에서 실행되는 이미지를 빌드하기 위해 Launch 에이전트 사용하기
가속기 환경에서 실행되는 이미지를 빌드하기 위해 Launch 를 사용하는 경우 가속기 베이스 이미지를 지정해야 할 수도 있습니다. 이 가속기 베이스 이미지는 다음 요구 사항을 충족해야 합니다.- Debian 호환성 (Launch Dockerfile은 python을 가져오기 위해 apt-get을 사용함)
- CPU 및 GPU 하드웨어 명령어 세트 호환성 (사용하려는 GPU에서 CUDA 버전이 지원되는지 확인하세요)
- 제공하는 가속기 버전과 ML 알고리즘에 설치된 패키지 간의 호환성
- 하드웨어 호환성 설정을 위해 추가 단계가 필요한 설치된 패키지
TensorFlow에서 GPU를 사용하는 방법
TensorFlow가 GPU를 올바르게 활용하는지 확인하세요. 이를 위해 큐 리소스 설정의builder.accelerator.base_image 키에 Docker 이미지와 이미지 태그를 지정합니다.
예를 들어, tensorflow/tensorflow:latest-gpu 베이스 이미지는 TensorFlow가 GPU를 올바르게 사용하도록 보장합니다. 이는 큐의 리소스 설정을 사용하여 구성할 수 있습니다.
다음 JSON 스니펫은 큐 설정에서 TensorFlow 베이스 이미지를 지정하는 방법을 보여줍니다.
Queue config