Documentation Index
Fetch the complete documentation index at: https://wb-21fd5541-update-training-api-26.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
Overview
Metaflow는 Netflix 에서 ML 워크플로우를 생성하고 실행하기 위해 만든 프레임워크입니다. 이 인테그레이션을 통해 사용자는 Metaflow steps and flows에 데코레이터를 적용하여 파라미터와 Artifacts를 W&B에 자동으로 로그할 수 있습니다.- step에 데코레이터를 사용하면 해당 step 내의 특정 유형에 대해 로그 기록 여부를 설정할 수 있습니다.
- flow에 데코레이터를 사용하면 flow 내의 모든 step에 대해 로그 기록 여부를 설정할 수 있습니다.
Quickstart
회원 가입 및 API 키 생성
API 키는 W&B에서 사용자의 머신을 인증하는 역할을 합니다. 사용자 프로필에서 API 키를 생성할 수 있습니다.For a more streamlined approach, create an API key by going directly to User Settings. Copy the newly created API key immediately and save it in a secure location such as a password manager.
- 오른쪽 상단 모서리에 있는 사용자 프로필 아이콘을 클릭합니다.
- User Settings를 선택한 다음 API Keys 섹션으로 스크롤합니다.
wandb 라이브러리 설치 및 로그인
로컬에 wandb 라이브러리를 설치하고 로그인하려면 다음을 수행하세요:
wandb 버전 0.19.8 이하를 사용하는 경우, plum-dispatch 대신 fastcore 버전 1.8.0 이하(fastcore<1.8.0)를 설치하세요.- Command Line
- Python
- Python notebook
-
WANDB_API_KEY환경 변수를 사용자의 API 키로 설정합니다. -
wandb라이브러리를 설치하고 로그인합니다.
Flows 및 Steps 데코레이팅
- Step
- Flow
- Flow and Steps
step을 데코레이팅하면 해당 step 내의 특정 유형에 대해 로그 기록 여부를 설정할 수 있습니다.이 예시에서는
start에 있는 모든 Datasets와 Models가 로그됩니다.데이터에 프로그래밍 방식으로 엑세스하기
캡처된 정보에 엑세스하는 방법은 세 가지가 있습니다: 로그가 기록되고 있는 원래 Python 프로세스 내부에서wandb 클라이언트 라이브러리를 사용하거나, 웹 앱 UI를 사용하거나, Public API를 사용하여 프로그래밍 방식으로 엑세스할 수 있습니다. Parameter는 W&B의 config에 저장되며 Overview 탭에서 확인할 수 있습니다. datasets, models, others는 W&B Artifacts에 저장되며 Artifacts 탭에서 확인할 수 있습니다. 기본 Python 유형은 W&B의 summary 딕셔너리에 저장되며 Overview 탭에서 확인할 수 있습니다. 외부에서 API를 사용하여 이 정보를 프로그래밍 방식으로 가져오는 방법에 대한 자세한 내용은 Public API 가이드를 참조하세요.
빠른 참조
| 데이터 | 클라이언트 라이브러리 | UI |
|---|---|---|
Parameter(...) | wandb.Run.config | Overview 탭, Config |
datasets, models, others | wandb.Run.use_artifact("{var_name}:latest") | Artifacts 탭 |
기본 Python 유형 (dict, list, str 등) | wandb.Run.summary | Overview 탭, Summary |
wandb_log kwargs
| kwarg | 옵션 |
|---|---|
datasets |
|
models |
|
others |
|
settings |
기본적으로 다음과 같습니다:
|
자주 묻는 질문 (FAQ)
정확히 무엇이 로그되나요? 모든 인스턴스 변수와 지역 변수가 로그되나요?
wandb_log는 인스턴스 변수만 로그합니다. 지역 변수는 절대로 로그되지 않습니다. 이는 불필요한 데이터가 로그되는 것을 방지하는 데 유용합니다.
어떤 데이터 유형이 로그되나요?
현재 다음 유형들을 지원합니다:| 로그 설정 | 유형 |
|---|---|
| 기본값 (항상 켜짐) |
|
datasets |
|
models |
|
others |
|
로그 기록 행동을 어떻게 구성할 수 있나요?
| 변수 종류 | 행동 | 예시 | 데이터 유형 |
|---|---|---|---|
| 인스턴스 | 자동 로그됨 | self.accuracy | float |
| 인스턴스 | datasets=True일 때 로그됨 | self.df | pd.DataFrame |
| 인스턴스 | datasets=False일 때 로그되지 않음 | self.df | pd.DataFrame |
| 지역 | 절대 로그되지 않음 | accuracy | float |
| 지역 | 절대 로그되지 않음 | df | pd.DataFrame |