組織によっては、Large Language Model (LLM) のワークフロー内で、名前、電話番号、メールアドレスなどの個人識別情報 (PII) を処理することがあります。これらのデータが Weights & Biases (W&B) Weave に保存されることは、コンプライアンスやセキュリティ上のリスクを伴います。 「機密データ保護 (Sensitive Data Protection) 」機能を使用すると、トレース が Weave サーバーに送信される前に、PII を自動的に秘匿化(マスク)できます。この機能は Microsoft Presidio を Weave Python SDK に統合しており、SDK レベルで秘匿化の設定を制御できます。 機密データ保護機能により、Python SDK に以下の機能が導入されます。Documentation Index
Fetch the complete documentation index at: https://wb-21fd5541-update-training-api-26.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
weave.init呼び出し時にオン/オフを切り替え、PII 秘匿化を有効にするredact_pii設定。redact_pii = Trueの場合に、一般的なエンティティ を自動的に秘匿化。- 設定可能な
redact_pii_fields設定を使用して、秘匿化するフィールドをカスタマイズ。
PII 秘匿化を有効にする
Weave で機密データ保護機能の使用を開始するには、以下の手順に従ってください。-
必要な依存関係をインストールします。
-
weave.initの呼び出しを修正して、秘匿化を有効にします。redact_pii=Trueの場合、一般的なエンティティはデフォルトで秘匿化されます。 -
(オプション)
redact_pii_fieldsパラメータを使用して、秘匿化するフィールドをカスタマイズします。検出および秘匿化が可能なエンティティの完全なリストについては、Presidio がサポートする PII エンティティ を参照してください。
デフォルトで秘匿化されるエンティティ
PII 秘匿化が有効な場合、以下のエンティティが自動的に秘匿化されます。CREDIT_CARDCRYPTOEMAIL_ADDRESSES_NIFFI_PERSONAL_IDENTITY_CODEIBAN_CODEIN_AADHAARIN_PANIP_ADDRESSLOCATIONPERSONPHONE_NUMBERUK_NHSUK_NINOUS_BANK_NUMBERUS_DRIVER_LICENSEUS_PASSPORTUS_SSN
REDACT_KEYS による機密キーの秘匿化
PII の秘匿化に加えて、Weave SDK は REDACT_KEYS を使用したカスタムキーの秘匿化もサポートしています。これは、PII カテゴリには該当しないものの、プライベートに保つ必要がある追加の機密データを保護したい場合に便利です。例としては以下が挙げられます。
- APIキー
- 認証ヘッダー
- トークン
- 内部 ID
- 設定値 (Config values)
定義済みの REDACT_KEYS
Weave はデフォルトで、以下の機密キーを自動的に秘匿化します。
独自のキーを追加する
トレースから秘匿化したい独自のカスタムキーをこのリストに追加できます。client_id と token の値は "REDACTED" と表示されます。
利用に関する情報
- この機能は Python SDK でのみ利用可能です。
- 秘匿化を有効にすると、Presidio の依存関係により処理時間が増加します。