4. Validation Strategies

data:
  val_selection:
    enabled: true
    strategy: "balanced"  # none, random, balanced, test_similar
    similarity_metrics:  # test_similar 전략 사용시
      - "image_stats"   # 이미지 통계 기반
      - "feature_dist"  # 특징 분포 기반
      - "domain_score"  # 도메인 유사도

4.1 Strategy-specific Features

Random Split

Balanced Split

Test-Similar Split

data:
  val_selection:
    strategy: "test_similar"
    similarity_metrics:
      - "image_stats"    # 이미지 통계량 기반 유사도
      - "feature_dist"   # 특징 분포 기반 유사도
      - "domain_score"   # 도메인 점수 기반 유사도
    test_similar:
      n_samples: 100     # 클래스당 선택할 샘플 수
      threshold: 0.8     # 유사도 임값

Image Stats 기반

Feature Distribution 기반

Domain Score 기반