1. 문제 상황 개요 & 맥락 정리


2. 추정 가능한 원인별 분석

  1. Validation Set에 대한 데이터 누수(Data Leakage) 가능성
  2. Validation Set 자체가 매우 쉽거나, Train Set보다 단순한 분포
  3. Train 데이터에 과도한/부적절한 Augmentation
  4. Class Imbalance와 잘못된 Sampling 전략
  5. 평가 지표 계산 과정에서 실수

3. 구체적인 해결 방법 & 점검 사항

3.1 데이터 누수(Data Leakage) 점검

  1. Train/Validation 분리 로직 재확인
  2. Augmentation 결과 중복 체크

3.2 Validation 세트 구성 재점검

  1. Validation 세트 분포(클래스 비율, 난이도, 샘플 수 등) 점검
  2. Augmentation/Noise 수준