1. 문제 요약 및 전체 개요

  1. 문제 맥락
  2. 주요 이슈

2. 해결 접근의 우선순위

아래는 문제 특성에 비추어 고려해볼 만한 접근 순서입니다.

A. 데이터 분석 및 사전처리

  1. 클래스별 분포 재확인
  2. 유사 클래스 특성 파악

B. 모델링 및 불균형 대응

  1. 가중치 조정(Weighted Loss) 또는 Focal Loss
  2. 샘플링 기법
  3. 메타데이터나 사전 정보 활용

C. 도메인 적응 및 반지도 학습

  1. ~~Pseudo-labeling(반지도학습)~~
  2. 도메인 어댑테이션(Adaptation)

D. 유사 클래스 분류 정밀화

  1. 앙상블(Ensemble) 접근
  2. 두 단계 분류