배움
multi-turn → single turn 으로 전달
metadata 로 처리
이것만으로 과학 문서 판단? 어떻게?
중복 문서 제거
유사도 검사, 과적합 방지
데이터 단어 표준화: 동일 개념 표현 단어 통일
elastic search 최적화
cosine 유사도
index_options: HNSW
dynamic
긴 쿼리는 벡터 검색 가중치 크게
짧은건 키워드 검색에 가중치