Q

[질문] Pdf, Docx, hwp, ppt와 같은 문서는 일단 tokenization 을 통한 csv를 생성하여 vector/word embedding(물론 이 부분은 필수적인 시스템에서 하겠죠?) 을 할 필요가 없다는 것이 장점인가요

이형준 2025-04-29 15:27
A

각 문서 타입에 대해 별도 전처리를 진행한 뒤 임베딩을 통해 벡터화를 사용 중에 있습니다. 내부적으로는 Langchain을 활용하여 유기적으로 동작 가능하도록 설계한 것이 특징이라고 보시면 되겠습니다 :)

디모아 담당자 2025-04-29 15:41