
1. Document Loader의 대한 개념: 주어진 무서를 Rag에서 활용하기 용이한 형태(Document 객체)로 변환하는 역할을 하는게 LangChain의 Document Loader라고 할 수 있다.Document 객체는 문서의 내용을 담은 Page_content와 메타데이터로 이뤄진 Dictionary이다. 1.1. Page_contentPdf 데이터에 들어있는 텍스트들이 전부 여기에 들어간다.1.2. metadataPDF 파일에 대한 정보이다. 예를들어 쪽별로 분할했을시 이러한 정보에 관한 내용이 들어간다. 2. 실습2.1. PyPDF Loader쪽별로 Page_content확인 쪽별로 메타 데이터 확인 전체 page에 대한 정보 2.2 OCR 기능 활용하여 이미지-텍스트 혼합 페이지 내..