PDF/Excel을 LangChain Document 형태로 통일해서 다루기.
langchain_community.document_loaders (각종 Loader 묶음)pypdf (PDF 텍스트 추출 계열에서 자주 사용)openpyxl (xlsx 읽기)pandas (표를 텍스트로 변환하기 편함)LangChain 쪽에서 “Document Loader”라는 개념으로 파일을 읽어 Document 리스트로 만드는 흐름이 기본이야. api.python.langchain.com