오늘 멘토링에서는 전체적인 시스템 구성과 함께 현재까지 작성한 수행계획서, 요구사항 명세서(FR/NFR), 기능/비기능 명세서, 아키텍처 설계 등을 전반적으로 검토받았다. 이번 멘토링의 핵심은 프로젝트의 서비스 방향성과 기술적 우선순위를 다시 정리하는 데 있었으며, 특히 우리가 목표로 하고 있는 “사내 정보보호·4대 법정교육·직무 교육을 포함하는 RAG 기반 교육·챗봇 어시스턴트”의 구조적 완성도를 점검하는 데 중점을 두었다.
멘토님께서는 현재 설계된 서비스 구조와 기술적 차별점이 아직 명확하게 드러나지 않는다고 지적하셨다. 단순히 교육 영상을 제공하고 퀴즈를 내는 방식은 기존 교육 플랫폼과 크게 다르지 않기 때문에, 서비스 가치나 기술적 설득력이 부족해 보일 수 있다는 의견을 주셨다. 따라서 교육 영상 자동 생성 기능은 당장 핵심 기능으로 두기보다는, 먼저 교육 스토리의 품질을 확보한 이후 단계적으로 확장하는 것이 적절하다는 방향을 제시받았다.
이와 함께 기술 포인트에 대한 우선순위도 다시 정리되었다. 멘토님께서는 기업 내부 문서를 RAG에 적합한 형태로 변환하는 전처리·청킹·메타데이터·KB 파이프라인이 이번 프로젝트에서 가장 중요한 기술적 차별점이 될 수 있다고 강조하셨다. 특히 전처리 파이프라인은 실제 기업 환경에서도 가장 구현 난도가 높고, RAG 기반 서비스 성능을 결정짓는 핵심 요소이기 때문에 이를 중심 기술로 가져가야 한다는 조언을 받았다.
이 과정에서 전처리 파트에 대한 논의가 심화되었고, 내가 준비해 간 기존 설계—원본 문서 수집, 포맷 통일, 텍스트 추출, 카테고리 분류, 청킹, 검수, 임베딩 과정을 설명하며 현재 고민하고 있는 부분을 공유했다. 이에 대해 멘토님은 전처리 전 과정을 독자적으로 구현하려 하면 복잡도가 매우 높고 프로젝트 일정에도 큰 부담이 될 수 있다고 지적하셨다. 이러한 리스크를 줄이기 위해 RAGFlow를 적극 활용하는 방식을 강하게 추천하셨다.
RAGFlow는 문서 로더와 파서, 청킹 규칙 설정, 임베딩 처리, KB 관리 등 전처리의 핵심 기능을 시각적 파이프라인 형태로 제공하기 때문에, PoC 단계에서 빠르고 안정적인 전처리 구조를 구축할 수 있다는 장점이 있다. 멘토님은 우리가 추구하는 전처리 구조를 RAGFlow 기반으로 우선 구현한 뒤, 필요시 일부 과정을 커스터마이징하는 것이 기술 효율성과 안정성 측면에서 가장 적합한 방식이라고 정리해주셨다.
댓글 영역