MapleTree-1.0-8B — 사내 문서 작성을 자동화하는 NAA 문서 생성 SLM
작성: 나무기술 CAIO 고우주
들어가며
기업의 지식 노동에서 가장 많은 시간을 잡아먹는 일은 의외로 “문서를 만드는 일”이다. 분석은 끝났는데 보고서 양식에 맞춰 표를 옮기고, 그래프를 그리고, 문장을 다듬는 데 반나절이 사라진다. 특히 정형 양식이 정해진 보고서·제안서·계약서일수록 반복 작업의 비중은 더 커진다.
나무기술은 이 문제를 정면으로 풀기 위해 자체 문서 생성 특화 경량 모델 MapleTree-1.0-8B를 개발했다. 80억(8B) 파라미터 규모의 SLM(Small Language Model)으로, 범용 LLM이 아니라 “기업 내부 문서를 빠르고 정확하게 만들어내는 일”에 집중하도록 설계된 모델이다.
이번 호에서는 MapleTree-1.0-8B가 나무기술 NAA(NAMU Agentic AI) 플랫폼 위에서 어떻게 사내 문서 작성을 자동화하는지, 추출에서 검증까지의 전체 워크플로우를 실제 적용 관점에서 살펴본다.
1. MapleTree-1.0-8B — 문서 작성에 특화된 경량 SLM
1-1. 왜 범용 LLM이 아니라 문서 특화 SLM인가
기업 문서 자동화에서 범용 거대 모델을 그대로 쓰면 두 가지 문제에 부딪힌다. 첫째, 비용과 지연이다. 수백 명이 동시에 보고서를 생성하는 환경에서 거대 모델은 응답이 느리고 GPU 비용이 급증한다. 둘째, 양식 일관성이다. 범용 모델은 “그럴듯한” 문장은 잘 쓰지만, 기업이 정한 표준 양식·용어·서식 규칙을 매번 똑같이 지키는 데에는 오히려 약하다.
MapleTree-1.0-8B는 이 지점을 겨냥했다. 8B 규모로 충분히 가볍게 온프레미스(사내 서버)에서 구동되면서도, 문서 구조 변환과 한·영 보고서 작성이라는 좁고 반복적인 작업에 집중해 범용 모델 못지않은 품질을 낸다. LLM이 “백과사전”이라면 MapleTree는 문서 작성이라는 한 분야를 깊게 익힌 “전공서”에 가깝다.
1-2. 한눈에 보는 모델 사양
| 항목 | 내용 | 비고 |
| 모델명 | MapleTree-1.0-8B | 나무기술 자체 개발 |
| 파라미터 | 80억 (8B) | 온프레미스 단일 GPU 구동 가능 |
| 특화 영역 | HTML → 문서 구조 변환 · 한·영 보고서 작성 | 문서 생성 전용 |
| 언어 | 한국어 · 영어 이중 최적화 | 한·영 동시 출력 |
| 배포 | 온프레미스 / 엣지 | vLLM 서빙 |
| 활용 | NAA 문서 생성 워크플로우 | Doc Chat · Generate Report |
1-3. 핵심 설계 원칙
- 구조 보존 우선 — 문장을 자연스럽게 다듬는 것보다, 표문단·목록 같은 문서 구조를 정확히 유지하는 것을 최우선으로 한다.
- 양식 일관성 — 기업이 정한 표준 양식과 서식 규칙을 매 생성마다 동일하게 지키도록 학습됐다.
- 텍스트 무손실 — 원본 데이터의 수치와 문구가 변환 과정에서 누락왜곡되지 않도록 설계됐다.
- 온프레미스 친화 — 민감한 내부 문서가 외부로 나가지 않도록, 사내 GPU 환경에서 완결되는 경량 구조를 택했다.
2. NAA 문서 생성 워크플로우 — 5단계 자동화 파이프라인
MapleTree-1.0-8B는 단독으로 동작하지 않는다. NAA 플랫폼의 추출 → 변환 → 보고서 생성 → 편집 → 검증이라는 5단계 파이프라인 안에서, 변환과 생성의 핵심 엔진 역할을 맡는다. 사용자가 데이터를 업로드하는 단순한 행위로 시작되어, 검증된 보고서까지 완성하는 End-to-End 자동화 흐름이다.
| 단계 | 핵심 기능 | 담당 |
| 01 추출 (Extraction) | 전문 parser + RAG 기반 데이터 추출 | 구조 인식 |
| 02 변환 (Transformation) | XML → WPML SLM 변환 | MapleTree-1.0-8B |
| 03 보고서 생성 (Generation) | 양식 기반 최대 500P 자동 생성 | NAA + MapleTree |
| 04 편집 (Editing) | Canva 워드 편집기 | 사용자 |
| 05 검증 (Validation) | 3-Layer HITL 검증 파이프라인 | 자동 + 전문가 |
Human-in-the-Loop — AI 자동 생성 → 사용자 웹 편집 → 검토·수정·확정의 협업 구조로 환각 최소화·품질 신뢰성·책임성을 동시에 확보한다.
STEP 1. 추출 (Extraction) — 전문 parser로 원천 데이터의 구조를 정확히 파악한다
모든 과정은 사용자가 엑셀·HTML·문서 등 원천 파일을 업로드하는 단순한 행위로 시작된다. 측정값·실적·항목별 수치가 셀과 태그 하나하나에 흩어져 담겨 있는 상태다.
NAA의 추출 단계가 일반적인 텍스트 스크래핑과 결정적으로 다른 점은, 파일 형식별 전문 parser를 사용해 문서의 정확한 구조를 먼저 파악한다는 데 있다. 엑셀은 셀 좌표·병합·시트 구조를, HTML은 DOM 트리와 표·목록의 중첩 관계를, PDF·DOCX는 문단·표·헤더 계층을 각각 전용 parser가 해석한다. 단순히 “보이는 텍스트”를 긁어오는 것이 아니라, 원본이 가진 구조 자체를 손실 없이 인식하는 것이 핵심이다.
구조를 정확히 파악한 뒤에는 RAG(Retrieval-Augmented Generation) 기반 엔진이 맥락을 보강한다. 과거에 작성된 보고서들을 참조해 어떤 수치가 어느 섹션에 들어가야 하는지까지 추론하므로, 데이터 구조가 다소 불규칙하더라도 의미에 맞게 항목을 식별하고 정리할 수 있다.
이 단계의 작업은 크게 세 가지다. 전문 parser로 원시 데이터의 구조를 인식·분류하고, RAG로 항목별 의미를 보강하며, 후속 변환에 쓰일 정규화된 데이터셋을 구성한다. 이 과정은 사람 개입 없이 수 초 안에 끝난다.
| STEP 1 | 전문 parser + RAG 기반 데이터 추출 파일 업로드 → 전문 parser 구조 인식 → RAG 의미 보강 → 정규화 데이터셋 구성 |
STEP 2. 변환 (Transformation) — 구조화된 데이터를 안정적인 문서 마크업으로 변환한다
추출 단계에서 구조가 파악된 데이터는 두 방향으로 동시에 변환된다. 하나는 막대·꺾은선 그래프 같은 시각화 결과물이고, 다른 하나는 MapleTree-1.0-8B가 생성하는 문서 본문이다. 바로 이 변환 단계가 모델의 핵심 역할이 발휘되는 구간이다.
모델은 전문 parser가 인식한 구조화 데이터를 받아, XML → WPML(WordprocessingML) 변환을 수행한다. 즉 추출된 구조 표현을 워드 문서가 곧바로 이해하는 안정적인 마크업으로 바꾸는 것이다. 표는 표대로, 문단은 문단대로, 목록은 목록대로 — 원본의 구조를 흐트러뜨리지 않고 그대로 옮기는 것이 MapleTree의 강점이다.
변환 과정에서 모델이 지키는 규칙은 분명하다. 허용된 문서 태그만 사용하고, 복잡한 표는 읽기 좋은 문단 구조로 정리하며, 원본 텍스트를 직접 복사하지 않고 보이는 내용(visible text)만 정확히 보존한다. 이를 통해 깨지지 않는, 곧바로 열리는 문서 파일이 만들어진다.
문체 변환에서 가장 중요한 것은 ‘문맥 유지’다. 단순히 숫자를 나열하는 것이 아니라, 비교 맥락 속에서 수치의 의미를 서술하는 형태로 자연어가 생성된다. 한국어 원문에서 흔히 생략되는 주어를 복원하는 로직이 내장돼 있고, 전문 용어는 별도 사전을 참조해 오역 없이 처리된다.
그림. MapleTree-1.0-8B의 XML → WPML 변환 흐름
| STEP 2 | XML → WPML SLM 변환 XML 구조 입력 → WPML 변환 → 그래프 생성 → 한글 서술 → AI 영문 번역 |
STEP 3. 보고서 생성 (Generation) — 양식 기반으로 최대 500페이지 문서를 자동 완성
이 단계가 NAA 시스템의 가치를 가장 잘 보여주는 구간이다. 앞서 생성된 그래프와 서술문이 미리 정의된 보고서 템플릿 위에 자동 배치되며, 최대 500페이지 분량의 전문 문서가 완성된다.
보고서 구조는 고객사가 사전에 정의한 표준 양식을 기반으로 한다. 커버 페이지, 목차, 개요, 분석 섹션, 결과 및 고찰, 결론, 참고문헌 등 각 챕터가 자동으로 채워지고, 페이지 번호·헤더·푸터·회사 로고 같은 레이아웃 요소도 템플릿에 따라 일관되게 적용된다.
수작업으로 8~12시간 걸리던 보고서 작성이 1시간 이내로 줄어든다.
이는 단순한 시간 단축이 아니라, 담당자가 분석과 해석이라는 진짜 업무에 집중할 수 있다는 의미다.
출력은 한글과 영문 두 버전이 동시에 생성된다. 영문 보고서는 글로벌 수준의 문체와 전문성을 갖추도록 설계돼, 기존에 건당 50~100만 원이 들던 외부 번역 비용을 상당 부분 대체한다. 모든 처리는 온프레미스 환경에서만 이뤄져, 민감한 내부 데이터가 외부로 유출되는 것을 원천 차단한다.
| STEP 3 | 양식 기반 자동 생성 (최대 500P) 템플릿 배치 → 한글/영문 동시 출력 → 온프레미스 보안 처리 → PDF/DOCX 저장 |
STEP 4. 편집 (Editing) — Canva 워드 편집기로 디자인 품질을 높인다
AI가 생성한 보고서는 완성도가 높지만, 발표용 자료나 제출용 문서로 쓰려면 시각적 완성도를 더 높여야 하는 경우가 있다. 이 단계에서 Canva 호환 워드 편집기가 등장한다.
NAA가 생성한 보고서 파일은 편집 도구와 호환되는 형식으로 내보낼 수 있다. 담당자는 직관적인 드래그 앤 드롭 인터페이스로 그래프 색상을 기관 브랜드 색상으로 교체하거나, 표지 디자인을 바꾸거나, 이미지·텍스트 박스 위치를 미세하게 조정하는 작업을 손쉽게 수행한다. 코딩이나 전문 편집 툴 교육 없이도 누구나 시각적 완성도를 빠르게 높일 수 있다.
특히 다국어 보고서에서 이 단계의 가치가 두드러진다. 한글본과 영문본을 나란히 불러와 동일한 레이아웃 구조 아래 두 언어 버전을 일관된 디자인으로 완성하면, 기존 수동 편집 대비 70% 이상 시간이 단축된다. 편집이 끝난 보고서는 PDF 또는 DOCX로 최종 출력돼 다음 검증 단계로 넘어간다.
| STEP 4 | Canva 워드 편집기 보고서 내보내기 → Canva 임포트 → 디자인 보정 → 브랜드 적용 → 최종 출력 |
STEP 5. 검증 (Validation) — 3-Layer HITL 검증 파이프라인
AI가 생성한 보고서가 아무리 정교해도, 전문 문서는 사람 전문가의 최종 검토 없이 제출될 수 없다. NAA는 이 검증 단계를 3-Layer HITL(Human-in-the-Loop) 검증 파이프라인으로 체계화했다.
첫 번째는 자동화 품질 검사다. 보고서 생성 직후 시스템이 데이터 무결성을 자체 점검한다. 원천 데이터의 수치와 보고서 기재 수치가 일치하는지, 그래프 스케일이 데이터 범위와 맞는지, 필수 섹션이 누락되지 않았는지를 자동으로 확인하고, 오류는 즉시 담당자에게 알린다.
두 번째는 전문가 리뷰다. 자동 검사를 통과한 보고서는 담당자의 최종 확인을 거친다. 변경 추적(Track Changes) 기능을 지원하며, 담당자가 수정한 내용은 다음 생성 시 참고 자료로 반영된다. 쓸수록 점점 더 조직의 스타일에 맞게 스스로 개선되는 선순환 구조다.
세 번째는 데이터 보안 감사다. 온프레미스에서 처리된 모든 데이터는 접근 로그가 기록되고, NDA 기반 보호 정책에 따라 주기적으로 감사받는다. 민감한 데이터가 외부로 유출되지 않았음을 제도적으로 보증하는 단계다.
검증의 핵심은 ‘AI가 틀릴 수 있다’는 전제 하에 사람이 최종 책임을 지는 구조다.
MapleTree는 전문가의 시간을 대체하는 것이 아니라, 전문가가 핵심 판단에 집중하도록 반복 업무를 대신 처리하는 도구다.
| STEP 5 | 3-Layer HITL 검증 ① 자동 품질 검사 → ② 전문가 리뷰(피드백 반영) → ③ 데이터 보안 감사 |
3. 도입 기대 효과
MapleTree-1.0-8B 기반의 NAA 문서 자동화를 도입하면 다음과 같은 효과를 기대할 수 있다.
| 지표 | 효과 | 의미 |
| 보고서 작성 시간 | 85% 이상 단축 | 1시간 → 5분 이내 |
| 외부 번역 비용 | 80% 이상 절감 | 한·영 동시 생성으로 외주 대체 |
| 편집 소요 시간 | 70% 이상 단축 | Canva 일관 편집 |
| 연간 처리량 | 100% 이상 증가 | 문서 처리량 기준 |
특히 주목할 점은 데이터 자산화 효과다. 그동안 조직에 흩어져 재활용되지 못하던 방대한 문서·데이터가 RAG 기반의 참조 자산으로 전환된다. 이는 보고서 품질의 지속적 향상으로 이어지며, 시스템이 쓰일수록 더 똑똑해지는 구조를 완성한다.
4. 결론 — 문서 작성 자동화의 새로운 기준
“기업은 이제 더 큰 모델이 아니라, 문서를 더 정확하고 일관되게 만들어내는 특화 모델로 생산성을 높인다.”
추출(Extraction) → 변환(Transformation) → 보고서 생성(Generation) → 편집(Editing) → 검증(Validation)의 다섯 단계로 구성된 NAA 워크플로우는, 문서 작성의 패러다임을 바꾸고 있다. 담당자는 더 이상 데이터를 복사하고, 그래프를 그리고, 문장을 교열하는 데 하루를 소비하지 않아도 된다.
이 구조의 핵심은 단순한 기술력이 아니다. MapleTree-1.0-8B의 처리 속도와 양식 일관성, 친숙한 편집 도구의 조합, 그 위에 인간 전문가의 최종 검증이 더해진 ‘사람과 AI의 협업 구조’다. 나무기술은 이 구조를 만들어가고 있으며, 이 경험이 기업 문서 자동화의 표준이 될 것이다.
나무기술 문서 자동화 활용 제안
| 상황 | 권장 액션 |
| 문서 자동화를 처음 검토 중인 고객 | NAA 데모 신청 → 표준 양식 기반 보고서 자동 생성 PoC |
| 반복 보고서 업무가 많은 부서 | MapleTree-1.0-8B 온프레미스 도입으로 작성 시간 85% 단축 |
| 한·영 문서를 함께 다루는 조직 | 한·영 동시 생성 + 일관 편집으로 외부 번역 비용 대체 |
| 데이터 보안이 중요한 기관 | 온프레미스 완결 구조로 민감 데이터 외부 유출 차단 |
참고자료
- NAA(NAMU Agentic AI) 플랫폼 소개: https://www.namutech.co.kr/naa
- NAMU GPU Calculator: https://gpu.namu.ai.kr
vLLM Project: https://github.com/vllm-project/vll



