AI SaaS 개발 - LLM, RAG, Fine tuning, AI Agent

Posted Apr 3, 2026

By Jinsoo Yoo

14 min read

LLM, RAG, Fine tuning, AI Agent 기초 개념 이해

네 가지 기술은 단계별 발전 과정으로 이해하면 용이함

AI 기술 도입 및 발전 3단계 로드맵

1단계: 기반 구축 (Foundational LLM)

개념: GPT-4o, Claude, Gemini와 같은 범용 거대언어모델 도입
특징: 방대한 지식을 보유하고 있으나, 특정 기업 내부 사정이나 전문 용어에 대한 이해도는 낮음
한계: 우리 회사만의 고유 업무를 처리하기에는 데이터와 맥락이 부족함

2단계: 맞춤화 및 최적화 (Customization: RAG & Fine-tuning)

목적: 범용 LLM을 기업 전용 모델로 개조하여 업무 적합도 향상
방식 선택:
- RAG (실시간 검색): 사내 문서 시스템과 연동하여 최신 정보를 ‘찾아보며’ 답변하게 함 (유연성·경제성 중심)
- Fine-tuning (심화 학습): 모델 자체에 기업의 문체와 전문 지식을 ‘각인’시킴 (일관성·전문성 중심)
결과: 우리 회사 업무 맥락을 완벽히 이해하는 ‘맞춤형 AI 비서’ 탄생

3단계: 실행 및 자동화 (Action: AI Agent)

개념: 맞춤화된 LLM에 ‘실행 도구’와 ‘자율 판단력’을 부여한 완성 단계
기능: 답변 제공을 넘어 이메일 발송, DB 업데이트, 시스템 연동 등 실질적 업무 수행
가치: 사람의 개입 없이 전체 비즈니스 프로세스를 스스로 완수하는 ‘업무 대행자’ 역할 수행

[기술 간 관계 요약]

단계	핵심 기술	역할	비유
Step 1	LLM	기본 지식 제공	똑똑하지만 우리 회사는 모르는 신입 사원
Step 2	RAG / FT	전문성·맥락 부여	우리 회사 매뉴얼과 문화를 익힌 숙련병
Step 3	AI Agent	업무 실행·자동화	스스로 판단하고 실무를 처리하는 대리급 직원

결국 LLM이라는 엔진에 RAG/Fine-tuning이라는 연료를 채우고, 에이전트라는 바퀴를 달아 실제 비즈니스 현장을 달리게 하는 과정

가장 강력한 에이전트를 만들려면, 특정 도메인에 파인튜닝된 LLM이 RAG를 통해 지식을 찾고, 이를 바탕으로 도구를 사용하는 구조로 개발하는 방향으로 진행

LLM

LLM(대규모 언어 모델)이란 방대한 데이터를 학습해 인간의 언어를 이해하고 답변을 생성하는 AI 모델. 대표적인 LLM으로는 OpenAI의 GPT-4o, Anthropic의 Claude, Google의 Gemini, Meta의 LLaMA 등이 있음.

LLM의 한계는 최신 정보는 알지 못하고, 실시간 데이터에 접근할 수 없으며, 외부 시스템과 연동해서 실제 업무를 수행할 수도 없는 한계가 있다. 특정 모델에 한해 가능하지만, 제한적인 답변만 제공할 뿐, 실제로 이메일을 보내거나 데이터베이스를 업데이트하는 등의 액션은 수행할 수 없음.

이런 한계를 극복하기 위해 등장한 것이 바로 맞춤화 기술로 RAG와 Fine tuning은 LLM을 특정 도메인에 맞게 맞춤화하는 두 가지 대표적인 방법이다

Fine-tuning

정의 및 방식
- 기업 내부 데이터를 거대언어모델(LLM)에 직접 학습시키는 기법
- 고유 용어, 업무 양식, 브랜드 스타일 등을 모델에 완전히 내재화
- 학습 완료 시 별도 참조 자료 없이 독자적인 스타일로 응답 가능
핵심 장점
- 속도 및 일관성: 실시간 검색 과정 생략으로 신속한 답변 제공 및 일정한 응답 품질 유지
- 전문성 강화: 특정 업무 및 도메인 영역에서 전문가 수준의 높은 정확도 구현
- 독립적 운영: 외부 인터넷 연결 없이 폐쇄망 내 독립적 구동 가능 (보안성 우수)

1. Fine-tuning 적합 업무 (Use Cases)

적합 환경
- 고정된 프로세스: 업무 규칙이나 양식이 변하지 않고 정형화된 업무
- 실시간성: 지연 시간 최소화 및 빠른 응답 속도가 필수인 상황
- 일관성: 답변의 톤앤매너와 품질 유지가 최우선인 작업
- 심화 전문성: 특정 산업군만의 고유한 도메인 지식이 깊게 요구되는 경우
주요 활용 사례
- 법무: 표준 계약서 자동 생성 및 특정 법률 조항·문구 스타일 체득
- 의료: 병원별 고유 진료 기록 양식에 최적화된 소견서 작성
- 금융: 기업 고유 템플릿 기반의 투자 보고서 자동화 생성

2. Fine-tuning 도입 시 제약 및 고려사항

높은 초기 투자 비용 및 리소스
- 경제적 부담: 최소 수천만 원에서 수억 원에 이르는 구축 비용 발생
- 인프라 요구: 고사양 전용 GPU 등 대규모 연산 자원 필수
- 데이터 준비: 학습용 데이터의 정제 및 가공에 상당한 시간과 전문 인력 투입 필요
긴 구축 기간
- 데이터 준비부터 모델 학습 및 검증까지 수주에서 수개월 소요
업데이트 유연성 부족
- 정보 변경 시 재학습(Retraining)이 필요하여 실시간 정보 반영에 한계
- 변화가 빠른 비즈니스 환경이나 최신 트렌드 대응에는 부적합

RAG

1. RAG(Retrieval-Augmented Generation)의 정의

개념: 외부 문서 검색 시스템과 LLM을 실시간으로 결합하여 답변을 생성하는 기술
메커니즘: 질문 수신 → 관련 문서 검색 → 검색 결과 + AI 지식 병합 → 최종 답변 생성
특징: 모델 자체를 수정하지 않고 외부 데이터베이스(DB)만 업데이트하는 유연한 구조

2. 핵심 장점: 유연성 및 경제성

저비용 고효율: 파인튜닝 대비 약 1/10 수준의 비용(수백~수천만 원)으로 구축 가능
최신성 유지: 데이터베이스 내 문서 교체만으로 즉각적인 최신 정보 반영
신속한 도입: 빠른 프로토타입 제작 및 테스트가 가능하며 다양한 질의에 유연하게 대응

3. RAG 적합 업무 (Use Cases)

적합 환경
- 정보의 업데이트 주기가 짧고 방대한 문서 데이터 기반의 업무
- 정보의 출처(근거)를 명확히 제시해야 하는 경우
- 부서별로 서로 다른 보안 권한이나 문서를 활용해야 하는 환경
주요 활용 사례
- 고객지원: 제품 매뉴얼 기반 실시간 상담 및 문의 응답
- 인사(HR): 최신 인사 규정 및 복리후생 정책 검색·안내
- R&D: 방대한 논문·기술 문서 DB에서 관련 연구 탐색 및 보고서 초안 작성
- 영업: 최신 카탈로그 및 단가표 기반의 맞춤형 고객 제안서 생성

4. 제약 사항 및 고려 요소

성능 측면의 약점
- 응답 지연: 검색 프로세스로 인해 파인튜닝 대비 응답 속도 저하(약 1~3초 추가 소요)
- 일관성 부족: 검색 결과 변화에 따라 동일 질문에도 답변이 달라질 가능성 존재
운영 및 기술적 복잡도
- 관리 부하: 지속적인 문서 색인화(Indexing) 및 검색 엔진 최적화 관리 필요
- 검색 의존도: 검색 실패 시 답변 품질이 급격히 저하되므로 고도화된 문서 구조화 설계 필수
- 연결성: 실시간 데이터베이스와의 상시 연결 상태 유지 필요

Agent

제시해주신 내용을 바탕으로, 단순 답변을 넘어 실행력을 갖춘 AI 에이전트(AI Agent)의 개념과 혁신 사례를 개조식으로 정리해 드립니다.

1. AI 에이전트: “LLM + 실행 능력”의 결합

개념: RAG나 Fine-tuning으로 최적화된 LLM에 도구 활용 및 시스템 연동 기능을 더한 형태
역할 변환: 단순 정보 제공자(Answerer)에서 스스로 판단하고 행동하는 업무 대행자(Doer)로 진화
지향점: 사람이 수행하는 반복적·복합적 업무의 ‘완전 자동화’ 구현

2. 핵심 특징 및 운영 방식

자율적 의사결정: 설정된 목표 달성을 위해 필요한 단계를 스스로 설계하고 조건에 따라 후속 작업 수행
시스템 연동: ERP, CRM, 이메일, 메신저 등 사내외 IT 인프라와 결합하여 직접적인 액션(Action) 실행
상시 운영: 24시간 무중단으로 업무 지시 수령, 실행, 결과 보고까지 전 과정 전담 가능

3. 산업별 업무 혁신 사례

제조업 (품질 관리 자동화)
- 센서 데이터 기반 이상 징후 실시간 감지
- 유관 부서 자동 알림 및 유지보수 점검 일정 자율 등록
유통업 (공급망 최적화)
- 실시간 재고 분석을 통한 부족 품목 식별
- 발주서 생성 및 공급업체 대상 발송 업무 자동 대행
서비스업 (고객 경험 관리)
- 고객 피드백 감정 분석 및 이슈 우선순위 분류
- 적격 담당자 배정 및 대응 프로세스 전반의 자동화 관리

[요약] AI 에이전트 도입의 의의

기존 AI가 ‘무엇을 할지 알려주는 비서’였다면, AI 에이전트는 ‘직접 업무를 완수하는 디지털 직원’. 이를 통해 사람은 복잡한 의사결정과 실행의 부담에서 벗어나 더 창의적인 핵심 가치에 집중할 수 있게 됨

This post is licensed under CC BY 4.0 by the author.