AI 검색은 이제 검색창이 아니라 업무 기능이다

AI 검색과 RAG는 한동안 개발자용 기능처럼 보였습니다. 문서를 임베딩합니다. 벡터 DB에 넣습니다. 질문하면 관련 문서를 찾아서 답합니다.

그런데 2025년 이후 흐름은 조금 다릅니다. 이제 핵심은 “문서를 찾아주는 챗봇”이 아닙니다. 핵심은 “조사하고, 비교하고, 근거를 남기고, 업무 결과물까지 만드는 기능”입니다.

OpenAI의 Deep Research는 여러 웹 문서를 직접 찾아 읽고 보고서 형태로 정리합니다. Google Gemini Deep Research도 먼저 조사 계획을 만들고, 사용자가 승인하면 여러 번 검색하며 보고서를 만듭니다. Anthropic은 Claude API에 웹 검색 도구를 붙여 최신 정보와 출처를 함께 다루게 했습니다. Google Cloud의 Vertex AI RAG Engine은 기업 데이터와 검색, 생성 모델을 연결하는 관리형 구조를 제공합니다.

방향은 분명합니다.

단순 검색에서 조사 워크플로우로 이동합니다.
단일 문서 검색에서 여러 출처 비교로 이동합니다.
텍스트 검색에서 이미지, PDF, 표, 웹까지 포함하는 멀티모달 검색으로 이동합니다.
답변 생성에서 출처 검증, 품질 평가, 반복 개선까지 이동합니다.
범용 챗봇에서 특정 업무에 박힌 제품 기능으로 이동합니다.

그래서 제품 기회가 생깁니다. 큰 모델 회사가 “범용 리서치 도구”를 만들수록, 작은 팀은 “특정 업무용 리서치 기능”을 만들 수 있습니다.

예를 들어 이런 차이입니다.

범용 도구: “이 시장을 조사해줘.”
업무용 제품: “경쟁사 5곳의 가격표를 매주 수집하고, 우리 요금제 변경안을 만들어줘.”

두 번째가 돈을 받기 쉽습니다. 사용자가 결과를 바로 업무에 쓰기 때문입니다.

1. 왜 지금 다시 AI 검색인가

AI 검색은 새 기술이 아닙니다. RAG도 오래된 패턴입니다. 하지만 지금 다시 중요해진 이유가 있습니다.

첫째, 사용자의 기대가 바뀌었습니다. 예전에는 검색 결과 링크 10개를 받는 것이 자연스러웠습니다. 지금은 요약, 비교, 추천, 실행 계획까지 기대합니다.

둘째, 모델이 길고 복잡한 작업을 버티기 시작했습니다. OpenAI Deep Research는 수십 분 동안 여러 출처를 찾아 읽고 종합합니다. Google Deep Research는 먼저 계획을 세운 뒤 사용자가 수정하거나 승인할 수 있게 합니다. 이 방식은 그냥 “한 번 답하기”가 아닙니다. 작은 조사 프로젝트에 가깝습니다.

셋째, 기업 데이터가 너무 많아졌습니다. Slack, Notion, Google Drive, Jira, GitHub, PDF, 고객상담 로그, 회의록이 흩어져 있습니다. 사람은 이미 다 못 봅니다. 검색만으로도 부족합니다. 필요한 것은 “업무 질문에 맞는 근거 묶음”입니다.

넷째, 멀티모달 데이터가 기본이 되었습니다. 제품 스크린샷, 영수증, 차트, 계약서 PDF, 영상 캡처, 디자인 파일이 모두 지식입니다. 텍스트만 검색하는 RAG는 많은 업무에서 반쪽짜리입니다.

다섯째, 출처와 품질이 제품 차별점이 되었습니다. AI가 그럴듯하게 틀리면 업무에서는 바로 문제가 됩니다. 그래서 이제는 답변보다 “근거를 어떻게 가져왔는가”가 중요합니다.

2. Deep Research류 기능의 진짜 의미

Deep Research를 단순히 “검색 잘하는 ChatGPT”로 보면 놓치는 것이 많습니다. 제품 관점에서는 5단계 워크플로우입니다.

질문을 업무 목표로 바꿉니다.
조사 계획을 만듭니다.
여러 출처를 찾고 읽습니다.
서로 다른 내용을 비교합니다.
근거가 붙은 결과물을 만듭니다.

이 구조가 중요합니다. 왜냐하면 대부분의 업무는 질문 하나로 끝나지 않기 때문입니다.

예를 들어 “요즘 AI 검색 트렌드 알려줘”라는 질문은 너무 넓습니다. 실제 업무에서는 이렇게 바뀌어야 합니다.

어떤 독자를 위한 글인가?
어떤 기간의 자료를 볼 것인가?
공식 발표를 우선할 것인가, 사용자 반응을 볼 것인가?
기술 관점인가, 제품 기획 관점인가?
마지막 결과물은 글인가, PRD인가, 기능 목록인가?

좋은 AI 검색 제품은 바로 이 질문들을 내부에서 처리합니다. 사용자에게 모든 것을 묻지 않아도 됩니다. 하지만 중요한 선택지는 보여줘야 합니다.

여기서 제품 기회가 생깁니다. Deep Research를 그대로 따라 만들 필요는 없습니다. 오히려 더 좁게 만들어야 합니다.

변호사용 판례 리서치
이커머스 셀러용 상품 소싱 리서치
스타트업용 경쟁사 가격 리서치
HR용 후보자 공개 이력 리서치
개발팀용 사내 코드/문서 리서치

이런 식으로 좁힐수록 더 강해집니다. 범용 AI는 넓게 잘합니다. 작은 제품은 좁게 정확해야 합니다.

3. RAG는 기능명이 아니라 운영 방식이다

많은 팀이 RAG를 이렇게 생각합니다.

문서를 업로드한다.
chunk로 자른다.
embedding을 만든다.
vector DB에 넣는다.
질문하면 top-k 문서를 넣고 답한다.

이것은 시작점입니다. 제품으로는 부족합니다.

실제 사용자는 이렇게 묻습니다.

“지난번 고객사 A와 논의한 보안 요구사항이 뭐였지?”
“이 계약서에서 우리에게 불리한 조항만 뽑아줘.”
“최근 3개월 CS에서 반복되는 불만을 기능 요구사항으로 바꿔줘.”
“이 화면 디자인과 기존 가이드가 충돌하는 부분을 찾아줘.”

이 질문들은 단순 검색이 아닙니다. 문서 권한, 시간, 작성자, 버전, 표, 이미지, 누락된 맥락까지 봐야 합니다.

그래서 RAG 제품은 4개 레이어로 봐야 합니다.

수집 레이어
- Google Drive, Notion, Slack, GitHub, Jira, 이메일, PDF를 가져옵니다.
- 증분 동기화가 필요합니다.
- 삭제된 문서도 반영해야 합니다.
정리 레이어
- 문서를 chunk로 자릅니다.
- 제목, 작성자, 날짜, 권한, 프로젝트, 고객사 같은 메타데이터를 붙입니다.
- 표와 이미지는 따로 처리합니다.
검색 레이어
- 키워드 검색과 벡터 검색을 같이 씁니다.
- 최신순, 권한, 문서 타입 필터가 필요합니다.
- 질문이 넓으면 먼저 하위 질문으로 나눕니다.
답변 레이어
- 답만 만들지 않습니다.
- 근거 문장, 링크, 신뢰도, 누락된 정보도 같이 보여줍니다.
- 사용자가 “이 근거는 틀림”이라고 피드백할 수 있어야 합니다.

RAG를 기술 스택으로만 보면 흔한 기능이 됩니다. RAG를 업무 운영 방식으로 보면 제품이 됩니다.

4. 지식베이스의 다음 형태

기존 지식베이스는 사람이 정리합니다. 문서를 쓰고, 폴더를 만들고, 태그를 붙입니다. 문제는 아무도 오래 관리하지 않는다는 것입니다.

새로운 지식베이스는 조금 달라야 합니다.

자동으로 들어와야 합니다.
- 회의록, 고객 상담, 릴리즈 노트, 이슈 코멘트가 자동 수집됩니다.
자동으로 묶여야 합니다.
- 같은 고객사, 같은 기능, 같은 버그, 같은 정책을 하나의 묶음으로 봅니다.
오래된 정보를 표시해야 합니다.
- “이 문서는 8개월 전 자료입니다”를 알려줘야 합니다.
충돌을 보여줘야 합니다.
- A 문서에는 가격이 9만 원이라고 되어 있고, B 문서에는 12만 원이라고 되어 있으면 알려줘야 합니다.
업무 결과물을 만들어야 합니다.
- 단순 답변이 아니라 이메일 초안, PRD, QA 체크리스트, 회의 아젠다로 바꿔야 합니다.

여기서 중요한 질문이 있습니다. “사용자가 지식베이스를 왜 열어보는가?”입니다.

대부분은 공부하려고 열지 않습니다. 일을 끝내려고 엽니다. 따라서 지식베이스 제품은 “찾기”보다 “끝내기”에 가까워져야 합니다.

5. 멀티모달 검색은 어디에 돈이 되는가

멀티모달 검색은 거창하게 들립니다. 쉽게 말하면 텍스트 말고도 이미지, PDF, 표, 화면을 같이 찾는 것입니다.

돈이 되는 영역은 꽤 구체적입니다.

커머스
- 상품 사진으로 비슷한 상품을 찾습니다.
- 리뷰 이미지에서 불량 패턴을 찾습니다.
- 상세페이지 이미지와 실제 리뷰의 차이를 봅니다.
부동산/인테리어
- 매물 사진에서 구조, 채광, 하자 가능성을 찾습니다.
- 도면과 사진을 같이 비교합니다.
- 리모델링 견적 근거를 만듭니다.
금융/보험
- 영수증, 진단서, 계약서 PDF를 읽습니다.
- 약관과 청구 서류를 연결합니다.
- 누락 서류를 자동으로 체크합니다.
개발/디자인
- 화면 캡처와 디자인 가이드를 비교합니다.
- PR 설명, 코드 변경, 스크린샷을 같이 봅니다.
- UI 회귀 테스트 근거를 만듭니다.
제조/현장 업무
- 장비 사진과 매뉴얼을 연결합니다.
- 고장 사진에서 점검 항목을 추천합니다.
- 작업 기록과 부품 정보를 같이 검색합니다.

멀티모달 검색은 “이미지도 됩니다”라고 팔면 약합니다. “사진 한 장으로 클레임 처리 시간을 줄입니다”라고 팔아야 합니다.

기술보다 업무 비용을 줄이는 메시지가 중요합니다.

6. 제품 아이디어 5개

아래 아이디어는 Aibase 독자가 바로 실험해볼 수 있는 크기로 잡았습니다. 공통 기준은 3가지입니다.

데이터가 이미 존재해야 합니다.
사용자가 반복해서 하는 일이 있어야 합니다.
결과물이 업무 액션으로 이어져야 합니다.

아이디어 1. 스타트업 경쟁사 리서치 봇

대상은 초기 스타트업 팀입니다.

하는 일은 단순합니다.

경쟁사 URL을 등록합니다.
가격, 기능, 고객 사례, 채용 공고, 블로그 업데이트를 주기적으로 수집합니다.
변경점을 요약합니다.
우리 제품에 반영할 액션을 제안합니다.

MVP는 이렇게 만들 수 있습니다.

입력: 경쟁사 URL 3~10개
수집: 웹 페이지, 가격표, 블로그 RSS, 채용 페이지
출력: 주간 리포트
차별점: “그래서 우리 랜딩페이지/요금제/로드맵을 어떻게 바꿀지”까지 제안

돈을 받을 포인트는 “경쟁사 모니터링”이 아닙니다. “대표가 매주 2시간 쓰는 조사를 10분으로 줄임”입니다.

아이디어 2. 사내 문서 QA 어시스턴트

대상은 빠르게 커지는 팀입니다.

문제가 많습니다.

정책 문서가 오래됐습니다.
Notion과 Slack의 말이 다릅니다.
신규 입사자가 같은 질문을 반복합니다.
누가 최신 버전을 아는지 모릅니다.

제품은 이렇게 동작합니다.

Notion, Google Drive, Slack을 연결합니다.
질문하면 답과 출처를 보여줍니다.
서로 충돌하는 문서를 표시합니다.
오래된 문서를 “업데이트 필요”로 묶습니다.
자주 묻는 질문을 자동으로 FAQ로 바꿉니다.

초기에는 전사 지식베이스를 노리지 않는 편이 좋습니다. 한 팀만 잡는 것이 낫습니다. 예를 들면 CS팀, 세일즈팀, 개발팀 중 하나입니다.

좁게 시작해야 품질을 관리할 수 있습니다.

아이디어 3. 고객 상담 로그에서 제품 요구사항 뽑기

대상은 SaaS, 커머스, 앱 운영팀입니다.

많은 팀이 고객 문의를 쌓아두기만 합니다. 실제로는 금광입니다.

제품 흐름은 이렇습니다.

Zendesk, Intercom, 채널톡, 이메일 로그를 가져옵니다.
문의를 기능 요청, 버그, 결제, 사용법, 불만으로 나눕니다.
반복 빈도와 매출 영향도를 계산합니다.
PM이 볼 수 있는 요구사항 카드로 바꿉니다.
Jira/Linear 이슈 초안을 만듭니다.

이 제품은 “AI 요약”으로 팔면 약합니다. “CS 로그를 제품 로드맵으로 바꿔준다”로 팔아야 합니다.

좋은 MVP 지표는 답변 정확도가 아닙니다. “실제로 생성된 이슈 중 PM이 채택한 비율”입니다.

아이디어 4. 멀티모달 디자인 QA

대상은 앱/웹을 자주 배포하는 팀입니다.

하는 일은 명확합니다.

Figma 디자인을 읽습니다.
실제 배포 화면 스크린샷을 받습니다.
색상, 간격, 문구, 버튼 상태를 비교합니다.
차이를 리포트로 보여줍니다.
심각도와 수정 제안을 붙입니다.

여기서는 텍스트 RAG만으로 부족합니다. 이미지 비교, OCR, 디자인 토큰, 접근성 규칙이 같이 필요합니다.

작게 시작하려면 모든 화면을 하지 마세요. 결제 화면, 회원가입 화면, 온보딩 화면처럼 돈과 전환에 가까운 화면부터 하세요.

고객은 “디자인 QA”를 사는 것이 아닙니다. “전환율에 영향을 주는 화면 깨짐을 빨리 잡는 것”을 삽니다.

아이디어 5. 계약서/제안서 리서치 보조 도구

대상은 B2B 영업팀, 프리랜서, 작은 법무팀입니다.

제품 흐름은 이렇습니다.

과거 계약서와 제안서를 업로드합니다.
새 문서를 넣으면 위험 조항, 빠진 조항, 가격 조건을 찾습니다.
비슷한 과거 문서를 근거로 보여줍니다.
수정 문구 초안을 만듭니다.
내부 승인 체크리스트를 생성합니다.

이 영역은 정확도가 중요합니다. 그래서 처음부터 “법률 판단을 대신한다”고 말하면 위험합니다. 대신 “검토할 부분을 빠르게 표시한다”고 포지셔닝해야 합니다.

규제와 책임이 있는 영역에서는 AI가 최종 판단자가 되면 안 됩니다. AI는 초안 작성자와 체크리스트 생성자에 가까워야 합니다.

7. MVP 구조

AI 검색/RAG 제품을 처음 만들 때는 거창하게 시작하지 않는 편이 좋습니다. 아래 구조면 충분합니다.

1단계. 데이터 범위를 좁힙니다

처음부터 모든 데이터를 연결하지 마세요. 하나만 고릅니다.

Notion만
Slack만
Google Drive PDF만
웹 URL만
고객 상담 로그만

범위가 좁아야 실패 원인을 알 수 있습니다. 검색이 문제인지, 문서 정리가 문제인지, 프롬프트가 문제인지 구분할 수 있습니다.

2단계. 문서 파이프라인을 만듭니다

기본 구조는 이렇습니다.

connector가 원본 데이터를 가져옵니다.
parser가 텍스트, 표, 이미지 설명을 뽑습니다.
chunker가 적당한 단위로 자릅니다.
metadata enricher가 날짜, 작성자, 권한, 문서 타입을 붙입니다.
embedder가 임베딩을 만듭니다.
indexer가 검색 저장소에 넣습니다.

여기서 metadata가 정말 중요합니다. RAG 품질은 모델보다 메타데이터에서 갈리는 경우가 많습니다.

예를 들어 “최신 가격 정책 알려줘”라는 질문에는 의미 검색만으로 부족합니다. 날짜 필터가 필요합니다. 문서 타입 필터도 필요합니다. 권한 체크도 필요합니다.

3단계. 검색은 하이브리드로 갑니다

벡터 검색만 믿지 마세요. 키워드 검색도 같이 써야 합니다.

4단계. 답변보다 근거 UI를 먼저 만듭니다

많은 팀이 챗 UI부터 만듭니다. 저라면 근거 UI부터 만듭니다.

사용자에게 필요한 것은 이 5가지입니다.

답변
근거 문장
원본 링크
이 답변의 한계
다음 액션

답변만 있으면 사용자는 믿을 수 없습니다. 근거가 있으면 검토할 수 있습니다. 한계가 있으면 오히려 신뢰가 생깁니다.

5단계. 평가셋을 작게 만듭니다

처음부터 자동 평가를 크게 만들 필요는 없습니다. 질문 30개면 시작할 수 있습니다.

구성은 이렇게 합니다.

쉬운 질문 10개
애매한 질문 10개
실패하면 위험한 질문 10개

각 질문마다 기대 답변, 근거 문서, 금지 답변을 적습니다. 이 작은 평가셋이 없으면 개선이 불가능합니다. 느낌으로 품질을 판단하게 됩니다.

8. 데이터/품질 체크리스트

AI 검색 제품은 데모가 쉽습니다. 운영이 어렵습니다. 아래 체크리스트를 초기에 넣어야 합니다.

데이터 체크

문서가 최신인가?
삭제된 문서가 검색에 남아 있지 않은가?
사용자가 볼 권한이 없는 문서가 답변에 섞이지 않는가?
같은 문서가 중복 저장되지 않았는가?
PDF 표가 깨지지 않았는가?
이미지 안의 텍스트를 읽어야 하는가?
문서 작성일과 수정일을 구분했는가?
고객사명, 제품명, 버전명 같은 고유명사가 보존되는가?
원본 링크가 항상 열리는가?
문서별 신뢰 등급을 둘 수 있는가?

검색 품질 체크

질문 의도를 제대로 분류하는가?
너무 오래된 문서가 상위에 오지 않는가?
키워드가 정확한 질문에서 벡터 검색만 쓰고 있지 않은가?
비슷하지만 다른 문서를 구분하는가?
같은 근거만 반복해서 가져오지 않는가?
출처가 부족하면 모른다고 말하는가?
여러 출처가 충돌하면 충돌을 표시하는가?
사용자의 권한에 따라 결과가 달라지는가?
한국어 질문과 영어 문서를 잘 연결하는가?
표, 이미지, PDF에서 온 근거를 따로 표시하는가?

답변 품질 체크

답변에 출처가 붙어 있는가?
출처 문장과 답변 문장이 실제로 연결되는가?
추측과 사실을 구분하는가?
숫자, 날짜, 가격을 임의로 바꾸지 않는가?
사용자가 바로 실행할 수 있는 다음 액션이 있는가?
너무 긴 답변을 만들지 않는가?
질문 범위 밖의 내용을 과하게 추가하지 않는가?
위험한 영역에서는 전문가 검토가 필요하다고 말하는가?
답변 실패 로그를 남기는가?
사용자의 피드백이 다음 검색 품질 개선에 쓰이는가?

9. 가격과 포지셔닝

AI 검색 제품은 “월 9,900원 챗봇”으로 가면 힘듭니다. 대체재가 너무 많습니다.

포지셔닝은 업무 비용으로 잡는 편이 낫습니다.

예를 들어 이렇게 말할 수 있습니다.

“매주 3시간 걸리는 경쟁사 조사를 15분으로 줄입니다.”
“CS 로그에서 이번 주 제품 개선안을 자동으로 뽑습니다.”
“신규 입사자가 같은 질문을 하지 않게 만듭니다.”
“계약서 검토에서 빠진 조항을 먼저 표시합니다.”
“배포 전 핵심 화면 깨짐을 자동으로 찾습니다.”

가격도 사용량보다 결과물 기준이 더 이해하기 쉽습니다.

주간 리포트 10개
연결 문서 1만 개
팀원 10명
고객 상담 로그 월 5천 건
화면 QA 월 100장

처음 고객은 “AI 검색”을 사지 않습니다. 자기 업무의 병목 제거를 삽니다. 그래서 랜딩페이지 첫 문장은 기술 설명이면 안 됩니다. 고객의 반복 업무를 바로 말해야 합니다.

10. 만들 때 피해야 할 것

전사 지식베이스부터 만들기
- 범위가 너무 넓습니다.
- 권한과 품질 문제가 바로 터집니다.
챗봇 UI만 만들기
- 챗봇은 기능의 껍데기입니다.
- 핵심은 데이터 파이프라인과 근거 품질입니다.
벡터 DB만 믿기
- 고유명사, 숫자, 최신성은 별도 처리가 필요합니다.
출처 없는 답변 만들기
- 업무용 제품에서는 신뢰를 잃습니다.
평가셋 없이 개선하기
- 좋아진 것처럼 보일 뿐입니다.
- 실제로는 다른 질문에서 망가질 수 있습니다.
너무 넓은 고객을 잡기
- “모든 회사의 지식 검색”은 약합니다.
- “B2B SaaS CS 로그를 제품 요구사항으로 바꾸기”가 더 강합니다.

11. 지금 바로 할 수 있는 실험

이번 주에 작게 해볼 수 있는 실험은 이렇습니다.

한 업무를 고릅니다.
- 예: 경쟁사 조사, 고객 문의 분석, 사내 문서 검색
데이터 100개만 모읍니다.
- 문서 100개, 상담 로그 100개, 웹 페이지 100개면 충분합니다.
질문 30개를 만듭니다.
- 실제 사용자가 물을 질문이어야 합니다.
정답과 근거를 사람이 적습니다.
- 귀찮지만 가장 중요합니다.
하이브리드 검색을 붙입니다.
- 키워드 + 벡터 + 메타데이터 필터로 시작합니다.
답변에 출처를 붙입니다.
- 원문 링크와 근거 문장을 반드시 보여줍니다.
실패 케이스를 모읍니다.
- “못 찾음”, “틀린 문서”, “오래된 문서”, “권한 문제”로 나눕니다.
한 가지 지표를 정합니다.
- 리서치 시간 절감
- 채택된 요구사항 수
- 답변 재질문률 감소
- QA 누락 감소

이 정도면 거창한 플랫폼 없이도 제품 가능성을 볼 수 있습니다.

결론

AI 검색의 다음 기회는 검색창이 아닙니다. 업무 안에 박힌 리서치 기능입니다.

Deep Research류 기능은 방향을 보여줍니다. 사용자는 링크 목록보다 조사 결과물을 원합니다. RAG는 답변 생성 기술이 아니라 업무 데이터를 운영하는 방식이 됩니다. 멀티모달 검색은 이미지와 PDF까지 업무 지식으로 바꿉니다.

작은 팀이 할 일은 명확합니다.

넓은 AI 검색을 만들지 않습니다.
반복되는 업무 하나를 고릅니다.
이미 존재하는 데이터를 연결합니다.
근거가 있는 결과물을 만듭니다.
고객이 돈을 내는 시간 절감이나 매출 영향으로 말합니다.

처음 만들 제품은 “우리 회사 전용 ChatGPT”가 아닙니다. 너무 넓습니다.

더 좋은 시작점은 이것입니다.

“매주 반복되는 조사 업무 하나를 자동화하는 작은 Deep Research.”

여기서부터 시작하면 됩니다.