온톨로지라는 말을 처음 들으면 어렵게 느껴집니다. 실제로 검색해보면 “존재론”, “개념화의 명시적 명세”, “시맨틱 웹”, “RDF”, “OWL” 같은 말이 나옵니다. 이런 설명은 틀리지는 않지만, 처음 배우는 사람에게는 거의 도움이 안 됩니다.
실무에서 온톨로지는 이렇게 이해하면 됩니다.
온톨로지는 어떤 분야에서 쓰는 단어들의 뜻, 종류, 관계, 규칙을 정리한 지도입니다.
조금 더 쉽게 말하면, AI나 소프트웨어가 사람 말을 헷갈리지 않도록 “우리 서비스에서는 이 단어가 정확히 무엇을 뜻하는지” 정리해둔 사전이자 관계도입니다.
예를 들어 쇼핑몰에서 “취소”, “환불”, “반품”, “교환”은 사용자가 보기에는 비슷한 말입니다. 하지만 회사 시스템에서는 완전히 다릅니다.
사용자는 “이거 환불해주세요”라고 말할 수 있습니다. 그런데 실제로는 배송 전이면 취소이고, 배송 후면 반품이고, 상품이 불량이면 교환일 수도 있습니다. AI가 이 차이를 모르면 그럴듯하지만 틀린 답을 합니다.
온톨로지는 바로 이런 문제를 줄이기 위해 필요합니다.
사람은 문맥으로 대충 알아듣습니다. 하지만 컴퓨터와 AI 시스템은 대충 알아들으면 문제가 생깁니다.
예를 들어 고객이 이렇게 묻습니다.
어제 산 이어폰 환불돼요?
사람 상담원은 머릿속으로 여러 가지를 확인합니다.
상담원은 “환불”이라는 단어 하나만 보고 답하지 않습니다. 주문, 상품, 배송상태, 정책, 고객등급, 예외조건을 같이 봅니다.
그런데 일반적인 문서 검색 기반 AI는 “환불”이라는 단어와 비슷한 문서를 찾아서 답하려고 합니다. 그래서 이런 식으로 틀릴 수 있습니다.
네, 구매 후 7일 이내에는 환불이 가능합니다.
문장만 보면 그럴듯합니다. 하지만 이어폰이 이미 개봉된 전자제품이면 단순 변심 환불이 안 될 수도 있습니다. 또는 배송 전이면 “환불”이 아니라 “주문 취소”가 맞을 수도 있습니다.
온톨로지는 이런 판단에 필요한 개념과 관계를 정리합니다.
고객 -> 주문함 -> 주문
주문 -> 포함함 -> 상품
상품 -> 속함 -> 전자제품
주문 -> 가짐 -> 배송상태
전자제품 -> 따름 -> 전자제품 환불 규칙
배송상태가 배송 전이면 -> 취소 가능
배송상태가 배송 완료이면 -> 반품 규칙 적용
이렇게 정리해두면 AI는 단순히 “환불” 문서만 찾는 게 아니라, 질문에 관련된 조건을 따라가며 더 정확한 답을 만들 수 있습니다.
온톨로지는 보통 네 가지로 생각하면 됩니다.
하나씩 보겠습니다.
개념은 도메인에서 중요한 대상입니다. 보통 명사로 표현됩니다.
쇼핑몰이라면 이런 것들이 개념입니다.
고객
주문
상품
결제
배송
취소
반품
환불
쿠폰
멤버십
병원 예약 서비스라면 이런 것들이 개념입니다.
환자
의사
진료과
예약
검사
처방
수납
보험
투자 서비스라면 이런 것들이 개념입니다.
사용자
종목
포트폴리오
매수
매도
리밸런싱
수익률
위험도
투자성향
여기서 중요한 점은 “우리 서비스에서 중요한 단어”를 고르는 겁니다. 사전에 있는 모든 단어를 정리할 필요는 없습니다. AI가 자주 답해야 하거나, 틀리면 문제가 되는 단어부터 고르면 됩니다.
속성은 어떤 개념이 가진 세부 정보입니다.
예를 들어 “주문”이라는 개념은 이런 속성을 가질 수 있습니다.
주문번호
주문일
결제상태
배송상태
총금액
사용한 쿠폰
주문한 고객
“상품”은 이런 속성을 가질 수 있습니다.
상품명
카테고리
가격
재고수량
환불 가능 여부
교환 가능 여부
“고객”은 이런 속성을 가질 수 있습니다.
고객ID
이름
회원등급
가입일
누적구매액
속성을 정리하면 AI가 어떤 정보를 확인해야 하는지 명확해집니다.
예를 들어 “이 주문 취소돼요?”라는 질문에 답하려면 주문의 배송상태와 결제상태가 필요합니다. “이 고객 무료배송 대상이에요?”라는 질문에는 고객의 회원등급이나 주문의 총금액이 필요할 수 있습니다.
관계는 온톨로지에서 가장 중요합니다. 단어를 따로따로 적어두는 것은 그냥 사전입니다. 온톨로지는 단어들이 서로 어떻게 연결되는지까지 정리합니다.
예를 들어 쇼핑몰에서는 이런 관계가 있습니다.
고객은 주문을 한다.
주문은 상품을 포함한다.
상품은 카테고리에 속한다.
주문은 결제를 가진다.
주문은 배송을 가진다.
환불은 결제와 연결된다.
반품은 배송 완료 이후에 발생한다.
이걸 조금 더 구조적으로 쓰면 이렇게 됩니다.
고객 --주문함--> 주문
주문 --포함함--> 상품
상품 --속함--> 카테고리
주문 --결제됨--> 결제
주문 --배송됨--> 배송
반품 --대상--> 주문
환불 --대상--> 결제
이런 관계가 있으면 AI는 질문을 받았을 때 필요한 정보를 따라갈 수 있습니다.
예를 들어 사용자가 묻습니다.
배송 완료된 노트북을 반품하면 쿠폰도 다시 돌아오나요?
이 질문은 단순히 “반품 정책” 문서만 봐서는 부족합니다. 관계를 따라가야 합니다.
주문 -> 포함한 상품 -> 노트북
노트북 -> 카테고리 -> 전자제품
주문 -> 사용한 혜택 -> 쿠폰
반품 -> 환불 처리 -> 쿠폰 복구 여부
전자제품 -> 반품 조건 -> 개봉 여부 필요
온톨로지는 이런 연결을 가능하게 합니다.
실무에서는 단어의 뜻보다 규칙이 더 중요할 때가 많습니다.
예를 들어 취소 규칙은 이렇게 쓸 수 있습니다.
배송상태가 배송 전이면 주문 취소 가능
배송상태가 배송 중이면 주문 취소 불가
배송상태가 배송 완료이면 반품 프로세스 안내
반품 규칙은 이렇게 쓸 수 있습니다.
상품 수령 후 7일 이내이면 반품 신청 가능
전자제품은 개봉 후 단순 변심 반품 불가
상품 불량이면 개봉 여부와 관계없이 교환 또는 환불 가능
쿠폰 규칙은 이렇게 쓸 수 있습니다.
주문 전체 취소 시 쿠폰 복구
부분 취소 시 쿠폰 복구 불가
쿠폰 유효기간이 지난 경우 복구 불가
LLM은 문장을 잘 만들지만, 이런 조건 분기를 정확히 지키는 데 약합니다. 그래서 규칙을 따로 구조화해서 넣어줘야 합니다.
많이 헷갈리는 부분입니다.
데이터베이스는 실제 데이터를 저장합니다.
고객 A
주문번호 123
상품명 노트북
결제금액 1,500,000원
배송상태 배송완료
온톨로지는 그 데이터가 어떤 의미인지 설명합니다.
고객은 주문을 할 수 있다.
주문은 하나 이상의 상품을 포함한다.
배송완료 상태의 주문은 취소가 아니라 반품 규칙을 따른다.
전자제품은 개봉 여부가 반품 가능 여부에 영향을 준다.
즉 데이터베이스가 “무슨 일이 있었는지”를 저장한다면, 온톨로지는 “그 일을 어떻게 이해해야 하는지”를 설명합니다.
AI 시스템에서는 둘 다 필요합니다.
RAG는 문서를 검색해서 LLM에게 넣어주는 방식입니다. 온톨로지는 검색 대상이 되는 지식의 구조를 정리하는 방식입니다.
일반 RAG는 이런 식입니다.
질문 -> 비슷한 문서 검색 -> LLM 답변
온톨로지를 붙이면 이렇게 됩니다.
질문 -> 핵심 개념 파악 -> 관련 관계와 규칙 확인 -> 관련 문서 검색 -> LLM 답변
예를 들어 “배송 중인데 취소돼요?”라는 질문이 들어오면, 일반 RAG는 “취소 정책” 문서를 찾습니다. 온톨로지가 있으면 먼저 이렇게 판단합니다.
질문 속 개념: 주문 취소, 배송상태
배송상태: 배송 중
규칙: 배송 중 주문은 취소 불가, 반품 안내 필요
필요 문서: 취소 정책, 반품 정책
그래서 답변이 더 정확해집니다.
처음부터 거대한 지식 그래프를 만들 필요는 없습니다. 스프레드시트 하나로 시작할 수 있습니다.
예를 들어 고객지원용 온톨로지는 이렇게 만들 수 있습니다.
개념: 취소
쉬운 설명: 배송이 시작되기 전 주문을 없애는 것
비슷한 개념: 환불, 반품
필요 조건: 배송상태가 배송 전이어야 함
예외: 이미 출고 처리된 주문은 취소 불가
다음 액션: 취소 불가 시 반품 안내
개념: 반품
쉬운 설명: 받은 상품을 다시 보내고 환불을 요청하는 것
비슷한 개념: 취소, 교환
필요 조건: 배송 완료 후 신청 가능
예외: 개봉한 전자제품은 단순 변심 반품 불가
다음 액션: 반품 신청서 작성 안내
개념: 환불
쉬운 설명: 결제한 금액을 돌려받는 것
비슷한 개념: 취소, 반품
필요 조건: 취소 또는 반품 승인 필요
예외: 쿠폰, 포인트, 부분 취소 여부에 따라 금액 달라짐
다음 액션: 환불 예정 금액 안내
이 정도만 있어도 상담 AI는 훨씬 나아집니다. 사용자가 “환불”이라고 말해도 실제 상황에 따라 취소, 반품, 교환으로 안내할 수 있기 때문입니다.
가장 쉬운 방법은 질문과 관련된 온톨로지 조각만 프롬프트에 넣는 겁니다.
사용자 질문:
배송 중인데 주문 취소하고 싶어요.
관련 개념:
- 취소: 배송 시작 전 주문을 없애는 것
- 반품: 배송 완료 후 상품을 다시 보내고 환불을 요청하는 것
관련 규칙:
- 배송 전: 취소 가능
- 배송 중: 취소 불가
- 배송 완료: 반품 신청 가능
답변 방식:
- 먼저 취소 가능 여부를 말한다
- 불가능한 이유를 짧게 설명한다
- 다음에 할 수 있는 행동을 안내한다
이렇게 넣으면 답변은 자연스럽지만, 판단은 규칙을 따르게 됩니다.
예상 답변은 이런 식입니다.
현재 배송 중인 주문은 바로 취소하기 어렵습니다. 취소는 배송이 시작되기 전까지만 가능하기 때문입니다. 상품을 받은 뒤 반품 조건에 해당하면 반품 신청을 할 수 있습니다. 상품 수령 후 반품 가능 기간과 상품 개봉 여부를 확인해 주세요.
중요한 건 LLM에게 모든 온톨로지를 한 번에 넣지 않는 겁니다. 질문과 관련 있는 개념과 규칙만 넣어야 합니다. 너무 많이 넣으면 오히려 답변이 흐려집니다.
온톨로지는 모든 서비스에 필요한 건 아닙니다. 하지만 아래 분야에서는 효과가 큽니다.
취소, 환불, 반품, 교환, 배송, 쿠폰처럼 비슷하지만 다른 개념이 많습니다. 상태에 따라 답이 달라지기 때문에 온톨로지가 잘 맞습니다.
계좌, 거래, 포트폴리오, 리스크, 수익률, 투자성향, 상품등급 같은 개념이 서로 연결됩니다. 잘못 답하면 법적 문제가 생길 수 있으므로 규칙 구조화가 중요합니다.
증상, 진료과, 검사, 처방, 예약, 보험이 연결됩니다. 단, 의료 분야는 답변 가능 범위와 금지 범위를 매우 엄격하게 관리해야 합니다.
계약서, 조항, 의무, 예외, 판례, 당사자 관계가 중요합니다. 단순 키워드 검색보다 관계 기반 검색이 유리합니다.
서비스, API, 데이터베이스 테이블, 배포환경, 장애, 담당자 관계를 정리하면 온콜 대응이나 신규 입사자 온보딩에 도움이 됩니다.
온톨로지 프로젝트가 실패하는 이유는 대체로 비슷합니다.
처음부터 회사 전체 지식을 다 정리하려고 하면 망합니다. 범위가 너무 커지고, 누구도 유지보수하지 않습니다.
작게 시작해야 합니다. “환불 상담 AI 정확도 올리기”처럼 좁은 문제 하나가 좋습니다.
전문가만 이해하는 RDF, OWL 구조로만 관리하면 현업 담당자가 수정하지 못합니다. 현업이 수정하지 못하는 온톨로지는 금방 낡습니다.
처음에는 스프레드시트나 마크다운이 더 좋습니다.
개념 정리는 열심히 했는데 실제 사용자 질문과 연결하지 않으면 쓸모가 없습니다. 온톨로지는 반드시 “AI가 자주 틀리는 질문”에서 출발해야 합니다.
실무에서 사고는 대부분 예외에서 납니다. 기본 규칙보다 예외 규칙이 더 중요할 때가 많습니다.
기본: 7일 이내 반품 가능
예외: 개봉한 전자제품 단순 변심 반품 불가
예외: 상품 불량이면 개봉 여부와 관계없이 처리 가능
이런 예외가 빠지면 AI는 자신 있게 틀립니다.
처음에는 아래 표로 충분합니다.
개념 | 쉬운 설명 | 상위 개념 | 비슷하지만 다른 개념 | 필요한 속성 | 관련 규칙 | 예외 | 다음 액션 | 담당자 | 참고 문서
예시는 이렇게 채웁니다.
개념: 취소
쉬운 설명: 배송 전 주문을 없애는 것
상위 개념: 주문 처리
비슷하지만 다른 개념: 환불, 반품
필요한 속성: 배송상태, 결제상태
관련 규칙: 배송 전만 취소 가능
예외: 출고 준비 완료 주문은 취소 불가
다음 액션: 반품 안내
담당자: CX팀
참고 문서: 주문 취소 정책 v3
이 템플릿으로 20개만 정리해도 시작할 수 있습니다.
좋은 온톨로지는 멋있어 보이는 그래프 그림이 아닙니다. 좋은 온톨로지는 AI 답변을 덜 틀리게 만들고, 사람이 고치기 쉬운 구조입니다.
좋은 온톨로지는 이런 특징이 있습니다.
온톨로지는 AI에게 “우리 회사에서는 이 말이 이런 뜻이고, 이 상황에서는 이렇게 판단해야 한다”고 알려주는 구조입니다.
LLM은 말을 잘합니다. 하지만 업무 규칙을 저절로 정확히 아는 것은 아닙니다. RAG는 문서를 찾아줍니다. 하지만 문서 사이의 관계와 예외를 항상 이해하는 것은 아닙니다.
온톨로지는 그 사이를 메웁니다.
이 다섯 가지를 연결하는 역할을 합니다.
온톨로지를 배우려면 도구부터 찾지 마세요. 먼저 AI가 자주 틀리는 질문을 모으세요.
추천 순서는 이렇습니다.
이렇게 시작하면 온톨로지는 어려운 이론이 아니라, AI 답변 품질을 올리는 실무 도구가 됩니다.