온톨로지 소양 교육 — GT·WT 진단 온톨로지 프로젝트

1 지금 우리가 쓰는 방식 — Vector RAG

문서를 임베딩 벡터로 바꿔 다차원 공간에 흩뿌립니다. 질문도 같은 공간의 벡터로 변환해, 방향과 거리가 비슷한 청크를 top-k로 가져와 LLM에 넘기는 구조예요.

방향과 거리값만으로 검색하는 구조라, 질문의 의미론적 맥락을 온전히 이해하지 못해 엉뚱한 문서를 인용하는 환각(Hallucination) 리스크가 존재합니다.

2 한계 · Reranking

그래서 보통 Reranking을 덧댑니다.

---> 후보를 넓게 모은 뒤, 크로스 인코더·LLM 등으로 순서만 다시 잡아요.

Reranking은 검색이 끝난 뒤에 붙는 사후 보정입니다.

---> 그런데 Reranking이 잘 돼도 비슷한 문서를 더 잘 줄세운 것일 뿐, 왜 답인지 설명할 근거로는 부족합니다.

GraphRAG 는 —— 검색한 뒤 고치는 게 아니라, 구조·규칙이 처음부터 의미를 잡아주는 사전 보정 입니다.

우리가 만드는 건 "문서 검색기"가 아닌 "문서 추론기"입니다. 검색/재정렬로는 닿을 수 없던 지식이, 그래프에서는 가능해집니다.

3 그래서 무엇이 달라지나 — 검색·재정렬로는 닿지 못하는 3가지

위에서 정렬을 앞(구조)에서 한다는 건 단순히 빠른 게 아닙니다. 단순 재정렬(사후)로는 원리적으로 불가능한 것들이 비로소 가능해집니다.

① 근거 추적

지나온 경로 전체가 근거 — 센서·적용 룰·매뉴얼 조항까지 100% 추적.

② 인과 추론

단일 문서엔 없던 원인→영향→결론에 관계를 타고 도달.

③ 오답 차단

"경보 해제"처럼 표현만 비슷한 정반대 답을 규칙으로 배제.

4 결정적이어야 하는 영역과, AI가 넓혀야 하는 영역

지식 자산(Knowledge Assets)은 고정되어야 하고, 그 위에서의 추론·탐색은 열려 있어야 합니다.

(현장 특화 비즈니스 로직)

현장 전문가의 지식 자산은 결정적 형태로 구조화되어야 합니다.

전문가 지식은 그대로 반영되어야 합니다.

(근거에 기반한 추론)

탄탄한 근거(Core Business Logic) 위에서 자유롭고 넓은 추론이 필요합니다.

탐색에 가한 인위적 제약은 풀어주어야 합니다.

왜 지금, Graph RAG인가