아무것도 모르는 AI를 특허 전문가로 만드는 워크플로우 설계법
이전 블로그에서 예고드린 바와 같이, 이번 글에서는 LLM을 활용한 특허청구범위 해석 작업 방법을 구체적으로 소개하겠습니다.
이번에 소개하는 방법은 보다 정확히 말하면, 구글 NotebookLM의 딥리서치(Deep Research) 기능을 통해 확보한 지식을 클로드(Claude)의 스킬(Skill) 형태로 주입하는 방식입니다. 다양한 접근 방법이 존재하지만, 제 경험상 이 방식이 비교적 안정적이고 일관된 결과를 제공했습니다.
*참고로 NotebookLM과 클로드(Code 또는 App)를 연동하는 MCP(Model Context Protocol)도 존재합니다. 다만 현재는 GitHub를 통해 비공식적으로 배포된 상태이기 때문에, 실무에서는 아직 사용하지 않고 있습니다.
다양한 특허 분석으로의 확장과 핵심 요소
본 글에서는 청구범위 해석(Claim Construction)을 중심으로 설명하지만, 동일한 워크플로우는 다음의 업무에도 그대로 확장 적용할 수 있습니다.
- 특허 침해 분석 (Infringement Analysis)
- 등록 가능성 검토 (Patentability Search)
- 무효 가능성 분석 (Invalidity Search)
다만 이러한 분석에서는 공통적으로 중요한 요소가 있습니다. 바로 해당 기술 분야의 통상의 기술자(PHOSITA)가 보유한 기술상식(Common General Knowledge)과 선행기술(Prior Art)을 LLM에 어떻게 확보하고 주입할 것인가입니다.
이 부분은 결과의 정확도를 좌우하는 핵심 요소이며, 구체적인 방법은 개인적인 노하우에 해당합니다. 실무적으로는 다음 세 가지가 매우 중요하며, 이는 결국 특허법 법리 및 판례법에 대한 깊은 이해를 기반으로 설계되어야 합니다.
- 선행기술의 시간적 범위
- 기술상식의 범위 설정
- 조사 대상의 정밀한 선택
이러한 과정은 신입사원에게 업무를 지시하는 상황과 유사합니다. 충분한 경험과 명확한 기준을 제공하지 않으면, 결과 역시 일관성을 기대하기 어렵습니다. LLM의 출력은 본질적으로 확률적(Probabilistic)입니다. 따라서 동일한 모델이라도 어떤 지침을 제공하느냐에 따라 결론이 달라질 수 있습니다. (참고로 기본 설정 기준에서는 클로드가 비교적 일관된 응답을 유지하는 경향이 있습니다.)
결국 핵심은 ‘워크플로우의 설계’
실무적으로는 다음과 같은 원칙을 따르는 것이 바람직합니다.
- 작업을 단계별로 분해할 것
- 각 단계마다 명확한 가이드를 제공할 것
- 가이드에는 법리와 판례법의 기준을 반영할 것
또한 현재 상용 LLM은 컨텍스트 윈도우(Context Window)의 한계가 있기 때문에, 아래의 사항을 준수해야 합니다.
- 분석 대상은 가능한 ‘최소 단위’로 나눌 것
- 작업 역시 분할하여 수행할 것
이를 무시할 경우, 모델이 문맥을 유지하지 못해 결과의 정확도가 급격히 저하될 수 있습니다.
실전 작업 절차: 딥리서치를 통한 법리 주입
이제 실제 작업 절차를 살펴보겠습니다. 먼저 구글의 NotebookLM에서 새로운 노트를 생성합니다. 이 단계는 하나의 분석 인력을 확보하는 것과 유사하게 볼 수 있습니다. 그 다음, 청구범위 해석과 관련된 법리 및 판례를 딥리서치 기능을 통해 조사하고, 이를 NotebookLM의 소스(Source)로 등록합니다.
초기 대화창에서 “딥리서치” 기능을 활성화한 후, 다음과 같은 지시를 입력합니다.
보다 정교한 결과를 얻기 위해서는, 아래와 같이 프롬프트를 구체화하여 입력하는 것이 바람직합니다. 이는 실무에서 신입사원에게 구체적인 업무 지침을 제공하는 것과 동일한 접근입니다. 저는 아래와 같은 프롬프트를 사용하였습니다.
프롬프트 실행 후 일정 시간이 지나면, NotebookLM은 1건의 보고서와 약 20여 건의 관련 자료를 수집하여 소스로 추가할 것인지 여부를 사용자에게 확인합니다. 이 단계에서 ‘주요 소스’를 검토한 후, 불필요하거나 신뢰성이 낮은 자료는 제외하고 나머지 소스를 모두 추가하도록 지시합니다.
이 과정은 단순한 정리가 아니라, 분석의 기초 데이터 품질을 통제하는 중요한 단계입니다. 실제 실행 과정에서는 일부 소스가 정상적으로 불러와지지 않는 경우가 발생할 수 있습니다. 이러한 실패 소스는 분석 정확도를 저하시킬 수 있으므로, 반드시 제거하는 것이 바람직합니다.
*참고로, 동일한 프롬프트를 사용하더라도 실행 시점이나 사용자 환경에 따라 결과는 달라질 수 있습니다. 이는 LLM이 확률적 방식으로 작동하기 때문이며, 자연스러운 현상입니다.
핵심 법리 도출 및 검증
다음 단계에서는, 수집된 판례를 기반으로 특허청구범위 해석에 관한 공통 법리를 도출합니다. 이는 신입사원에게 “조사 결과를 정리하여 핵심 법리를 도출하라”고 지시하는 과정과 유사합니다. 이를 위해 다음과 같은 프롬프트를 입력합니다.
이 단계에서 도출된 결과를 검토해보면, 판결문 표현을 그대로 인용하는 경우가 많아 실무에 직접 적용하기 어려운 추상적 기준이 포함되거나, 일부 법리가 불완전하게 반영되는 문제가 나타날 수 있습니다. (예를 들어, 출원경과 참작 원칙이 균등론과의 관계에서만 제한적으로 언급되는 경우가 있었습니다.)
이에 따라, 저는 별도로 정리해 두었던 실무적 경험칙을 추가로 제공하고, 이를 기존 판례 분석 결과와 비교·검증하도록 지시하였습니다. 이는 신입사원이 도출한 결과를 선배가 보완하고 재검토를 요구하는 과정과 동일합니다. 저는 특허청구범위해석이 쟁점이 되었던 판례와 논문을 꾸준히 수집하여 노트북LM에 넣고 공통된 법리를 정리해왔습니다.
제가 정립한 청구범위 해석 프레임워크(Claim Construction Framework)는 다음과 같습니다.
이 프레임워크를 입력한 후 다음과 같이 검증을 요청하였습니다.
그 결과, 판례와의 정합성에 대한 긍정적인 평가를 얻을 수 있었으며, 동시에 일부 보완이 필요한 지점에 대한 개선안도 함께 제시받을 수 있었습니다. 이와 같은 과정은 단순한 정보 수집을 넘어, 다음과 같은 반복 구조를 형성합니다.
이 구조를 통해 LLM의 환각(Hallucination) 한계를 보완하면서도, 실무적으로 바로 활용 가능한 수준의 객관적인 결과를 도출할 수 있습니다.
(다음 편에서는 이 데이터를 바탕으로 클로드(Claude) Skill 생성을 위한 가이드 작성 및 보완 방법을 계속 다루겠습니다.)

No comments:
Post a Comment