Showing posts with label 특허 청구항. Show all posts
Showing posts with label 특허 청구항. Show all posts

Tuesday, September 30, 2025

특허 vs 영업비밀: DeepSeek V3 & R1 사례로 배우는 AI 기술 보호법

Blogging_CS · · 읽는 데 약 12분 소요

전문가 분석 보고서 원문을 기반으로 DeepSeek의 핵심 기술적 가치와 이를 보호하기 위한 구체적인 지식재산권 전략을 완벽하게 해부합니다.

AI 기술의 발전이 눈부신 요즘, 단순히 강력한 모델을 개발하는 것을 넘어 그 안에 담긴 기술적 가치를 어떻게 ‘지식재산(IP)’으로 보호하고 활용할 것인지가 기업의 명운을 가르는 핵심 과제가 되었습니다. 최근 저는 DeepSeek-V3와 R1 모델의 소스코드를 기술적, 법률적 관점에서 심층 분석한 방대한 전문가 보고서를 접할 기회가 있었습니다. 오늘은 그 보고서의 날카로운 분석을 바탕으로, AI 시대의 IP 전략이 어떠해야 하는지에 대한 구체적이고 실질적인 이야기를 나눠보고자 합니다.

✍️ 이 글의 기반이 된 보고서에 대하여

“업로드한 DeepSeek-V3 소스코드 분석 전문가 보고서와 DeepSeek-R1 소스코드 분석 전문가 보고서는 공개된 DeepSeek-v3와 DeepSeek-R1 기술 논문, GitHub 저장소, 및 관련 학술 문헌을 기반으로 Claude에 지시하여 소스코드를 기술과 법률측면에서 다양한 관점에서 분석한 보고서입니다. 각 보고서는 60페이지가 넘습니다. 이 보고서를 시작으로 전문가가 검증하며 분석을 더 심층적으로 또는 확장하면 정말 최고의 보고서가 될 것입니다. 지면의 한계로 이 전체 보고서를 공개하지 못하는 점이 너무 아쉽습니다. 이젠 정말 전문가들이 할 영역이 바뀌어 가고 있습니다.”

🚨 주의사항: 본 블로그 포스트에서 제공하는 지식재산권 분석 및 법률적 의견은 일반적인 정보 제공을 목적으로 합니다. 구체적인 법률 자문이 필요한 경우, 반드시 해당 분야의 전문 변리사 또는 변호사와 상담하시기 바랍니다.

1. 특허성 분석: 무엇이 법적 권리가 될 수 있는가?

모든 기술이 특허가 될 수는 없습니다. 기존에 없던 새로움(신규성)과 그 분야의 전문가가 쉽게 생각해낼 수 없는 기술적 도약(진보성)을 입증해야 합니다. DeepSeek 모델들은 이 두 가지 요건을 충족하는 여러 기술적 혁신을 명확히 보여줍니다.

DeepSeek-V3: 효율성과 확장성의 한계를 넘다

V3는 거대 모델을 더 효율적으로 만들고 더 길게 생각하게 하는 실용적인 문제 해결에 집중했으며, 그 과정에서 강력한 특허 대상 기술들을 만들어냈습니다.

① 보조 손실 없는 로드 밸런싱 (진보성 평가: ★★★★☆)

MoE 아키텍처의 오랜 숙제는 여러 ‘전문가(Expert)’들에게 작업을 균등하게 분배하는 것이었습니다. 기존 방식은 ‘보조 손실(auxiliary loss)’이라는 페널티 항을 추가해 억지로 균형을 맞추려 했고, 이 과정에서 2~5%의 성능 저하가 발생했습니다. DeepSeek-V3는 이 문제를 ‘바이어스 항(bias term)’을 각 전문가의 활용도에 맞춰 동적으로 조절하는 기발한 아이디어로 해결했습니다. 그 결과, 성능 저하를 0.5% 이하로 막으면서도 구현은 더 간단하고 안정적인, 모든 면에서 뛰어난 진보를 이루었습니다.

② 다중 헤드 잠재 어텐션 (MLA) (진보성 평가: ★★★★★)

LLM이 긴 글을 기억하게 하려면 Key-Value 캐시라는 막대한 메모리가 필요합니다. MLA는 이 KV 캐시를 저차원 잠재 공간으로 압축하여 메모리 사용량을 획기적으로 줄인 기술입니다. 기존 MQA(Multi-Query Attention) 방식이 토큰당 약 516KB를 사용했다면, MLA는 단 70KB만 사용하여 7.4배의 압축률을 달성했습니다. 이는 긴 컨텍스트 처리 능력의 실질적인 향상에 직접 기여하는, 산업적 가치가 매우 높은 발명입니다.

③ FP8 혼합 정밀도 훈련 (진보성 평가: ★★★★★)

세계 최초로 671B라는 초거대 모델 규모에서 FP8 훈련의 실용성을 검증했습니다. 기존 기술이 텐서 단위로 양자화하던 것을 타일/블록 단위로 세분화하고, 역양자화 시점을 지연시키는 독자적인 전략을 통해 정확도 손실을 1%에서 0.25% 미만으로 줄였습니다. 이는 LLM 훈련 비용을 극적으로 낮출 수 있는, 산업계 파급 효과가 엄청난 핵심 기술입니다.

DeepSeek-R1: 추론 능력의 패러다임을 바꾸다

R1은 ‘모델을 어떻게 가르칠 것인가’라는 근본적인 질문에 새로운 답을 제시하며, 훈련 방법론 자체에서 독보적인 혁신을 이루었습니다.

① 순수 RL 추론 학습 (진보성 평가: ★★★★★)

기존 AI는 인간이 만든 정답지(SFT 데이터)를 보고 배워야 추론 능력이 생긴다고 믿었습니다. DeepSeek-R1-Zero는 이 통념을 완전히 뒤집었습니다. SFT 없이 오직 강화학습(RL)만으로, 즉 모델 스스로 문제 풀이를 시도하고 보상을 받으며 학습하는 과정에서 ‘사고의 연쇄(CoT)’와 같은 고차원적인 추론 능력이 자연스럽게 발현됨을 세계 최초로 대규모 모델에서 입증했습니다. 이는 추론 능력의 기원에 대한 과학적 검증이자, LLM 훈련 패러다임을 전복시키는 강력한 발명입니다.

② 다단계 RL 파이프라인 (진보성 평가: ★★★★☆) & ③ 대형→소형 추론 증류 (진보성 평가: ★★★★★)

R1은 ‘Cold-start 데이터로 기본기 학습 → 1차 RL로 추론 집중 훈련 → SFT로 지식 확장 → 2차 RL로 종합 능력 최적화’로 이어지는 독창적인 파이프라인을 설계하여 실용적인 균형점을 찾았습니다. 특히, R1이라는 거대 교사 모델의 복잡한 추론 과정(자기 검증, 성찰)을 데이터로 만들어 소형 학생 모델에 전수하는 추론 증류 기술은 직접 RL 대비 훈련 비용을 93% 절감하면서 성능은 27.6%p나 향상시키는, 경이로운 경제적 가치를 지닌 발명입니다.

2. 영업비밀 분석: 수백억 원 가치의 ‘복제 불가능성’

소스코드와 논문은 빙산의 일각입니다. 물밑에는 경쟁사가 결코 복제할 수 없는 수년간의 노하우와 데이터, 즉 영업비밀이 숨겨져 있습니다.

DeepSeek-V3의 핵심 영업비밀은 14.8조 토큰에 달하는 훈련 데이터의 정확한 소스 구성비, 품질 필터링 기준, 단계별 혼합 전략과 같은 데이터 큐레이션 노하우입니다. 또한 최적의 하이퍼파라미터를 찾기까지의 수많은 실패 기록과, R1의 추론 능력을 V3로 이전시킨 ‘지식 증류 프로토콜’의 상세 내용은 리버스 엔지니어링이 거의 불가능한 최고 등급의 영업비밀입니다.

DeepSeek-R1의 경우, 그 가치는 더욱 명확합니다. 순수 RL 훈련을 가능하게 한 ‘콜드 스타트 데이터’의 구성 방법론, 다단계 파이프라인 각 단계의 정확한 하이퍼파라미터, 증류에 사용된 80만 건 데이터의 선별 기준 등은 R1을 R1답게 만드는 ‘영혼’과도 같습니다.

보고서는 이 모든 과정을 외부에서 완벽히 재현하는 것은 거의 불가능하다고 단언합니다. 특히 DeepSeek-R1을 처음부터 재현하는 데 드는 최소 비용은 약 988만 달러(약 136억 원)이지만, 수많은 미공개 노하우를 고려한 기대 비용(Expected Cost)은 무려 3,293만 달러(약 450억 원)에 성공 확률은 30%에 불과할 것으로 추정했습니다. 이것이 바로 특허만으로는 지킬 수 없는, 영업비밀의 막대한 가치입니다.

3. 종합 IP 전략 및 특허 청구항 설계

보고서는 이 모든 분석을 종합하여 다음과 같은 다층적 ‘하이브리드 IP 전략’을 최우선으로 권고합니다.

  1. (우선순위 1) 핵심 독창 기술 특허 출원: 위에서 분석한 원천 기술들은 반드시 특허로 출원하여 법적 권리를 선점해야 합니다. 이는 방어적 목적뿐만 아니라 기술 라이선싱의 기반이 됩니다.
  2. (우선순위 1) 영업비밀 보호 강화: 데이터 큐레이션, 하이퍼파라미터 튜닝 노하우 등은 내부 자산으로 엄격히 통제하고 문서화하여 지속적인 경쟁 우위를 확보해야 합니다.
  3. (우선순위 2) 오픈소스 및 국제 특허(PCT) 전략: 코드와 가중치를 공개하여 생태계를 구축하고, 동시에 국제 특허 출원을 통해 글로벌 시장에서의 권리를 확보해야 합니다.

이 전략의 성패는 결국 ‘특허 청구항(Claim)’을 얼마나 잘 설계하느냐에 달려있습니다. 보고서의 상세한 청구항 예시들을 통해 권리 범위가 어떻게 정의되는지 살펴보겠습니다.

[특허 청구항 예시: DeepSeek-V3]

청구항 (보조 손실 없는 로드 밸런싱): 대규모 언어 모델의 Mixture-of-Experts 계층에서 전문가 간 로드 밸런싱을 수행하는 방법으로서, (a) 게이트 네트워크가 입력 토큰에 대한 전문가별 친화도 점수를 계산하는 단계; (b) 상기 친화도 점수에 전문가별 바이어스 항을 가산하는 단계; (c) 바이어스가 가산된 점수에 기초하여 상위 K개 전문가를 선택하는 단계; 및 (d) 상기 바이어스 항을 전문가의 활용도에 반비례하도록 동적으로 업데이트하는 단계를 포함하고, 보조 손실 함수(auxiliary loss function)를 사용하지 않는 것을 특징으로 하는 로드 밸런싱 방법.

[특허 청구항 예시: DeepSeek-R1]

청구항 (순수 RL 추론 학습)

청구항 1: 대규모 언어 모델의 추론 능력을 개발하는 방법으로서,
  (a) 사전 훈련된 기본 언어 모델을 제공하는 단계;
  (b) 지도학습 미세조정(SFT) 단계를 생략하는 단계;
  (c) 상기 기본 모델에 강화학습(RL)을 직접 적용하는 단계로서,
    - 수학 및 코딩 문제를 프롬프트로 제공하고,
    - 모델이 생성한 응답을 객관적 기준으로 평가하고,
    - Group Relative Policy Optimization (GRPO)를 사용하여 정책을 업데이트하는 단계;
  (d) 상기 강화학습을 수천 단계 반복하는 단계; 및
  (e) 상기 과정을 통해 Chain-of-Thought 추론 능력이 자연스럽게 발현되도록 하는 단계를 포함하고,
상기 방법이 지도학습 미세조정을 사용하지 않는 것을 특징으로 하는 추론 능력 개발 방법.

청구항 2: 청구항 1에 있어서, 상기 강화학습 과정에서 다음의 창발적 행동이 자연스럽게 발현되는 것을 특징으로 하는 방법:
  - 자기 검증 (Self-verification)
  - 성찰 (Reflection)
  - ‘아하 모먼트’ 표현
  - 긴 Chain-of-Thought 생성 (3000+ 토큰)

청구항 (다단계 훈련 파이프라인)

청구항 1: 대규모 언어 모델의 훈련 방법으로서,
  (a) 사전 훈련된 기본 모델에 소량의 Cold-start 데이터로 초기 미세조정하는 제1 SFT 단계;
  (b) 추론 중심 프롬프트를 사용하여 제1 강화학습을 수행하는 단계;
  (c) 상기 강화학습 체크포인트에서 Rejection Sampling으로 고품질 데이터를 생성하는 단계;
  (d) 상기 생성 데이터와 비추론 데이터를 혼합하여 제2 SFT를 수행하는 단계; 및
  (e) 모든 시나리오를 포함하는 프롬프트로 제2 강화학습을 수행하는 단계를 순차적으로 포함하는 다단계 훈련 방법.

청구항 2: 청구항 1에 있어서, 상기 Cold-start 데이터는 전체 훈련 데이터의 5% 미만이며, 주로 Chain-of-Thought 시연 예제로 구성되는 것을 특징으로 하는 방법.

청구항 (대형→소형 추론 증류)

청구항 1: 대규모 추론 모델의 능력을 소형 모델로 전이하는 지식 증류 방법으로서,
  (a) 671B 파라미터의 교사 추론 모델을 준비하는 단계;
  (b) 상기 교사 모델로 800,000개 이상의 추론 시연 데이터를 생성하는 단계로서, 각 시연은 3000 토큰 이상의 Chain-of-Thought 과정을 포함하고, 자기 검증 및 성찰 패턴을 포함하는 단계;
  (c) 1.5B~70B 파라미터의 학생 모델을 상기 시연 데이터로 미세조정하는 단계; 및
  (d) 상기 학생 모델이 교사 모델의 추론 패턴을 모방하도록 학습시키는 단계를 포함하고,
상기 증류된 학생 모델이 동일 크기 모델에 직접 강화학습을 적용한 경우보다 우수한 추론 성능을 보이는 것을 특징으로 하는 지식 증류 방법.

자주 묻는 질문 (FAQ)

Q: DeepSeek-V3의 가장 중요한 특허 기술 하나만 꼽는다면 무엇인가요?

A: ‘보조 손실 없는 로드 밸런싱’ 기술입니다. 기존 MoE 모델의 고질적인 문제였던 성능 저하를 매우 간단하면서도 효과적인 방식으로 해결했기 때문에 신규성과 진보성이 매우 높게 평가됩니다. 다른 기술들도 뛰어나지만, 이 기술은 문제 해결 방식의 독창성 면에서 특히 돋보입니다.

Q: R1의 ‘순수 RL’ 방식이 왜 AI 훈련의 패러다임을 바꿀 수 있다고 평가받나요?

A: 기존에는 복잡한 추론 능력을 가르치려면 인간이 만든 방대한 양의 정답(CoT 데이터)을 주입하는 SFT 과정이 필수라고 여겼습니다. 하지만 R1은 SFT 없이도 모델이 스스로 시행착오를 통해 추론 능력을 ‘깨우칠’ 수 있다는 것을 대규모로 증명했습니다. 이는 앞으로 AI가 인간의 지식 주입 없이도 더 높은 수준의 지능을 스스로 발견할 수 있다는 가능성을 열었기 때문에 패러다임 전환으로 평가받습니다.

Q: 왜 ‘콜드 스타트 데이터’ 같은 노하우는 특허가 아닌 영업비밀로 보호해야 하나요?

A: 특허는 기술을 대중에게 공개하는 대가로 20년간 독점권을 받는 제도입니다. 하지만 ‘좋은 콜드 스타트 데이터’의 기준, 소스, 구성 비율 같은 노하우는 특허 문서에 구체적으로 담아내기도 어렵고, 공개되는 순간 그 가치가 사라져 버립니다. 반면 영업비밀로 보호하면 경쟁사가 수백억 원을 쏟아부어도 쉽게 복제할 수 없는 강력한 ‘기술적 해자(moat)’가 되어 20년 이상 지속되는 경쟁 우위를 제공할 수 있습니다.

Q: 소스코드를 오픈소스로 공개하면서 동시에 특허권을 주장하는 것이 가능한가요?

A: 네, 완벽하게 가능하며, 이는 매우 영리한 전략입니다. 오픈소스 라이선스(예: MIT, Apache 2.0)는 주로 ‘저작권’에 기반하여 코드의 사용, 복제, 수정을 허락하는 것입니다. ‘특허권’은 코드에 구현된 기술적 아이디어(발명)에 대한 독점적 권리이므로 별개입니다. 따라서 기업은 코드를 공개해 생태계를 넓히면서도, 핵심 기술에 대한 특허권을 확보하여 경쟁사가 해당 기술을 상업적으로 무단 사용하는 것을 막거나, 특허 침해 소송으로부터 자사를 보호하는 ‘방어적 목적’으로 활용할 수 있습니다.

Saturday, September 6, 2025

‘추상적 아이디어’ 공격을 피하는 프롬프트 특허 전략

 

AI에게 내리는 단순한 명령, 특허가 될 수 있을까? LLM 프롬프트 기술이 단순한 ‘아이디어’를 넘어 어떻게 구체적인 ‘기술적 발명’으로 인정받을 수 있는지, 그 핵심 전략과 국가별 법적 기준을 심층적으로 분석합니다.

우리 주변에 LLM 모델에게 지시하는 프롬프트 기법이나 그 프롬프트를 특허로 보호받을 생각을 하는 사람은 거의 없는 것 같습니다. 저도 처음에는 ‘단순히 컴퓨터에 내리는 명령인데 이게 특허가 될까?’ 하는 의구심이 들었죠. 하지만 이 주제에 대해 깊이 파고들면서, 특정 조건을 만족할 경우 충분히 가능하다는 결론에 이르게 되었습니다. 이 글은 제가 도달한 일련의 사고 과정을 정리한 것이며, 아직 학술적으로 확립된 견해는 아닐 수 있다는 점을 감안하고 읽어주시면 좋겠습니다. 😊

 

🤔 프롬프트, 단순한 ‘사람의 생각’이라 특허가 안 된다고요?

많은 분들이 가장 먼저 떠올리는 장벽은 바로 ‘인간의 정신적 활동’은 특허 대상이 아니라는 원칙일 겁니다. 실제로 “프롬프트는 근본적으로 인간의 개입이며, 이러한 인간의 정신적 활동이 개입되는 기술은 특허 대상이 아니다”라는 주장은 특허 심사에서 가장 강력한 거절 이유 중 하나입니다. 이는 특히 미국 연방대법원의 앨리스 판례(Alice Corp. v. CLS Bank) 이후 더욱 확고해진 기준이죠. 사람이 머릿속으로 생각해서 할 수 있는 일을 단순히 컴퓨터로 구현한 것만으로는 특허를 받을 수 없다는 의미입니다.

이 논리에 따르면, 우리가 프롬프트를 통해 AI에게 무언가를 지시하는 행위는 결국 사람의 머릿속 생각을 표현한 것이니, 특허가 될 수 없다는 결론에 쉽게 다다를 수 있습니다. 하지만 이 주장은 절반은 맞고 절반은 틀립니다. 바로 여기서부터 우리의 특허 확보 전략이 시작됩니다.

💡 알아두세요!
특허법이 문제 삼는 ‘인간의 개입’은 시스템에 명령을 내리는 행위 자체가 아닙니다. 발명의 핵심 아이디어가 인간의 머릿속에서 실질적으로 수행될 수 있는 정신적 단계에 머무는 경우를 의미합니다. 따라서 우리의 프롬프트 기술이 이 경계를 넘어서는 것임을 증명하는 것이 핵심입니다.

 

📊 관점의 전환: ‘명령어’에서 ‘컴퓨터 제어 기술’로

프롬프트 기술의 특허 가능성을 열기 위한 첫걸음은 관점을 바꾸는 것입니다. 우리의 기술을 ‘인간이 AI에게 보내는 메시지’가 아니라, ’복잡한 컴퓨터 시스템(LLM)의 내부 연산 과정을 특정 구조의 데이터를 통해 제어하여, 기술적 문제를 해결하고 구체적인 성능 향상을 이끌어내는 기술’로 재정의해야 합니다.

중국의 DeepSeek-R1의 알고리즘을 가만히 들여다보면, 다양한 프롬프트 기법을 그대로 구현하고 있다는 사실을 발견할 수 있습니다.

생각해보세요. 수십억 개의 파라미터를 가진 LLM에 특정 전문가 역할을 부여하고, 복잡한 라이브러리 의존성 정보를 컨텍스트로 주입하며, 수많은 제약 조건을 조합해 최적의 코드를 생성하도록 제어하는 과정은 명백히 ‘인간의 정신 능력으로는 실질적으로 수행 불가능한(cannot practically be performed in the human mind)’ 영역입니다. 이는 미국 특허상표청(USPTO)의 가이드라인이나 판례에서도 특허 적격성을 인정하는 중요한 기준이 됩니다.

 

🌍 주요국 특허청별 핵심 심사 기준 비교

프롬프트 기술의 특허 가능성은 모든 나라에서 동일하게 평가되지 않습니다. 국제 출원을 고려한다면 주요국 특허청의 미묘한 시각차를 이해하는 것이 매우 중요합니다.

1. USPTO (미국 특허청) – 추상적 아이디어 예외 강조

미국 특허청은 대법원 판례에서 비롯된 Alice/Mayo 2단계 테스트를 엄격히 적용합니다. 단순히 인간의 사고 과정을 대체하는 지시나 일반적 언어 표현은 “추상적 아이디어”로 보아 배제될 수 있습니다. 그러나 프롬프트가 구체적인 기술적 구현(예: 모델 정확도 개선, 특정 하드웨어 연산 최적화)에 연결되어 있음을 입증하면 특허 적격성을 인정받을 여지가 있습니다.

2. EPO (유럽 특허청) – 기술적 효과(technical effect) 중심

유럽 특허청은 ”기술적 성격” 및 “기술적 효과”를 기준으로 판단합니다. 단순히 데이터 입력이나 언어 규칙을 제시하는 수준은 발명성이 없다고 보지만, 프롬프트 구조가 기술적 문제를 해결하는 수단(예: 연산 효율 개선, 메모리 사용 최적화, 특정 장치와의 상호작용 강화)으로 기능한다면 특허 적격성을 인정할 수 있습니다.

3. KIPO (한국 특허청) – 소프트웨어 발명의 실체적 요건 강조

한국 특허청은 “자연법칙을 이용한 기술적 사상의 창작”이라는 전통적 요건을 중시합니다. 따라서 단순히 문장이나 언어 규칙으로서의 프롬프트는 기술적 사상이 아니라고 보지만, 특정 알고리즘·하드웨어·시스템과 결합하여 구체적인 기술적 결과를 도출함을 입증하면 발명으로 인정될 수 있습니다. 특히 한국 실무에서는 구체적 시스템 구조나 처리 흐름을 함께 제시해야 설득력이 큽니다.

핵심 비교 요약

특허청 핵심 요건
USPTO (미국) 추상적 아이디어 예외를 피하기 위한 ‘구체적 기술 구현’ 강조
EPO (유럽) ‘기술적 효과(technical effect)’ 입증이 핵심. 단순 데이터 조작은 불가
KIPO (한국) 자연법칙을 이용한 기술적 사상 + 시스템/구조적 구현 강조
⚠️ 국제출원 시사점
동일한 “LLM 프롬프트” 기술이라도 미국에서는 “추상적 비즈니스 방법”으로, 유럽에서는 “비기술적 언어 규칙”으로, 한국에서는 “단순 아이디어”로 배제될 위험이 각각 존재합니다. 따라서 국제출원을 고려한다면, 공통분모인 ‘구체적인 시스템 아키텍처’와 ‘측정 가능한 기술적 효과’를 명세서 전반에 명확히 드러내는 전략이 필수적입니다.

 

🧮 특허 청구항 구성 실무 가이드 (상세편)

그렇다면 ‘인간의 개입’이라는 공격을 피하고 ‘기술적 발명’임을 명확히 하려면 특허 청구항을 어떻게 작성해야 할까요? 핵심 전략 4가지를 더 구체적으로 살펴보겠습니다.

1. 주어를 ‘사람’이 아닌 ‘컴퓨터(프로세서)’로 설정하세요.

이는 발명의 중심을 ‘사용자의 정신 활동’에서 ‘기계의 기술적 동작’으로 옮기는 가장 중요한 단계입니다. 청구항의 모든 단계가 컴퓨터 하드웨어(프로세서, 메모리 등)에 의해 수행됨을 명시해야 합니다.

  • Bad 👎: 사용자가 LLM에 페르소나를 지정하고 코드를 생성하는 방법.
  • Good 👍: 프로세서가(A processor), 사용자의 입력을 수신하여 특정 프로그래밍 언어의 전문가 페르소나를 LLM에 부여하는 단계.

2. 프롬프트를 ‘구조화된 데이터’로 구체화하세요.

‘자연어 프롬프트’와 같은 추상적인 표현 대신, 컴퓨터가 처리하는 구체적인 데이터 구조임을 명확히 해야 합니다. 이는 발명이 단순한 아이디어가 아님을 보여줍니다.

  • Bad 👎: LLM에 자연어 프롬프트를 제공하는 단계.
  • Good 👍: 라이브러리 명칭 및 버전 제약 조건을 포함하는 기계 판독 가능한 컨텍스트 스키마(a machine-readable context schema)를 생성하여 LLM에 제공하는 단계.

3. 결과물이 아닌 ‘시스템 성능 개선’을 청구하세요.

‘좋은 코드’와 같은 주관적인 결과물이 아니라, 컴퓨터의 기능을 실질적으로 향상시키는 객관적이고 측정 가능한 효과를 명시해야 합니다. 이것이 바로 ‘기술적 효과’의 핵심입니다.

  • Bad 👎: 최적화된 코드를 생성하는 단계.
  • Good 👍: 상기 스키마를 통해 LLM의 토큰 생성 확률을 제어하여, 코드 호환성 오류를 감소시키고 GPU 메모리 사용량을 절감하는 최적화된 코드를 생성하는 단계.

4. ‘자동화’ 과정을 명확히 하세요.

최초의 입력을 제외한 모든 과정(데이터 구조화, LLM 제어, 결과 생성 등)은 인간의 추가적인 판단 없이 시스템에 의해 자동으로(Automatically) 이루어진다는 점을 명시하여, 재현 가능한 기술 프로세스임을 보여줘야 합니다.

 

📜 강화된 청구항 예시

앞서 설명한 전략들을 모두 통합하면 다음과 같이 강화된 특허 청구항을 구성할 수 있습니다.

[청구항] 최적화된 코드를 생성하는 컴퓨터 구현 방법으로서,

  1. (a) 프로세서가 사용자의 자연어 입력을 파싱하여, 특정 프로그래밍 언어의 전문가 역할을 정의하는 페르소나 식별자를 생성하는 단계;
  2. (b) 프로세서가 상기 입력 및 외부 코드 저장소를 참조하여, 라이브러리 명칭과 버전 제약조건, 하드웨어 메모리 사용 한계치를 포함하는 구조화된 컨텍스트 데이터(structured context data)를 생성하는 단계;
  3. (c) 프로세서가 상기 페르소나 식별자 및 구조화된 컨텍스트 데이터를 포함하는 제어 프롬프트를 생성하여 LLM에 전송함으로써, LLM의 내부 토큰 생성 과정을 자동으로 제어하는 단계;
  4. (d) 상기 제어된 LLM으로부터, 상기 제약조건을 만족하고 컴파일 오류율이 사전 정의된 임계값 미만이며 GPU 메모리 사용량이 감소된 최적화된 코드를 수신하는 단계를 포함하는 방법.

→ 이 예시는 단순한 결과물이 아니라, ‘컴파일 오류율 감소’, ‘GPU 메모리 사용량 감소’와 같은 시스템 수준의 측정 가능한 기술적 효과를 명확히 함으로써 특허 등록 가능성을 크게 높입니다.

 

자주 묻는 질문 ❓

Q: “고양이 시를 써줘” 같은 간단한 프롬프트도 특허를 받을 수 있나요?
A: 아니요, 그 자체는 아이디어에 불과하여 특허를 받기 어렵습니다. 특허의 대상은 시를 생성하기 위해 특정 데이터 구조(예: 시적 장치, 운율 구조를 정의한 스키마)를 가진 프롬프트를 사용하여 LLM을 제어하고, 그 결과 컴퓨팅 자원을 덜 사용하거나 특정 스타일의 시를 더 정확하게 생성하는 등의 기술적 방법이나 시스템입니다.
Q: 프롬프트 기술의 ‘기술적 효과’는 구체적으로 어떤 것들이 있나요?
A: 대표적으로 코드 생성 시 컴파일 오류율 감소, GPU나 메모리 같은 컴퓨팅 리소스 사용량 절감, 응답 생성 시간 단축, 특정 데이터 형식(JSON, XML 등)의 출력 정확도 향상 등이 있습니다. 중요한 것은 이 효과가 측정 가능하고 재현 가능해야 한다는 점입니다.
Q: 국제 출원 시 국가마다 청구항을 다르게 작성해야 하나요?
A: 네, 핵심 전략은 같지만 각 특허청이 중시하는 포인트에 맞춰 강조점을 달리하는 것이 유리합니다. 예를 들어, 미국(USPTO) 명세서에는 ‘컴퓨터 기능의 구체적 개선’을, 유럽(EPO)에는 ‘기술적 문제 해결을 통한 기술적 효과’를, 한국(KIPO)에는 ‘시스템 구성과 처리 흐름의 구체성’을 더 부각시키는 방식입니다.

결론적으로, AI 프롬프트를 특허로 보호받는 길은 분명히 존재합니다. 다만, ‘무엇을 요청하는가’라는 아이디어의 차원을 넘어, ‘어떻게 컴퓨터 시스템을 기술적으로 제어하고 개선하는가’를 명확히 보여주는 전략적 접근이 필요합니다. 이 글이 여러분의 혁신적인 아이디어를 강력한 지식재산으로 만드는 데 작은 실마리가 되었으면 합니다. 더 궁금한 점이 있다면 댓글로 물어봐 주세요~ 😊

당신이 알아야 할 데이터 거인: 팔란티어와 스노우플레이크 심층 분석

  시작점부터 데이터 철학, 그리고 AI 전략까지, 두 거대 테크 기업의 핵심을 심층 비교 분석합니다. 데이터가 핵심인 AI 시대, 두 거인의 전략은? 이 글에서는 최근 가장 주목받는 두...