Sunday, February 2, 2025

DeepSeek model V3와 R1의 모든 것

DeepSeek: V2에서 R1까지, 실용적 AI 혁신의 여정

DeepSeek V2에서 V3, R1-0 거쳐 R1 개발에 성공하기까지 수많은 도전과 변화를 겪어왔습니다. 지난해 V3 발표될 당시만 해도 회의적인 시각이 많았고, 아직 길이 멀다는 평가 있었습니다. 그러나 올해 1 R1 발표되면서 AI 업계뿐만 아니라 다양한 산업군에서 DeepSeek 대한 관심이 급격히 높아졌습니다.

DeepSeek 기술 발전 과정을 살펴보면, 단순한 성능 개선을 넘어 실용적이고 현실적인 문제 해결에 집중한 접근 방식 돋보입니다. V3 기술 보고서와 R1 발표 논문을 읽다 보면, 기존 연구들을 기반으로 효과적인 최적화를 수행하며, 실제 AI 시스템에 적용할 있는 방법론을 정교하게 발전시켜 왔음 있습니다.

DeepSeek: The Journey from V2 to R1, A Practical AI Innovation

DeepSeek has undergone numerous challenges and transformations, from V2 to V3, R1-0, and ultimately, the successful development of R1Many were skeptical when V3 was announced late last year, believing there was still a long way to go. However, with the release of R1 in January this year, interest in DeepSeek surged across the AI industry and various other sectors.

Examining DeepSeek’s technological advancements from V2 to V3, and then from R1-0 to R1, provides insight into their research trajectory and development philosophy. Reading the V3 technical report and the R1 announcement paper, it becomes evident that their focus is not merely on improving raw performance but on developing a highly practical and effective approach to real-world AI applications.


DeepSeek 둘러싼 평가와 현실

DeepSeek 기술에 대해 "새로운 패러다임을 제시한 것은 아니다", "시장 기술 대비 월등한 성능을 보이는 것도 아니다"라는 평가도 존재합니다.

하지만 DeepSeek 거인의 어깨 위에 올라선 방식은 매우 실용적이며, AI 연구에서 중요한 발전을 이루었다는 점을 간과해서는 됩니다.

논문과 소스코드를 보면, DeepSeek 접근 방식은 단순해 보일 수도 있습니다.

·                   "별것 아닌 같은데?"라는 안도감

·                   " 아이디어를 이렇게 적용하면 효과가 있나?"라는 의구심

하지만, 실제로 오픈소스를 분석해 보면 그러한 안도감과 의구심은 경외감으로 바뀝니다.

Evaluations and the Reality of DeepSeek

There are still claims that "DeepSeek hasn’t introduced a new paradigm of AI" or that "its performance is only comparable to existing technologies, not significantly superior."

However, it’s crucial to recognize that DeepSeek has climbed onto the shoulders of giants in an exceptionally practical way, achieving remarkable progress in AI research.

At first glance, DeepSeek's ideas might seem simple when looking at their papers and source code:

  • "Is this really all that groundbreaking?"—a sense of reassurance.
  • "Would this idea actually be effective when applied this way?"—a feeling of skepticism.

I felt the same way. However, upon analyzing and running their open-source implementation, that initial reassurance and skepticism quickly turned into admiration.


단순하지만 강력한 구현 방식

DeepSeek 공개한 코드는 놀라울 정도로 단순하게 구현되었습니다.

·                   복잡한 이론은 기존 연구를 활용하면서도, Hugging Face 모듈을 적극적으로 활용.

·                   논문에서 다루지 않았지만, 실용적인 최적화 아이디어를 적용하여 더욱 효과적인 모델을 구축.

이러한 점들을 보면, AI 연구에서 "자금이 부족해서 없다", "전폭적인 지원이 부족하다", "인재가 없다" 변명이 이상 통하지 않을지도 모릅니다.
DeepSeek
접근 방식은 누구나 생각해볼 있는 아이디어들이지만, 결국 아이디어들을 제대로 구현하고 실용화한 것이 차별점입니다.

Simple Yet Powerful Implementation

DeepSeek’s open-source code is astonishingly simple and efficient.

  • Instead of reinventing complex theories, they effectively leverage existing research while incorporating Hugging Face modules.
  • They apply fine-grained optimizations, even implementing practical ideas that are not explicitly detailed in their papers.

Considering this, excuses like "lack of funding," "insufficient support," or "shortage of talent" may no longer hold as barriers to AI research.
DeepSeek’s approach is built on ideas that anyone could conceive, yet their true innovation lies in executing and refining these ideas into practical, high-performing systems.


DeepSeek 연구를 정리하며

구슬도 꿰어야 보물 됩니다. DeepSeek 이론과 기술을 체계적으로 연결하여, 실제 AI 시스템에 적용 가능한 형태로 구슬을 꿰어냈습니다.

이번에 V3 R1 문서를 정독하고, 보다 상세하게 내용을 정리했습니다.
글은 강화 학습이나 인공지능에 대한 기초 지식이 있는 분이라면 쉽게 이해할 있도록 구성하였습니다.

역시 공부하는 마음으로 주말을 비워 정리했고, 이를 공유합니다.

DeepSeek 기술 발전 과정과 핵심 아이디어들을 함께 탐구해 보시죠.

Reflections on DeepSeek’s Research

As the saying goes, "A pearl must be strung to become a treasure."
DeepSeek has successfully strung together the right technologies to create a system that is truly applicable in AI practice.

After carefully reading through the V3 and R1 documentation, I have organized and detailed my findings.
This article is structured to be accessible to those with basic knowledge of reinforcement learning and artificial intelligence.

I, too, took the time to study and compile this over the weekend, and now I share it with you.
Let’s explore DeepSeek’s technological advancements and core innovations together.

 


Friday, January 31, 2025

Patents and National Power

"특허는 역사적으로 국가 권력 구축에 어떤 역할을 해왔으며, 21세기 들어 미국, 중국, EU는 지식재산(IP)과 관련하여 각각 어떻게 다른 전략을 펼쳐왔는가?"

"How have patents historically contributed to building national power, and how have the U.S., China, and the EU taken different approaches to intellectual property (IP) in the 21st century?"

이 주제로 ChinaTalk (Jordan Schneider)가 조지메이슨대학교 안토닌 스칼리아 법대의 애덤 모소프(Adam Mossoff) 교수와 진행한 인터뷰가 공개되었습니다.

This is the topic of a recent ChinaTalk (Jordan Schneider) interview with Adam Mossoff, professor at George Mason University’s Antonin Scalia Law School.

이 인터뷰에는 특허 제도와 관련된 주옥같은 통찰이 가득합니다. 특허 제도에 관심 있는 분이라면 꼭 시간을 내어 읽어보시길 강력히 추천드립니다.

This conversation is packed with insightful discussions on the patent system, making it a must-read for anyone interested in intellectual property. I strongly encourage you to take the time to go through it.

주요 내용 Key Takeaways:

- 미국 특허제도의 역사와 특허권의 자연권적 성격

  The history of the U.S. patent system and its natural rights foundation

- 발명을 실시하지 않는 발명가(NPE)의 라이선스 수익화가 특허 제도의 본질적 기능인 이유

  Why the monetization of patents by an inventor (NPEs) is an essential function of the patent system

- 발명(lab or garage invention)혁신(market innovation)의 차이

  The distinction between invention (lab or garage invention) and innovation (market innovation)

- 미국과 영국의 차이: 발명을 혁신(innovation)으로 전환하는 과정

  How the U.S. and the U.K. differ in turning inventions into real-world innovations

- 야셍 황(Yasheng Huang) 교수의 분석: 중국 문명이 특허제도와 비교할 때 과거제(科擧制度)를 선택한 것이 결정적 실수였던 이유

  Yasheng Huang’s analysis: Why China’s reliance on the imperial exam system (Keju) instead of a patent-based system was a historical misstep

- 미국 특허 시스템과 문화적 요인이 어떻게 혁신을 가능하게 했는가

  How the U.S. patent system and cultural factors enabled innovation

- 미국 실용주의와 발명의 민주화(Democratization of Invention)

  The role of American pragmatism and the democratization of invention

- 산업혁명과 기술혁신의 중심이 영국에서 미국으로 이동한 이유

  How the center of industrial and technological innovation shifted from the U.K. to the U.S.

- 현대 특허 시스템의 문제점과 도전 과제

  Modern challenges facing the patent system

- 일론 머스크(Elon Musk)의 특허제도에 대한 인식 변화와 특허의 진정한 역할

  Elon Musk’s evolving stance on patents and the true role of patents in innovation

- 트럼프 행정부의 특허 정책과 향후 전망

  Patent policy under the Trump administration and potential future shifts

- 중국의 지식재산권 정책의 양면성

  China’s two-faced approach to intellectual property—both strengthening its own system and engaging in IP theft

- 표준필수특허(SEP) 전쟁에 중국과 EU의 개입

  The ongoing Standard Essential Patent (SEP) battles involving China and the EU

- 화웨이의 역할 변화

  Huawei’s shifting role in global tech standards

- 중국 법원이 특허 시스템을 정치적으로 활용하는 방식

  How China’s court system is being weaponized to suppress foreign patent holders

- 법치주의(rule of law)특허 시스템의 성패

  Why the rule of law matters for the success of a patent system

- 중국 IP정책에 대한 미국 정부의 대응 전략

  U.S. strategies for countering China’s IP policies

- 미국 특허 시스템의 도덕적·법적·경제적 리더십 회복 필요성

  The urgent need to restore the moral, legal, and economic leadership of the U.S. patent system


📌 혁신과 특허 정책에 대한 깊이 있는 논의를 담고 있는 만큼, 꼭 읽어보시길 바랍니다. 🚀

📌 If you're interested in innovation, intellectual property, and global technology policy, this interview is a must-read! 🚀

나는 지시한다, 고로 창작한다 - AI와 창작자의 새로운 관계, "I Direct, Therefore I Create" - The New Relationship Between AI and the Creator

AI 시대의 창작자, 나는 누구인가? / Who is the Creator in the Age of AI? AI에게 '지시'만 내린 사람, 과연 창작자일까요...