Posts

Showing posts from February, 2025

누구나 쉽게 이해할 수 있는 강화학습 원리(The Principles of Reinforcement Learning Made Easy)

Image
I. 들어가는 말(Background) 얼마 전 한 변호사님이 강화학습이 무엇인지 질문하셨습니다. 딥러닝 및 인공지능 기술을 수학적 배경 지식이 부족한 분께 설명하는 것은 쉽지 않은 일입니다. 이를 해결하기 위해, "역와쿠이 요시유키. (2020). 엑셀로 배우는 순환 신경망·강화학습 초(超)입문"이라는 책을 참고하여, 수학적 용어를 최소화하고 논리적으로 설명을 시도하였습니다. 이 책을 바탕으로, 수학적 기초 지식이 부족한 분들도 인공지능 컴퓨팅 기술의 기본을 이해할 수 있도록 이 글을 작성하게 되었습니다. 이 과정은 저에게도 관련 내용을 체계적으로 정리할 수 있는 좋은 기회가 되었습니다. Not long ago, a lawyer asked me what reinforcement learning is. Explaining deep learning and artificial intelligence technologies to someone without a strong mathematical background is no easy task. To address this challenge, I referred to the book Excel de Manabu RNN & Reinforcement Learning: A Super Introductory Guide  by Yoshiyuki Yakuwa (2020). Drawing from this resource, I attempted to provide a logical explanation while minimizing the use of mathematical terminology. Based on this book, I wrote this piece to help those with limited mathematical knowledge grasp the fundamentals of AI computing technologies. This process also provided me wi...

특허출원 건수가 기술 혁신리더의 증거인가 (Is the number of patent applications evidence of technological innovation leadership)?

우리나라에서는 미국 내 특허 출원 건수를 근거로 우리가 첨단 기술 주도권을 확보하고 있다며 안도하는 경향이 있습니다. 하지만 미국은 빅테크 기업들의 출원 건수나 순위 자체에는 큰 의미를 두지 않는 것으로 보입니다. 물론 동아시아 국가들이 미국 내 특허 출원에서 높은 점유율을 차지하는 부분은 미국내 미치는 영향 때문에 경계하고는 있지만, 미국은 기술 혁신의 강점을 빅테크가 아닌 분산된 리틀테크(스타트업, 중소기업, 대학, 개인 발명가 등)의 네트워크에서 찾고 있는 것이 인상적입니다. In Korea, there is a tendency to feel reassured about having secured leadership in advanced technologies by focusing on the number of U.S. patent applications filed by Korean companies. However, the U.S. doesn’t seem to place much emphasis on the application numbers or rankings of big tech companies. While the high share of U.S. patent applications from East Asian countries—such as Korea and China—raises concerns due to its potential impact on the domestic market, it’s notable that the U.S. views its strength in technological innovation as stemming not from big tech but from a  decentralized network of “little tech” players  (startups, small businesses, universities, and individual inventors). PatentlyO 블로그를 운...

DeepSeek model V3와 R1의 모든 것

Image
DeepSeek: V2 에서 R1 까지 , 실용적 AI 혁신의 여정 DeepSeek 은 V2 에서 V3, R1-0 을 거쳐 R1 개발에 성공하기까지 수많은 도전과 변화를 겪어왔습니다 . 지난해 말 V3 가 발표될 당시만 해도 회의적인 시각이 많았고 , 아직 갈 길이 멀다는 평가 가 있었습니다 . 그러나 올해 1 월 R1 이 발표되면서 AI 업계뿐만 아니라 다양한 산업군에서 DeepSeek 에 대한 관심이 급격히 높아졌습니다 . DeepSeek 의 기술 발전 과정을 살펴보면 , 단순한 성능 개선을 넘어 실용적이고 현실적인 문제 해결에 집중한 접근 방식 이 돋보입니다 . V3 기술 보고서와 R1 발표 논문을 읽다 보면 , 기존 연구들을 기반으로 효과적인 최적화를 수행하며 , 실제 AI 시스템에 적용할 수 있는 방법론을 정교하게 발전시켜 왔음 을 알 수 있습니다 . DeepSeek: The Journey from V2 to R1, A Practical AI Innovation DeepSeek has undergone numerous challenges and transformations, from V2 to V3, R1-0, and ultimately, the successful development of R1 .  Many were skeptical when V3 was announced late last year , believing there was still a long way to go . However, with the release of R1 in January this year, interest in DeepSeek surged across the AI industry and various other sectors . Examining DeepSeek’s technological advan...