엔비디아의 29조 원 그록(Groq) 인수, 시장의 오해와 실체

엔비디아(NVIDIA)가 크리스마스 이브에 AI 반도체 스타트업 그록(Groq)의 IP와 핵심 인력을 200억 달러(약 29조 원)에 인수했습니다. 이번 딜을 두고, 추론이 확대되면서, GPU는 학습, LPU는 추론이라는 구도가 확립되었다는 해석도 있고, LPU가 추론시장을 주도할 것이라는 얘기들도 있습니다. 추론이 중요한 피지컬AI에서도 LPU 중요성이 높아진다는 얘기, 그리고 그록의 기술이 도입되면 HBM(고대역폭메모리)의 필요성이 줄어들 것이라는 전망도 나옵니다. 물론 저는 반도체 전문가는 … 더 읽기

일본의 ‘소버린 AI’ 전략과 제조 데이터 주권의 한계

일본 정부가 12월 23일 발표한 ‘제1차 AI 기본 계획’과 약 3조 엔 규모의 민관 합동 투자는 일본이 처한 기술적 위기감을 여실히 드러납니다. 행정, 의료, 국방 등 민감한 공공 분야뿐만 아니라 일본 경제의 근간인 제조업 전반에 걸쳐 해외 기술 의존도를 낮추겠다는 의지의 표현이죠. 일본은 소프트뱅크, NTT, 후지쯔 등 주요 자국 기업을 중심으로 대규모 컴퓨팅 인프라를 확충하고, … 더 읽기

일관성+긴 AI비디오 생성 : Memory+Latent = StoryMem

StoryMem: Multi-shot Long Video Storytelling with Memory (2025.12.22) – 이 논문은 기존의 비디오 모델들이 해결하지 못했던 ‘장기적 일관성’ 문제를 해결하기 위한 논문입니다. 현재 AI 기반 비디오 생성 기술은 놀라운 속도로 발전하고 있죠. 하지만 그 화려함 이면에는 치명적인 한계가 존재합니다. 바로 ‘서사의 단절’입니다. 비디오 모델(Sora, Runway 등)은 단일 샷(Single-shot) 생성에는 탁월하지만, 1분 이상의 긴 영상을 만들거나 … 더 읽기

AI 확산의 이면 by World Bank

World Bank가 2025년 12월 발간한 『Digital Progress and Trends Report 2025: Strengthening AI Foundations』 보고서는 AI가 개발도상국과 선진국 모두에 중대한 성장 기회를 제공하는 동시에, 국가 간 디지털 격차를 구조적으로 확대시킬 위험을 내포하고 있음을 분석한 보고서입니다. 이 보고서에서는 AI를 개별 기술이나 단일 산업의 혁신이 아니라, 연결성·연산 자원·데이터·인적 역량이 결합된 국가 단위의 기반(infrastructure)으로 규정합니다. 특히 생성형 AI의 … 더 읽기

CoT 의 진화, 탈언어화와 검증으로

원래 LLM의 발전은 스케일링 법칙(Scaling Laws)에 의존해왔죠. 모델의 파라미터와 데이터량을 늘리면 AI가 선형적으로 향상될 것이라는 믿음은 사실 지금도 유효하긴 합니다. 모델들은 인간의 언어 패턴을 방대한 확률적, 통계적 연산으로 모방하며 놀라운 퍼포먼스를 보여줬으나, 복잡한 논리 구조나 수학적 추론 앞에서는 취약한 한계를 드러냈습니다. LLM은 근본적으로 다음에 올 가장 확률이 높은 단어를 예측하는 시스템입니다. 겉으로는 지능적인 대화를 하는것 … 더 읽기

왜 美 국방부는 팔란티어가 있는데, 구글을 도입했을까?

지난 9일 미국 국방부(DoD)가 구글의 생성형 인공지능 모델인 제미나이를 기반으로 한 ‘GenAI.mil’ 플랫폼을 공식 출범했다는 뉴스는 그냥 보면, 추가적인 빅테크 AI 기술 도입사례로 보일수 있습니다. 하지만, 단순하게만 볼 건 아니라고 생각합니다. 펜타곤에는 이미 팔란티어가 존재하고 있기 때문입니다. 오사마 빈 라덴을 추적하던 숨 막히는 작전에서부터, 지금 이 순간에도 우크라이나의 대평원에서 벌어지는 전투에 이르기까지, 팔란티어의 ‘고담(Gotham)’과 ‘AIP(Artificial … 더 읽기

강릉과학산업진흥원 특강 “AI시대, 대한민국의 기회와 전략” (25.12.3)

강릉과학산업진흥원에서, “AI시대, 대한민국의 기회와 전략“ 이라는 주제로 강원도 공공기관 분들을 대상으로 특강을 하고 왔습니다. 지난 9월 GES(강원이코노믹서밋) 2025에 기조발표 하러 갔다가 뵌 김남수 원장님 초청으로 다녀왔습니다.

RAG의 다음 진화 – 오케스트라 RAG(Orchestra RAG)

지난번 글에서 저는 RAG의 한계를 극복하기 위한 대안으로 ‘하이브리드 RAG(Dynamic GraphRAG)’를 제시한 바 있습니다 데이터의 관계를 파악하는 GraphRAG와 프로세스의 유연함을 더하는 LangGraph의 결합이 RAG의 ‘지능’을 한 단계 높일 수 있다는 주장이었습니다. 하지만 기술의 진화 속도는 우리의 예상보다 훨씬 빠르고 역동적입니다. 그래서, 지난번에 제안했던 하이브리드 전략을 토대로 한 단계 더 나아간, AI 신뢰성의 또하나의 퍼즐을 맞추기 … 더 읽기

한국공공경영학회 포럼 발표 “AI 네이티브 시대의 공공전략” (25.11.30)

오늘은 디지털플랫폼정부위 AI플랫폼혁신국장으로서의 마지막(?) 일정으로 한국공공경영학회 포럼 “공공AX, 행정의 패러다임을 바꾸다” 에서, 발표자로 나서 “AI 네이티브 시대의 공공전략” 주제로 발표했습니다. AI의 구성요소와 작동 원리, LLM·RAG·AI 에이전트 같은 핵심 기술에 대한 이해, 공공 AI의 3대 전략 목표는 사회문제 해결, 대국민 서비스 혁신, 일하는 방식 개선, 이를 달성하기 위해 5대 도입 원칙과 체계적인 도입 절차(보안 등급 분류, … 더 읽기

Nested Learning과 Post GPU, 춘추전국시대

구글이 지난 11월 7일 블로그를 통해, Nested Learning 을 소개했습니다. Nested Learning 은 “학습을 여러 시간축으로 나누는 인간 논의 방식” 을 따라했습니다. 가장 단순하게 표현하면, 모델이 학습하는 속도와 기억하는 방식을 여러 layer로 나누는 학습 구조입니다. 지금까지의 인공지능은 하나의 시간축에서 하나의 최적화 방식으로 파라미터를 업데이트해왔습니다. 매 스텝마다 전체 모델이 똑같은 방식으로 갱신되는 방식입니다. 우리가 공부를 할 … 더 읽기

고려대, “AI와 공공성” 특강 (25.11.18)

오늘은 고대에서 Henny Kwon 교수님 수업인 ’인공지능 윤리와 안전‘ 에서 ‘AI와 공공성’ 주제로 특강을 했습니다. AI 거품 논란 관련해서, ’과연 AI 겨울이 올 것인가‘ 로 시작해, GPU 26만장의 의미, 미중 AI 패권경쟁에서의 전략, 소버린 AI, AI 반도체, 우리나라의 기회와 위기, 공공 AI의 중요성 및 실증사례(난임지원, 장애인소통, 실시간의료자원관리 등)에 대해 많은 얘기를 하고 왔습니다. 대학생들 대상 … 더 읽기

해석 가능 AI를 위한 Sparse 모델 by OpenAI

AI 내부 회로를 해부하기 위한 새로운 해석 패러다임을 제시하는 OpenAI 의 연구가 11.13일자로 OpenAI 블로그에 올라왔네요. 간단히 말하면, 중요하다고 판단된 소수의 가중치만 남기고 나머지는 모두 제거해 연결 구조를 극도로 단순화함으로써, 각 뉴런의 역할이 명확하고 회로가 몇 개에서 수십 개 노드 수준으로 해부 가능한 Sparse LLM을 만들고, 이렇게 찾은 구조를 Bridges를 통해 Dense LLM과 대응시켜 Dense … 더 읽기

AsyncThink : LLM의 다음 진화, 스스로 생각을 조직하는 인공지능 (by MS research)

10월 30일자, Microsoft Research 가 발표한 논문은, LLM이 단일 개체로 사고하던 기존 방식에서 벗어나, 여러 내부 에이전트가 협력적으로 사고하는 ‘Agentic Organization’ 개념을 제안했습니다. 핵심 개념은 AsyncThink(Asynchronous Thinking) 입니다.AsyncThink는 하나의 모델 안에서 Organizer 와 작업자Worker 를 가상적으로 설정하고, 이들이 Fork–Join 구조를 통해 병렬적으로 사고하도록 만듭니다.(그림을 봐야 좀더 이해가 쉽습니다..) Organizer 는 문제를 분석하고 하위 과제를 나누며, … 더 읽기

RAG의 진화, 온톨로지의 귀환

기업, 정부 등 거의 모든 조직들이 LLM, Gen AI 도입에 여전히 열을 올리고 있습니다. 이제는 AI agent 로 향해가고 있죠. 그 중 가장 먼저 널리 채택된 방식은 단연 RAG(Retrieval-Augmented Generation)였습니다. RAG는 LLM의 치명적인 약점인 환각(Hallucination)을 줄여주고, LLM 트레이닝+ 추론 비용도 줄여주는, 조직 내부의 최신 데이터를 참조하게 하는 가장 현실적이고 비용 효율적인 전략으로 각광을 받았습니다. 그런데, … 더 읽기

GES 2025, 기조강연 (25.9.25)

강원도 정선 하이원에서 열린 GES2025에서 “AI시대, 대한민국 기회와 전략, 그리고 강원경제”라는 주제로 1시간30분정도 기조강연을 했습니다. AI에 대한 이해부터, 트랜드(MCP,WFM,AI agent 등), 소버린AI, 기본소득, AI 가 가져올 사회변화와 AI 수용성을 위한 사회문제해결까지 열심히 썰을 풀었습니다. 디지털플랫폼정부 빼고 AI만 얘기한건 처음이네요^^ 재미있고, 좋은 경험이었습니다.