- 홈
- DeepSeek 뉴스
- DeepSeek V4 오픈 소스 공개 임박! GitHub 코드베이스, 'Model1'을 춘절의 스타로 드러내다

DeepSeek V4 오픈 소스 공개 임박! GitHub 코드베이스, 'Model1'을 춘절의 스타로 드러내다
오픈 소스 커뮤니티의 위대함은 개발자들의 날카로운 눈을 피할 수 있는 주요 업데이트가 없다는 사실에 있습니다. DeepSeek-R1이 오픈 소스 공개 1주년을 맞이하는 바로 그 시점에, 차세대 플래그십 모델의 흔적이 GitHub 저장소에 조용히 나타났습니다.
DeepSeek V4 오픈 소스 공개 임박!
2026년 1월 21일, 기술 커뮤니티는 DeepSeek의 FlashMLA 최적화 라이브러리에서 중요한 단서를 발견했습니다. "Model1"이라는 새로운 모델 식별자가 최근 코드 커밋에 등장한 것입니다. 이러한 커밋은 여러 파일에 걸쳐 있으며 현재 V3.2 모델과 함께 Model1을 언급하여 이것이 별도의 새로운 브랜치임을 분명히 나타냅니다.
이 발견은 이번 달 초 기술 미디어 The Information의 독점 보도와 일치합니다. DeepSeek는 2월 중순 음력설 기간 동안 코드명 V4인 차세대 플래그십 모델을 출시하기 위해 집중적으로 준비하고 있다는 것입니다. 오픈 소스 커뮤니티의 단서부터 권위 있는 언론의 교차 검증에 이르기까지, Model1이 V4라는 추측은 거의 기정사실이 되었습니다.
오픈 소스 1주년을 위한 기술적 헌사
정확히 1년 전, DeepSeek-R1의 출시는 오픈 소스 LLM의 새로운 시대를 열었으며 Hugging Face 플랫폼에서 가장 많은 '좋아요'를 받은 모델이 되었습니다. 이제 R1의 오픈 소스 공개 1주년이 되는 날, V4의 코드가 조용히 등장하여 오픈 소스 분야에 대한 DeepSeek의 헌신을 이어가고 있습니다.
추론 능력에 집중했던 R1과 달리, V4는 포괄적인 아키텍처 업그레이드를 가져올 것으로 예상됩니다. 유출된 정보에 따르면 V4는 총 6,710억 개의 매개변수를 가지고 있으며, MoE(Mixture of Experts) 아키텍처와 mHC(Manifold Constrained Hyperconnection) 기술을 채택했고, Engram 메모리 모듈의 추가가 가장 큰 특징이 될 가능성이 있습니다.
기술 커뮤니티는 GitHub의 DeepSeek FlashMLA 저장소 업데이트에 큰 관심을 기울이고 있습니다. 모든 커밋이 V4에 대한 더 많은 기술적 세부 정보를 드러낼 수 있기 때문입니다. 현재 커밋 기록으로 볼 때, DeepSeek 엔지니어들은 희소 주의 메커니즘(sparse attention mechanisms)과 FP8 추론 지원을 집중적으로 최적화하고 있으며, 이는 모두 V4의 대규모 배포를 위한 준비입니다.
Engram: 판도를 바꾸는 "메모리 플러그인"
가장 기대되는 것은 최근 DeepSeek가 오픈 소스로 공개한 혁신적인 아키텍처 혁신인 Engram 기술이 V4에 통합될 가능성입니다. 핵심 개념은 "메모리"를 "연산"에서 분리하는 것입니다. 기존 Transformer 모델은 고정된 문구와 상식을 인식하기 위해 여러 계층의 네트워크를 사용해야 했지만, Engram은 모델이 룩업 테이블 "슈퍼 사전"을 통해 정적 지식을 직접 검색할 수 있게 하여 깊은 신경망이 복잡한 추론에 집중할 수 있도록 해줍니다.
이러한 설계는 직관에 반하는 결과를 가져옵니다. 수학 및 코드 생성과 같이 강력한 추론이 필요한 작업에서도 성능이 크게 향상됩니다. 모델이 더 이상 "기계적 암기"를 위해 컴퓨팅 파워를 분산시킬 필요가 없기 때문입니다. 연구에 따르면 Engram-27B는 순수 MoE 베이스라인에 비해 BigBench Hard 추론 작업에서 5.0포인트, HumanEval 코드 생성에서 3.0포인트 향상되었습니다.
더 중요한 것은 Engram 아키텍처가 수천억 매개변수의 "지식 기반"을 저렴한 CPU 메모리에 저장하는 것을 지원하며, 추론 중 처리량 손실이 3% 미만이라는 점입니다. 이는 대규모 모델의 기업 배포 비용이 크게 절감될 것으로 예상되며, 더 이상 비싼 GPU VRAM에 전적으로 의존하지 않아도 됨을 의미합니다.
커뮤니티의 화제에서 업계의 기대로
Model1 코드 유출에 대한 논의는 Reddit의 MachineLearning 섹션과 Hacker News에서 며칠 동안 계속되고 있습니다. 개발자들은 코드 변경 사항에서 V4의 전체 그림을 맞추기 위해 GitHub의 최신 커밋을 한 줄 한 줄 분석하고 있습니다.
"이것은 전형적인 DeepSeek 스타일입니다. 과도한 마케팅 티저는 없고, 코드가 스스로 말하게 합니다." 한 기술 포럼의 수석 개발자가 논평했습니다. 이러한 "기술로 말하기" 접근 방식은 오히려 기술 커뮤니티 내에서 더 강력한 신뢰와 기대를 쌓았습니다.
R1의 오픈 소스 성공에서 V4의 모멘텀까지, DeepSeek는 새로운 오픈 소스 패러다임을 확립하고 있습니다. 공식 출시 전에 코드베이스의 점진적인 업데이트를 통해 커뮤니티가 미리 참여하고 적응할 수 있도록 하는 것입니다. 이 전략은 새로운 모델의 채택 장벽을 낮출 뿐만 아니라 커뮤니티 공동 구축이라는 독특한 분위기를 조성합니다.
"춘절 출시"의 성공 전략 재현
DeepSeek는 "춘절 출시"의 황금률에 정통한 것 같습니다. 작년 R1은 음력설 기간에 출시되어 전 세계 개발자들의 비교적 자유로운 시간을 활용해 오픈 소스 커뮤니티에서 빠르게 입소문을 탔습니다.
이 타이밍 선택은 전략적 고려사항으로 가득 차 있습니다. 서구 기술 기업의 빽빽한 출시 일정을 피하고 비교적 조용한 기술 뉴스 사이클에서 우위를 점하는 것입니다. 동시에 개발자와 연구자들은 춘절 기간 동안 더 많은 여가 시간을 가지며 새로운 모델을 깊이 있게 테스트하고 탐색할 의향이 있어 커뮤니티 내에서 더 깊은 입소문 확산을 형성합니다.
Model1 코드의 지속적인 업데이트와 함께 DeepSeek V4의 최신 뉴스와 깊이 있는 해석을 얻고자 하는 독자는 deepseekv4.app의 추적 보고서를 계속 팔로우할 수 있습니다. 이 독립적인 추적 웹사이트는 코드 유출부터 기술 분석까지 전체 정보 체인을 정리하여 많은 개발자가 V4 진행 상황을 파악하는 선호 채널이 되었습니다.
R1에서 V4까지 DeepSeek는 항상 한 가지 사실을 증명해 왔습니다. 진정한 혁신은 모델 규모뿐만 아니라 아키텍처의 지혜와 오픈 소스 정신의 완벽한 결합에 있다는 것입니다. Model1의 코드가 GitHub에서 조용히 퍼질 때, 우리가 보는 것은 단순한 새 모델의 탄생이 아니라 새로운 패러다임의 개막입니다. 이번 음력설, 오픈 소스 AI 세계는 또 다른 중대한 돌파구를 맞이할지도 모릅니다.
더 많은 게시물

OpenAI 플래그십 GPT-5.4 전격 출시: 1M 컨텍스트+네이티브 에이전트로 DeepSeek V4 저지!
OpenAI가 100만 네이티브 컨텍스트와 에이전트 엔진을 탑재한 최강 플래그십 모델 GPT-5.4를 기습 발표했습니다. DeepSeek V4 출시 전 기술적 격차를 통해 방어선을 구축하려는 전략입니다.


전 세계가 DeepSeek V4 출시를 기다리고 있습니다. 왜 아직 '뚜껑'을 열지 않았을까요? 그 이면의 진실은 생각보다 하드코어합니다!
왜 DeepSeek V4는 3월 2일 약속을 어겼을까요? 그 배후에 숨겨진 세 가지 핵심 도박: 국산 컴퓨팅 기반 마이그레이션, 멀티모달 올라운드 플래그십, 그리고 전략적 출시 윈도우.


경량화 모델의 전쟁: GPT-5.3 Instant와 Gemini 3.1 Flash-Lite 등장, DeepSeek V4는 어떻게 우위를 점할 것인가?
OpenAI와 Google이 같은 날 GPT-5.3 Instant와 Gemini 3.1 Flash-Lite를 발표하면서 경량화 모델 시장이 다시 뜨거워지고 있습니다. 본 기사에서는 이 두 모델이 OpenClaw와 같은 에이전트 생태계에 미치는 영향과 DeepSeek V4의 핵심 경쟁 우위를 심층 분석합니다.

뉴스레터
커뮤니티 가입
최신 뉴스 및 업데이트를 받으려면 뉴스레터 구독