- 首頁
- DeepSeek 新聞
- DeepSeek V4 開源在即!GitHub 代碼庫揭示「Model1」為春節之星

DeepSeek V4 開源在即!GitHub 代碼庫揭示「Model1」為春節之星
開源社區的偉大之處在於,沒有任何重大更新能逃過開發者敏銳的眼睛。正值 DeepSeek-R1 慶祝開源一週年之際,下一代旗艦模型的踪跡已在 GitHub 倉庫中悄然浮現。
DeepSeek V4 開源在即!
2026 年 1 月 21 日,技術社區在 DeepSeek 的 FlashMLA 優化庫中發現了一個關鍵線索——一個名為「Model1」的新模型標識符出現在最近的代碼提交中。這些提交跨越多個文件,並將 Model1 與當前的 V3.2 模型並列提及,清楚地表明這是一個獨立的新分支。
這一發現與科技媒體 The Information 本月早些時候的獨家報導不謀而合——DeepSeek 正緊鑼密鼓地準備在 3 月上旬的農曆新年期間發布代號為 V4 的下一代旗艦模型。從開源社區的蛛絲馬跡到權威媒體的交叉驗證,關於 Model1 即為 V4 的推測已幾乎是板上釘釘。
致敬開源一週年的技術獻禮
整整一年前,DeepSeek-R1 的發布開啟了開源 LLM 的新時代,並成為 Hugging Face 平台上最受歡迎的模型。如今,在 R1 開源一週年之際,V4 的代碼悄然現身,延續了 DeepSeek 對開源領域的承諾。
與專注於推理能力的 R1 不同,預計 V4 將帶來全面的架構升級。根據洩露的信息,V4 擁有總計 6710 億個參數,採用混合專家 (MoE) 架構和流形約束超連接 (mHC) 技術,其中 Engram 記憶模組的加入可能是其最大亮點。
技術社區正密切關注 GitHub 上 DeepSeek FlashMLA 倉庫 的更新,因為每一次提交都可能揭示更多關於 V4 的技術細節。從目前的提交記錄來看,DeepSeek 工程師正在密集優化稀疏注意力機制和 FP8 推理支持,這一切都是為 V4 的大規模部署做準備。
Engram:改變遊戲規則的「記憶外掛」
最令人期待的是 Engram 技術在 V4 中的潛在整合,這是一項由 DeepSeek 最近開源的革命性架構創新。其核心理念是將「記憶」與「計算」分離——傳統的 Transformer 模型需要使用多層網絡來識別固定短語和常識,而 Engram 允許模型通過查找表「超級字典」直接檢索靜態知識,從而釋放深層網絡以專注於複雜推理。
這種設計帶來了反直覺的結果:即使對於數學和代碼生成等需要強大推理能力的任務,性能也顯著提高。因為模型不再需要分散算力去「死記硬背」。研究表明,與純 MoE 基線相比,Engram-27B 在 BigBench Hard 推理任務上提高了 5.0 分,在 HumanEval 代碼生成上提高了 3.0 分。
更重要的是,Engram 架構支持將數千億參數的「知識庫」存儲在廉價的 CPU 內存中,推理期間的吞吐量損失低於 3%。這意味著企業部署大模型的成本有望顯著降低,不再完全依賴昂貴的 GPU VRAM。
從社區熱議到行業期待
關於 Model1 代碼洩露的討論已經在 Reddit 的 MachineLearning 板塊和 Hacker News 上持續了數天。開發者們正在逐行分析 GitHub 上的最新提交,試圖從代碼變更中拼湊出 V4 的全貌。
「這是典型的 DeepSeek 風格——沒有過度的營銷預告,讓代碼自己說話,」一位資深開發者在技術論壇上評論道。這種「用技術說話」的方式反而在技術社區積累了更強的信任和期待。
從 R1 的開源成功到 V4 的蓄勢待發,DeepSeek正在建立一種新的開源範式:在正式發布之前,通過代碼庫的漸進式更新,讓社區提前參與和適配。這種策略不僅降低了新模型的採用門檻,還創造了一種獨特的社區共建氛圍。
複製「春節發布」的成功策略
DeepSeek 似乎深諳「春節發布」的黃金法則。去年,R1 在農曆新年期間發布,利用全球開發者相對空閒的時間,迅速在開源社區形成了病毒式傳播。
這種時機選擇充滿了戰略考量:避開西方科技公司的密集發布期,在相對安靜的科技新聞週期中佔據主導地位。同時,開發者和研究人員在春節期間有更多閒暇時間,更願意深度測試和探索新模型,從而在社區形成更深層次的口碑傳播。
隨著 Model1 代碼的持續更新,想要獲取 DeepSeek V4 最新消息和深度解讀的讀者可以繼續關注 deepseekv4.app 上的追蹤報導。這個獨立的追蹤網站整理了從代碼洩露到技術分析的全鏈條信息,成為許多開發者獲取 V4 進展的首選渠道。
從 R1 到 V4,DeepSeek 始終在證明一點:真正的創新不僅在於模型規模,還在於架構智慧與開源精神的完美結合。當 Model1 的代碼在 GitHub 上悄然傳播時,我們看到的不仅是一个新模型的誕生,更是一個新範式的開啟。這個農曆新年,開源 AI 世界或許將迎來又一次重大的突破。
更多文章

OpenAI 旗艦 GPT-5.4 震撼上線:1M 上下文+原生 Agent,封鎖 DeepSeek V4 突圍路徑!
OpenAI 凌晨突襲發佈其最強旗艦模型 GPT-5.4,搭載 100 萬原生上下文與原生代理引擎,旨在通過技術代差在 DeepSeek V4 發佈前先行築起防御工事。


全網都在等 DeepSeek V4 開飯,為何遲遲不“揭鍋”?真相可能比你想的更硬核!
為什麼 DeepSeek V4 在 3 月 2 日爽約?揭秘其背後的三場頂級豪賭:國產算力底座遷移、多模態全能旗艦與戰略發布窗口期。


輕量化模型之戰:GPT-5.3 Instant 與 Gemini 3.1 Flash-Lite 登場,DeepSeek V4 如何保持領先?
隨著 OpenAI 和 Google 同日發布 GPT-5.3 Instant 與 Gemini 3.1 Flash-Lite,輕量化模型市場再次沸騰。本文深入分析這兩款模型對 OpenClaw 等 Agent 生態的影響,以及 DeepSeek V4 在這一變局中的核心競爭優勢。

新聞通訊
加入社區
訂閱我們的新聞通訊,獲取最新新聞和更新