- خانه
- اخبار دیپسیک
- انتشار متنباز DeepSeek V4 قریبالوقوع است! پایگاه کد GitHub 'Model1' را به عنوان ستاره جشنواره بهار فاش میکند

انتشار متنباز DeepSeek V4 قریبالوقوع است! پایگاه کد GitHub 'Model1' را به عنوان ستاره جشنواره بهار فاش میکند
عظمت جامعه متنباز در این واقعیت نهفته است که هیچ بهروزرسانی مهمی از چشمان تیزبین توسعهدهندگان پنهان نمیماند. درست زمانی که DeepSeek-R1 اولین سالگرد متنباز شدن خود را جشن میگیرد، ردپای مدل پرچمدار نسل بعدی به آرامی در مخزن GitHub ظاهر شده است.
انتشار متنباز DeepSeek V4 قریبالوقوع است!
در 21 ژانویه 2026، جامعه فناوری سرنخ کلیدی را در کتابخانه بهینهسازی FlashMLA دیپسیک کشف کرد - یک شناسه مدل جدید به نام "Model1" در کامیتهای اخیر کد ظاهر شد. این کامیتها چندین فایل را در بر میگیرند و از Model1 در کنار مدل فعلی V3.2 نام میبرند، که به وضوح نشان میدهد این یک شاخه جدید و جداگانه است.
این کشف با گزارش اختصاصی رسانه فناوری The Information در اوایل این ماه مطابقت دارد - DeepSeek به شدت در حال آمادهسازی برای راهاندازی مدل پرچمدار نسل بعدی خود با نام رمز V4 در طول سال نو قمری در اواسط فوریه است. از سرنخها در جامعه متنباز تا تأیید متقابل توسط رسانههای معتبر، گمانهزنی مبنی بر اینکه Model1 همان V4 است، تقریباً یک نتیجه قطعی است.
ادای احترام فنی برای اولین سالگرد متنباز
دقیقاً یک سال پیش، انتشار DeepSeek-R1 عصر جدیدی از LLMهای متنباز را باز کرد و به محبوبترین مدل در پلتفرم Hugging Face تبدیل شد. اکنون، در اولین سالگرد متنباز شدن R1، کد V4 به آرامی ظاهر شده است و تعهد DeepSeek به زمینه متنباز را ادامه میدهد.
برخلاف R1 که بر قابلیتهای استدلال متمرکز بود، انتظار میرود V4 ارتقاهای معماری جامعی را به ارمغان بیاورد. طبق اطلاعات فاش شده، V4 در مجموع 671 میلیارد پارامتر دارد و از معماری Mixture of Experts (MoE) و فناوری Manifold Constrained Hyperconnection (mHC) بهره میبرد، که اضافه شدن ماژول حافظه Engram احتمالاً بزرگترین ویژگی برجسته آن است.
جامعه فناوری به دقت بهروزرسانیهای مخزن DeepSeek FlashMLA در GitHub را دنبال میکند، زیرا هر کامیت میتواند جزئیات فنی بیشتری را در مورد V4 فاش کند. از سوابق فعلی کامیت، مهندسان DeepSeek در حال بهینهسازی شدید مکانیسمهای توجه پراکنده (sparse attention) و پشتیبانی از استنتاج FP8 هستند که همگی مقدماتی برای استقرار در مقیاس بزرگ V4 میباشند.
Engram: یک "پلاگین حافظه" که بازی را تغییر میدهد
مورد انتظارترین ویژگی، ادغام احتمالی فناوری Engram در V4 است، یک نوآوری معماری انقلابی که اخیراً توسط DeepSeek متنباز شده است. مفهوم اصلی آن جدا کردن "حافظه" از "محاسبات" است - مدلهای سنتی Transformer نیاز به استفاده از چندین لایه شبکه برای تشخیص عبارات ثابت و عقل سلیم دارند، در حالی که Engram به مدل اجازه میدهد دانش ثابت را مستقیماً از طریق یک "ابر فرهنگ لغت" جدول جستجو بازیابی کند، و شبکههای عمیق را برای تمرکز بر استدلال پیچیده آزاد کند.
این طراحی نتایج خلاف انتظاری را به همراه دارد: حتی برای کارهایی که نیاز به استدلال قوی دارند مانند ریاضیات و تولید کد، عملکرد به طور قابل توجهی بهبود مییابد. زیرا مدل دیگر نیازی به منحرف کردن قدرت محاسباتی خود برای "حفظ طوطیوار" ندارد. تحقیقات نشان میدهد که Engram-27B در مقایسه با مبنای خالص MoE، در وظایف استدلال BigBench Hard به میزان 5.0 امتیاز و در تولید کد HumanEval به میزان 3.0 امتیاز بهبود مییابد.
مهمتر از آن، معماری Engram از ذخیرهسازی یک "پایگاه دانش" از صدها میلیارد پارامتر در حافظه ارزان CPU، با کمتر از 3٪ افت توان در طول استنتاج پشتیبانی میکند. این بدان معناست که انتظار میرود هزینه استقرار سازمانی مدلهای بزرگ به میزان قابل توجهی کاهش یابد و دیگر کاملاً به VRAM گرانقیمت GPU وابسته نباشد.
از هیاهوی جامعه تا انتظارات صنعت
بحث در مورد نشت کد Model1 چندین روز است که در بخش MachineLearning ردیت و Hacker News ادامه دارد. توسعهدهندگان در حال تجزیه و تحلیل آخرین کامیتها در GitHub خط به خط هستند و سعی میکنند تصویر کامل V4 را از تغییرات کد کنار هم بچینند.
یک توسعهدهنده ارشد در یک انجمن فناوری نظر داد: "این سبک معمولی DeepSeek است - بدون تیزرهای تبلیغاتی بیش از حد، اجازه دهید کد خودش صحبت کند." این رویکرد "صحبت با فناوری" در عوض اعتماد و انتظار قویتری را در جامعه فناوری انباشته کرده است.
از موفقیت متنباز R1 تا شتاب V4، دیپسیک در حال ایجاد یک الگوی متنباز جدید است: قبل از انتشار رسمی، از طریق بهروزرسانیهای تدریجی پایگاه کد، به جامعه اجازه دهید از قبل مشارکت و سازگاری داشته باشد. این استراتژی نه تنها آستانه پذیرش را برای مدلهای جدید کاهش میدهد، بلکه فضای منحصر به فردی از ساخت مشترک جامعه ایجاد میکند.
تکرار استراتژی موفق "راهاندازی جشنواره بهار"
به نظر میرسد DeepSeek به خوبی با قانون طلایی "راهاندازی جشنواره بهار" آشناست. سال گذشته، R1 در طول سال نو قمری منتشر شد و از زمان نسبتاً آزاد توسعهدهندگان جهانی برای تشکیل سریع یک گسترش ویروسی در جامعه متنباز استفاده کرد.
این انتخاب زمانبندی پر از ملاحظات استراتژیک است: اجتناب از برنامه فشرده انتشار شرکتهای فناوری غربی و اشغال موقعیت مسلط در چرخه خبری فناوری نسبتاً آرام. در عین حال، توسعهدهندگان و محققان اوقات فراغت بیشتری در طول جشنواره بهار دارند و تمایل بیشتری به آزمایش عمیق و کاوش مدلهای جدید دارند، بنابراین گسترش دهان به دهان عمیقتری را در جامعه شکل میدهند.
با بهروزرسانیهای مداوم کد Model1، خوانندگانی که میخواهند آخرین اخبار و تفسیر عمیق DeepSeek V4 را دریافت کنند، میتوانند به دنبال کردن گزارشهای ردیابی در deepseekv4.app ادامه دهند. این وبسایت ردیابی مستقل زنجیره کامل اطلاعات از نشت کد تا تحلیل فنی را سازماندهی کرده و به کانال ترجیحی بسیاری از توسعهدهندگان برای دریافت پیشرفت V4 تبدیل شده است.
از R1 تا V4، دیپسیک همیشه یک نکته را ثابت کرده است: نوآوری واقعی نه تنها در مقیاس مدل بلکه در ترکیب کامل خرد معماری و روح متنباز نهفته است. وقتی کد Model1 به آرامی در GitHub پخش میشود، آنچه میبینیم نه تنها تولد یک مدل جدید بلکه افتتاح یک الگوی جدید است. در این سال نو قمری، جهان هوش مصنوعی متنباز ممکن است از یک پیشرفت بزرگ دیگر استقبال کند.
پستهای بیشتر

عرضه GPT-5.4 پرچمدار OpenAI: با ۱ میلیون زمینه + ایجنتهای بومی برای مهار DeepSeek V4!
شرکت OpenAI به طور غافلگیرانهای قدرتمندترین مدل پرچمدار خود GPT-5.4 را با ۱ میلیون زمینه بومی و موتور ایجنت عرضه کرد تا پیش از انتشار DeepSeek V4، یک سد دفاعی تکنولوژیک ایجاد کند.


همه منتظر DeepSeek V4 هستند، چرا هنوز منتشر نشده؟ واقعیت ممکن است از آنچه فکر میکنید جدیتر باشد!
چرا DeepSeek V4 در تاریخ ۲ مارس منتشر نشد؟ فاش کردن سه قمار بزرگ پشت پرده: مهاجرت به زیرساختهای محاسباتی داخلی، پرچمدار چندمنظوره و پنجره استراتژیک انتشار.


نبرد مدلهای سبک: GPT-5.3 Instant و Gemini 3.1 Flash-Lite وارد میشوند - DeepSeek V4 چگونه پیشتازی خود را حفظ میکند؟
با عرضه همزمان GPT-5.3 Instant و Gemini 3.1 Flash-Lite توسط OpenAI و گوگل، بازار مدلهای سبک دوباره داغ شده است. تحلیل تأثیر بر اکوسیستمهای ایجنت مانند OpenClaw و مزایای رقابتی DeepSeek V4.

خبرنامه
به جامعه بپیوندید
برای دریافت آخرین اخبار و بروزرسانیها در خبرنامه ما مشترک شوید