- Beranda
- Berita DeepSeek
- DeepSeek V4 Rilis Minggu Depan? Paper Baru Ungkap Framework Infolensi DualPath yang Revolusioner

DeepSeek V4 Rilis Minggu Depan? Paper Baru Ungkap Framework Infolensi DualPath yang Revolusioner
Menjelang tanggal rilis DeepSeek V4, sebuah makalah tentang framework inferensi DualPath memicu diskusi hangat. Dengan mendobrak hambatan pemisahan PD, framework ini meningkatkan throughput Agen AI sebesar 2 kali lipat, menandakan era karyawan AI 24/7.
Tim DeepSeek sekali lagi menunjukkan ambisinya dalam evolusi "tingkat sistem". Di saat para pengembang di seluruh dunia sedang gencar mencari DeepSeek V4 release date, sebuah makalah berjudul "DualPath" yang diterbitkan bersama oleh tim sistem DeepSeek, Universitas Peking, dan Universitas Tsinghua diam-diam muncul di ArXiv. Ini bukan sekadar publikasi akademis, melainkan "bocoran" awal dari arsitektur inferensi inti DeepSeek V4.
Tujuan utama dari framework DualPath adalah untuk mengatasi titik masalah paling krusial dalam implementasi Agen AI: hambatan I/O pada inferensi teks panjang.
Mendobrak Pemisahan PD: Seni Memanfaatkan "Bandwidth Menganggur"
Dalam arsitektur pemisahan prefilling-decoding (PD-disaggregated) tradisional, semua tugas pemuatan KV-Cache menumpuk di kartu jaringan penyimpanan mesin prefilling, menyebabkan bandwidth jenuh seketika. Sementara itu, kartu jaringan mesin decoding tetap menganggur.
DualPath memperkenalkan jalur kedua yang disebut "Storage-to-Decode", mewujudkan pengumpulan bandwidth penyimpanan klaster secara global. Dalam pengujian nyata pada model skala 660B:
- Throughput inferensi offline meningkat 1,87 kali lipat.
- Throughput layanan online meningkat rata-rata 1,96 kali lipat.
- Latensi kata pertama (TTFT) dioptimalkan secara signifikan, membuat respons Agen hampir mencapai tingkat intuisi manusia.
Kepingan Terakhir untuk Karyawan AI 24/7
Mengapa bersusah payah mengoptimalkan kecepatan "perpindahan" KV-Cache? Jawabannya terletak pada skenario karyawan digital yang beroperasi 24/7.
Agen AI di masa depan bukan lagi sekadar kotak obrolan "tanya-jawab", melainkan seperti yang ditunjukkan oleh OpenClaw, mereka mampu menjalankan tugas secara mandiri sepanjang hari, membaca ribuan email, dan mengelola rantai keputusan yang kompleks. Dalam skenario seperti ini, tingkat hit KV-Cache biasanya di atas 95%. Framework DualPath mempercepat perpindahan "memori lama", membuat operasional Agen dengan konteks sangat panjang menjadi lebih murah dan lebih cepat.
Ini berarti, saat kita menggunakan DeepSeek V4 dalam framework Agen lokal seperti OpenClaw, karyawan AI Anda akan memiliki memori instan yang hampir tak terbatas dan tidak akan mengalami "macet berpikir" saat memproses tugas berat.
Spekulasi Tanggal Rilis DeepSeek V4
Meskipun belum ada tanggal resmi yang diberikan, penulis pertama makalah DualPath, Yongtong Wu, saat ini bekerja di tim sistem DeepSeek. Dikombinasikan dengan peringatan terbaru dari CNBC mengenai dampak model baru DeepSeek terhadap pasar, industri berspekulasi bahwa DeepSeek V4 kemungkinan besar akan memulai debut resminya minggu depan.
Arsitektur DualPath ini mungkin menjadi senjata rahasia yang memungkinkan V4 melampaui performa Agen dari GPT-5 sambil tetap mempertahankan efektivitas biaya yang ekstrem.
๐ Tidak ingin melewatkan rilis besar minggu depan? Klik DeepSeekV4.app untuk berlangganan info instan kami dan dapatkan informasi tangan pertama sebelum berita tersebut meledak di Twitter.
Editor: UIO
Lebih Banyak Postingan

OpenAI Luncurkan GPT-5.4: Konteks 1M + Agen Native untuk Menghadang DeepSeek V4!
OpenAI secara mengejutkan merilis model unggulan terkuatnya, GPT-5.4, yang dilengkapi dengan 1 juta konteks native dan mesin agen, bertujuan membangun benteng teknologi sebelum peluncuran DeepSeek V4.


Seluruh Internet Menunggu DeepSeek V4 โ Mengapa Belum Juga 'Matang'? Kebenarannya Mungkin Lebih Keras dari yang Anda Kira!
Mengapa DeepSeek V4 melewatkan jadwal 2 Maret? Ungkap tiga taruhan besar di balik penundaan ini: migrasi ke infrastruktur komputasi domestik, kapal induk multimodal, dan jendela rilis strategis.


Perang Model Ringan: GPT-5.3 Instant dan Gemini 3.1 Flash-Lite Hadir โ Bagaimana DeepSeek V4 Mempertahankan Keunggulannya?
Dengan peluncuran GPT-5.3 Instant dan Gemini 3.1 Flash-Lite secara bersamaan oleh OpenAI dan Google, pasar model ringan kembali memanas. Analisis dampak pada ekosistem Agent seperti OpenClaw dan keunggulan kompetitif DeepSeek V4.

Buletin
Bergabunglah dengan Komunitas
Berlangganan buletin kami untuk berita dan pembaruan terbaru