- Início
- Notícias DeepSeek
- Lançamento do DeepSeek V4 na próxima semana? Novo artigo revela DualPath, o revolucionário framework de inferência

Lançamento do DeepSeek V4 na próxima semana? Novo artigo revela DualPath, o revolucionário framework de inferência
Com a aproximação da data de lançamento do DeepSeek V4, um artigo sobre o framework de inferência DualPath está gerando grande expectativa. Ao quebrar o gargalo da separação PD, ele duplica o desempenho dos agentes de IA, anunciando a era dos funcionários de IA 24/7.
A equipe do DeepSeek demonstra mais uma vez sua ambição de evolução em nível de sistema. Enquanto desenvolvedores de todo o mundo buscam freneticamente pela DeepSeek V4 release date, um artigo intitulado "DualPath", publicado conjuntamente pelo grupo de sistemas do DeepSeek, pela Universidade de Pequim e pela Universidade Tsinghua, apareceu discretamente no ArXiv. Não se trata apenas de uma publicação acadêmica, mas de uma antecipação da arquitetura de inferência central do DeepSeek V4.
O objetivo principal do framework DualPath é resolver o ponto mais crítico na implementação de agentes de IA: o gargalo de E/S na inferência de textos longos.
Quebrando a separação PD: a arte de usar a "largura de banda ociosa"
Nas arquiteturas tradicionais de separação entre pré-preenchimento e decodificação (PD-disaggregated), todas as tarefas de carregamento do KV-Cache concentram-se na placa de rede de armazenamento do mecanismo de pré-preenchimento, saturando instantaneamente a largura de banda. Enquanto isso, a placa de rede do mecanismo de decodificação permanece ociosa.
O DualPath introduz um segundo caminho chamado "Storage-to-Decode", permitindo uma unificação global da largura de banda de armazenamento do cluster. Em testes reais com um modelo de escala 660B:
- O rendimento de inferência offline aumentou 1,87 vezes.
- O rendimento do serviço online aumentou, em média, 1,96 vezes.
- A latência do primeiro token (TTFT) foi significativamente otimizada, permitindo que a resposta do agente atinja quase o nível da intuição humana.
A última peça do quebra-cabeça para os funcionários de IA 24/7
Por que dedicar tanto esforço para otimizar a velocidade de transferência do KV-Cache? A resposta reside no cenário dos funcionários digitais que operam 24/7.
Os futuros agentes de IA não serão apenas janelas de chat de "pergunta e resposta", mas, como demonstra o OpenClaw, serão capazes de executar tarefas de forma autônoma durante todo o dia, ler milhares de e-mails e gerenciar cadeias de decisões complexas. Nesses cenários, a taxa de acerto do KV-Cache costuma ser superior a 95%. O framework DualPath acelera a transferência das "memórias antigas", tornando a operação de agentes com contextos ultra longos mais barata e rápida.
Isso significa que, quando implantarmos o DeepSeek V4 em um framework de agentes local como o OpenClaw, seu funcionário de IA terá uma memória instantânea quase infinita e não sofrerá "travamentos de pensamento" ao processar tarefas pesadas.
Especulações sobre a data de lançamento do DeepSeek V4
Embora não haja uma data oficial, o primeiro autor do artigo do DualPath, Yongtong Wu, trabalha atualmente na equipe de sistemas do DeepSeek. Juntamente com os recentes alertas da CNBC sobre o impacto dos novos modelos do DeepSeek no mercado, a indústria especula que é muito provável que o DeepSeek V4 faça sua estreia oficial na próxima semana.
Esta arquitetura DualPath pode ser a arma secreta que permitirá ao V4 superar o desempenho de agente do GPT-5, mantendo uma relação custo-benefício extrema.
👉 Não quer perder o grande lançamento da próxima semana? Clique em DeepSeekV4.app para assinar nossas informações exclusivas e obter notícias em primeira mão antes que elas explodam no Twitter.
Edição: UIO
Mais posts

OpenAI lança GPT-5.4: 1M de contexto + Agentes nativos para barrar o DeepSeek V4!
A OpenAI lançou de surpresa o seu modelo topo de gama GPT-5.4, com 1 milhão de contexto nativo e um motor de agentes, visando construir uma barreira tecnológica antes do lançamento do DeepSeek V4.


Toda a rede espera o banquete do DeepSeek V4, por que a panela ainda não abriu? A verdade é mais 'hardcore' do que você pensa!
Por que o DeepSeek V4 faltou ao encontro de 2 de março? Revelamos as três grandes apostas por trás do atraso: migração para a infraestrutura de computação nacional, carro-chefe multimodal e janela estratégica de lançamento.


A guerra dos modelos leves: GPT-5.3 Instant e Gemini 3.1 Flash-Lite chegam – Como o DeepSeek V4 mantém a liderança?
Com o lançamento simultâneo do GPT-5.3 Instant e Gemini 3.1 Flash-Lite pela OpenAI e Google, o mercado de modelos leves está em ebulição. Análise do impacto nos ecossistemas de Agentes como o OpenClaw e as vantagens competitivas do DeepSeek V4.

Newsletter
Junte-se à Comunidade
Assine nossa newsletter para as últimas notícias e atualizações