- Início
- Notícias DeepSeek
- A Guerra do OCR Aquece: Baidu Lança PaddleOCR-VL-1.5 para Desafiar o DeepSeek

A Guerra do OCR Aquece: Baidu Lança PaddleOCR-VL-1.5 para Desafiar o DeepSeek
Apenas dias após o lançamento do DeepSeek-OCR 2, a equipe PaddleOCR da Baidu contra-ataca com o PaddleOCR-VL-1.5, reivindicando desempenho superior na análise de documentos.
A Guerra do OCR Aquece: Baidu Lança PaddleOCR-VL-1.5
30 de Jan de 2026
A batalha pelo domínio do modelo de linguagem visual (VLM) não está parando nos LLMs. Apenas dias após a DeepSeek lançar seu aclamado DeepSeek-OCR 2, a gigante tecnológica Baidu respondeu com uma grande atualização para seu kit de ferramentas de código aberto: PaddleOCR-VL-1.5.
O Que Há de Novo?
Lançada silenciosamente no GitHub em 29 de janeiro de 2026, esta nova versão visa exatamente o mesmo nicho que a última oferta da DeepSeek: análise de documentos de alta precisão e extração de estruturas.
Benchmarks iniciais divulgados pela equipe Paddle sugerem que o PaddleOCR-VL-1.5 pode superar o DeepSeek-OCR 2 em tarefas específicas:
- Extração de Tabelas: Alegada precisão 5% maior em tabelas financeiras complexas.
- Eficiência: Otimizado para implantação na borda, rodando mais rápido em GPUs de nível consumidor.
- Suporte Multilíngue: Suporte expandido para documentos em vários idiomas.
DeepSeek OCR 2 vs. PaddleOCR-VL-1.5
| Recurso | DeepSeek OCR 2 | PaddleOCR-VL-1.5 |
|---|---|---|
| Data de Lançamento | 27 de Jan de 2026 | 29 de Jan de 2026 |
| Foco | CoT Visual & Raciocínio | Análise de Estrutura & Velocidade |
| Arquitetura | DeepEncoder V2 | NaViT Modificado |
| Código Aberto | Licença MIT | Apache 2.0 |
Reação da Comunidade
O timing é inegável. "É claramente uma resposta", diz um desenvolvedor no Hacker News. "A DeepSeek estabeleceu um novo padrão na terça-feira, e a Baidu tentou superá-lo na quinta-feira."
Estamos atualmente executando nossos próprios benchmarks internos para verificar essas alegações. Enquanto o DeepSeek-OCR 2 foca fortemente no aspecto de "raciocínio" da leitura (entender o que lê), a Baidu parece estar dobrando a aposta na precisão "estrutural" (deixar o layout perfeito).
Fique ligado para nossa análise comparativa completa na próxima semana.
Siga o DeepSeek V4 App para as últimas notícias sobre modelos de IA.
Mais posts

OpenAI lança GPT-5.4: 1M de contexto + Agentes nativos para barrar o DeepSeek V4!
A OpenAI lançou de surpresa o seu modelo topo de gama GPT-5.4, com 1 milhão de contexto nativo e um motor de agentes, visando construir uma barreira tecnológica antes do lançamento do DeepSeek V4.


Toda a rede espera o banquete do DeepSeek V4, por que a panela ainda não abriu? A verdade é mais 'hardcore' do que você pensa!
Por que o DeepSeek V4 faltou ao encontro de 2 de março? Revelamos as três grandes apostas por trás do atraso: migração para a infraestrutura de computação nacional, carro-chefe multimodal e janela estratégica de lançamento.


A guerra dos modelos leves: GPT-5.3 Instant e Gemini 3.1 Flash-Lite chegam – Como o DeepSeek V4 mantém a liderança?
Com o lançamento simultâneo do GPT-5.3 Instant e Gemini 3.1 Flash-Lite pela OpenAI e Google, o mercado de modelos leves está em ebulição. Análise do impacto nos ecossistemas de Agentes como o OpenClaw e as vantagens competitivas do DeepSeek V4.

Newsletter
Junte-se à Comunidade
Assine nossa newsletter para as últimas notícias e atualizações