- Inicio
- Noticias de DeepSeek
- La guerra de OCR se intensifica: Baidu lanza PaddleOCR-VL-1.5 para desafiar a DeepSeek

La guerra de OCR se intensifica: Baidu lanza PaddleOCR-VL-1.5 para desafiar a DeepSeek
Apenas unos días después del lanzamiento de DeepSeek-OCR 2, el equipo de PaddleOCR de Baidu contraataca con PaddleOCR-VL-1.5, reclamando un rendimiento superior en el análisis de documentos.
La guerra de OCR se intensifica: Baidu lanza PaddleOCR-VL-1.5
30 de enero de 2026
La batalla por el dominio de los modelos de lenguaje visual (VLM) no se detiene en los LLM. Apenas unos días después de que DeepSeek lanzara su aclamado DeepSeek-OCR 2, el gigante tecnológico Baidu respondió con una importante actualización de su conjunto de herramientas de código abierto: PaddleOCR-VL-1.5.
¿Qué hay de nuevo?
Lanzada discretamente en GitHub el 29 de enero de 2026, esta nueva versión apunta exactamente al mismo nicho que la última oferta de DeepSeek: análisis de documentos de alta precisión y extracción de estructuras.
Los puntos de referencia iniciales publicados por el equipo de Paddle sugieren que PaddleOCR-VL-1.5 puede superar a DeepSeek-OCR 2 en tareas específicas:
- Extracción de tablas: Se afirma una precisión un 5% mayor en tablas financieras complejas.
- Eficiencia: Optimizado para la implementación en el borde, ejecutándose más rápido en GPU de nivel consumidor.
- Soporte multilingüe: Soporte ampliado para documentos en varios idiomas.
DeepSeek OCR 2 vs. PaddleOCR-VL-1.5
| Característica | DeepSeek OCR 2 | PaddleOCR-VL-1.5 |
|---|---|---|
| Fecha de lanzamiento | 27 de enero de 2026 | 29 de enero de 2026 |
| Enfoque | CoT Visual y Razonamiento | Análisis de estructura y Velocidad |
| Arquitectura | DeepEncoder V2 | NaViT Modificado |
| Código Abierto | Licencia MIT | Apache 2.0 |
Reacción de la comunidad
El momento es innegable. "Es claramente una respuesta", dice un desarrollador en Hacker News. "DeepSeek puso el listón muy alto el martes y Baidu intentó superarlo el jueves".
Actualmente estamos ejecutando nuestros propios puntos de referencia internos para verificar estas afirmaciones. Mientras que DeepSeek-OCR 2 se centra en gran medida en el aspecto de "razonamiento" de la lectura (entender qué lee), Baidu parece estar apostando por la precisión "estructural" (lograr un diseño perfecto).
Estén atentos a nuestra revisión comparativa completa la próxima semana.
Siga la DeepSeek V4 App para conocer las últimas noticias sobre modelos de IA.
Author

More Posts

OpenAI lanza GPT-5.4: ¡1M de contexto + Agentes nativos para frenar a DeepSeek V4!
OpenAI ha lanzado por sorpresa su modelo insignia GPT-5.4, con 1 millón de contexto nativo y un motor de agentes, buscando establecer una muralla tecnológica ante el lanzamiento de DeepSeek V4.


Toda la red espera el banquete de DeepSeek V4, ¿por qué no se destapa la olla? ¡La verdad es más 'hardcore' de lo que piensas!
¿Por qué DeepSeek V4 faltó a su cita del 2 de marzo? Revelamos las tres grandes apuestas tras el retraso: migración a la infraestructura de cómputo nacional, buque insignia multimodal y ventana de lanzamiento estratégica.


La guerra de los modelos ligeros: GPT-5.3 Instant y Gemini 3.1 Flash-Lite llegan – ¿Cómo mantiene DeepSeek V4 su liderazgo?
Con el lanzamiento simultáneo de GPT-5.3 Instant y Gemini 3.1 Flash-Lite por OpenAI y Google, el mercado de modelos ligeros está en ebullición. Análisis de su impacto en ecosistemas de Agentes como OpenClaw y las ventajas competitivas de DeepSeek V4.

Boletín
Únete a la comunidad
Suscríbete a nuestro boletín para las últimas noticias y actualizaciones