- Accueil
- Nouvelles DeepSeek
- La guerre des OCR s'intensifie : Baidu lance PaddleOCR-VL-1.5 pour défier DeepSeek

La guerre des OCR s'intensifie : Baidu lance PaddleOCR-VL-1.5 pour défier DeepSeek
Quelques jours seulement après la sortie de DeepSeek-OCR 2, l'équipe PaddleOCR de Baidu riposte avec PaddleOCR-VL-1.5, revendiquant des performances supérieures dans l'analyse de documents.
La guerre des OCR s'intensifie : Baidu lance PaddleOCR-VL-1.5
30 janvier 2026
La bataille pour la domination des modèles de langage visuel (VLM) ne s'arrête pas aux LLM. Quelques jours seulement après que DeepSeek a publié son célèbre DeepSeek-OCR 2, le géant de la technologie Baidu a répondu par une mise à jour majeure de sa boîte à outils open source : PaddleOCR-VL-1.5.
Quoi de neuf ?
Publiée discrètement sur GitHub le 29 janvier 2026, cette nouvelle version vise exactement la même niche que la dernière offre de DeepSeek : l'analyse de documents haute précision et l'extraction de structure.
Les premiers tests de performance publiés par l'équipe Paddle suggèrent que PaddleOCR-VL-1.5 pourrait surpasser DeepSeek-OCR 2 dans des tâches spécifiques :
- Extraction de tableaux : Précision prétendument supérieure de 5 % sur les tableaux financiers complexes.
- Efficacité : Optimisé pour le déploiement en périphérie, s'exécutant plus rapidement sur les GPU grand public.
- Support multilingue : Support étendu pour les documents en plusieurs langues.
DeepSeek OCR 2 vs. PaddleOCR-VL-1.5
| Fonctionnalité | DeepSeek OCR 2 | PaddleOCR-VL-1.5 |
|---|---|---|
| Date de sortie | 27 janv. 2026 | 29 janv. 2026 |
| Focus | CoT Visuel & Raisonnement | Analyse de structure & Vitesse |
| Architecture | DeepEncoder V2 | NaViT Modifié |
| Open Source | Licence MIT | Apache 2.0 |
Réaction de la communauté
Le timing est indéniable. « C'est clairement une réponse », déclare un développeur sur Hacker News. « DeepSeek a placé la barre très haut mardi, et Baidu a essayé de la franchir jeudi. »
Nous exécutons actuellement nos propres tests internes pour vérifier ces affirmations. Alors que DeepSeek-OCR 2 se concentre fortement sur l'aspect « raisonnement » de la lecture (comprendre ce qu'il lit), Baidu semble miser sur la précision « structurelle » (obtenir une mise en page parfaite).
Restez à l'écoute pour notre examen comparatif complet la semaine prochaine.
Suivez DeepSeek V4 App pour les dernières nouvelles sur les modèles d'IA.
Auteur

Plus d'articles

Lancement de GPT-5.4 : OpenAI sort l'artillerie lourde avec 1M de contexte et des Agents natifs pour contrer DeepSeek V4 !
OpenAI a lancé par surprise son modèle phare GPT-5.4, doté de 1 million de contexte natif et d'un moteur d'agent, visant à établir une domination technologique avant la sortie de DeepSeek V4.


Tout le web attend DeepSeek V4 – Pourquoi l'assiette reste-t-elle vide ? La vérité est peut-être plus « hardcore » que vous ne le pensez !
Pourquoi DeepSeek V4 n'a-t-il pas tenu son rendez-vous du 2 mars ? Découvrons les trois paris stratégiques derrière ce retard : migration vers la puissance de calcul nationale, vaisseau amiral multimodal et fenêtre de lancement stratégique.


La guerre des modèles légers : GPT-5.3 Instant et Gemini 3.1 Flash-Lite arrivent – Comment DeepSeek V4 garde-t-il l'avantage ?
Avec les sorties simultanées de GPT-5.3 Instant et Gemini 3.1 Flash-Lite par OpenAI et Google, le marché des modèles légers s'enflamme. Analyse de leur impact sur les écosystèmes d'Agents comme OpenClaw et des avantages de DeepSeek V4.

Newsletter
Rejoignez la communauté
Abonnez-vous à notre newsletter pour les dernières nouvelles et mises à jour