- Startseite
- DeepSeek Nachrichten
- Der OCR-Krieg heizt sich auf: Baidu veröffentlicht PaddleOCR-VL-1.5, um DeepSeek herauszufordern

Der OCR-Krieg heizt sich auf: Baidu veröffentlicht PaddleOCR-VL-1.5, um DeepSeek herauszufordern
Nur wenige Tage nach der Veröffentlichung von DeepSeek-OCR 2 schlägt Baidus PaddleOCR-Team mit PaddleOCR-VL-1.5 zurück und beansprucht überlegene Leistung beim Dokumenten-Parsing.
Der OCR-Krieg heizt sich auf: Baidu veröffentlicht PaddleOCR-VL-1.5
30. Jan. 2026
Die Schlacht um die Vorherrschaft bei visuellen Sprachmodellen (VLM) macht nicht bei LLMs halt. Nur wenige Tage nachdem DeepSeek sein gefeiertes DeepSeek-OCR 2 veröffentlicht hat, antwortete der Tech-Gigant Baidu mit einem großen Update seines Open-Source-Toolkits: PaddleOCR-VL-1.5.
Was ist neu?
Diese neue Version, die am 29. Januar 2026 stillschweigend auf GitHub veröffentlicht wurde, zielt auf genau dieselbe Nische ab wie das neueste Angebot von DeepSeek: hochpräzises Dokumenten-Parsing und Strukturextraktion.
Erste Benchmarks, die vom Paddle-Team veröffentlicht wurden, deuten darauf hin, dass PaddleOCR-VL-1.5 DeepSeek-OCR 2 bei bestimmten Aufgaben übertreffen könnte:
- Tabellenextraktion: Angeblich 5 % höhere Genauigkeit bei komplexen Finanztabellen.
- Effizienz: Optimiert für Edge-Deployment, läuft schneller auf Consumer-GPUs.
- Mehrsprachige Unterstützung: Erweiterte Unterstützung für gemischtsprachige Dokumente.
DeepSeek OCR 2 vs. PaddleOCR-VL-1.5
| Funktion | DeepSeek OCR 2 | PaddleOCR-VL-1.5 |
|---|---|---|
| Veröffentlichungsdatum | 27. Jan. 2026 | 29. Jan. 2026 |
| Fokus | Visual CoT & Reasoning | Struktur-Parsing & Geschwindigkeit |
| Architektur | DeepEncoder V2 | Modifiziertes NaViT |
| Open Source | MIT-Lizenz | Apache 2.0 |
Reaktion der Community
Das Timing ist unbestreitbar. "Es ist eindeutig eine Antwort", sagt ein Entwickler auf Hacker News. "DeepSeek hat am Dienstag eine neue Messlatte gesetzt, und Baidu hat versucht, sie am Donnerstag zu überspringen."
Wir führen derzeit unsere eigenen internen Benchmarks durch, um diese Behauptungen zu überprüfen. Während sich DeepSeek-OCR 2 stark auf den "Reasoning"-Aspekt des Lesens konzentriert (Verstehen, was es liest), scheint Baidu voll auf die "strukturelle" Genauigkeit zu setzen (das Layout perfekt machen).
Bleiben Sie dran für unseren vollständigen Vergleichstest nächste Woche.
Folgen Sie der DeepSeek V4 App für die neuesten Nachrichten zu KI-Modellen.
Autor

Mehr Beiträge

OpenAI Flaggschiff GPT-5.4 veröffentlicht: 1M Kontext + Native Agents gegen DeepSeek V4!
OpenAI hat überraschend sein stärkstes Flaggschiff-Modell GPT-5.4 mit 1 Million nativem Kontext und einer Agent-Engine vorgestellt, um vor dem Release von DeepSeek V4 eine technologische Festung zu errichten.


Das Netz wartet gespannt auf DeepSeek V4 – Warum bleibt die „Küche“ noch kalt? Die Wahrheit ist knallharter als gedacht!
Warum hat DeepSeek V4 den Termin am 2. März verpasst? Wir enthüllen die drei riskanten Wetten dahinter: Migration auf heimische Rechenleistung, ein multimodales Flaggschiff und das strategische Zeitfenster.


Der Krieg der Leichtgewicht-Modelle: GPT-5.3 Instant und Gemini 3.1 Flash-Lite sind da – Wie behauptet DeepSeek V4 seine Führung?
Mit der gleichzeitigen Veröffentlichung von GPT-5.3 Instant und Gemini 3.1 Flash-Lite durch OpenAI und Google kocht der Markt für Leichtgewicht-Modelle hoch. Dieser Artikel analysiert die Auswirkungen auf Agent-Ökosysteme wie OpenClaw und die zentralen Wettbewerbsvorteile von DeepSeek V4.

Newsletter
Treten Sie der Community bei
Abonnieren Sie unseren Newsletter für die neuesten Nachrichten und Updates