- ホーム
- DeepSeekニュース
- OCR戦争が過熱:BaiduがDeepSeekに対抗してPaddleOCR-VL-1.5をリリース

OCR戦争が過熱:BaiduがDeepSeekに対抗してPaddleOCR-VL-1.5をリリース
DeepSeek-OCR 2のリリースからわずか数日後、BaiduのPaddleOCRチームはPaddleOCR-VL-1.5で反撃し、ドキュメント解析における優れたパフォーマンスを主張しています。
OCR戦争が過熱:BaiduがPaddleOCR-VL-1.5をリリース
2026年1月30日
視覚言語モデル(VLM)の覇権争いはLLMにとどまりません。DeepSeekが高い評価を得ているDeepSeek-OCR 2をリリースしてからわずか数日後、テクノロジー大手のBaiduはオープンソースツールキットのメジャーアップデートで応酬しました:PaddleOCR-VL-1.5。
新機能は?
2026年1月29日にGitHubでひっそりとリリースされたこの新バージョンは、DeepSeekの最新製品とまったく同じニッチ、つまり高精度のドキュメント解析と構造抽出をターゲットにしています。
Paddleチームによって公開された初期のベンチマークは、PaddleOCR-VL-1.5が特定のタスクでDeepSeek-OCR 2を上回る可能性があることを示唆しています:
- 表抽出: 複雑な財務表で5%高い精度を主張。
- 効率性: エッジ展開向けに最適化されており、消費者向けGPUでより高速に動作します。
- 多言語サポート: 混合言語ドキュメントのサポートが拡大されました。
DeepSeek OCR 2 対 PaddleOCR-VL-1.5
| 機能 | DeepSeek OCR 2 | PaddleOCR-VL-1.5 |
|---|---|---|
| リリース日 | 2026年1月27日 | 2026年1月29日 |
| 焦点 | 視覚的CoTと推論 | 構造解析と速度 |
| アーキテクチャ | DeepEncoder V2 | 改良版NaViT |
| オープンソース | MITライセンス | Apache 2.0 |
コミュニティの反応
タイミングは否定できません。「これは明らかに反応です」とHacker Newsのある開発者は言います。「DeepSeekは火曜日に新しい基準を設定し、Baiduは木曜日にそれをクリアしようとしました。」
私たちは現在、これらの主張を検証するために独自の内部ベンチマークを実行しています。DeepSeek-OCR 2は読むことの「推論」の側面(何を読んでいるかを理解する)に重点を置いていますが、Baiduは「構造的」な正確さ(レイアウトを完璧にする)に倍賭けしているようです。
来週の完全な比較レビューにご期待ください。
最新のAIモデルニュースについては、DeepSeek V4 Appをフォローしてください。
その他の投稿

OpenAI 旗艦 GPT-5.4 が電撃リリース:1M コンテキスト + ネイティブ Agent で DeepSeek V4 の包囲網を突破!
OpenAI は、100万トークンのネイティブコンテキストとエージェントエンジンを搭載した最強の旗艦モデル GPT-5.4 を突如発表。DeepSeek V4 のリリース前に技術的優位性を確立する狙いです。


DeepSeek V4の公開を全網が待っている。なぜ「蓋」はまだ開かないのか?真相は想像以上にハードコア!
なぜDeepSeek V4は3月2日の約束を破ったのか?その裏にある3つの大きな賭けを解明:国産計算リソースへの移行、マルチモーダル旗艦、そして戦略的リリースウィンドウ。


軽量モデルの戦い:GPT-5.3 Instant と Gemini 3.1 Flash-Lite が登場、DeepSeek V4 はどうリードを保つか?
OpenAI と Google が同日に GPT-5.3 Instant と Gemini 3.1 Flash-Lite を発表し、軽量モデル市場が再び沸騰しています。本記事では、これら 2 つのモデルが OpenClaw などのエージェントエコシステムに与える影響と、この変局における DeepSeek V4 の核心的な競争優位性を深く分析します。

ニュースレター
コミュニティに参加
最新のニュースと更新情報を入手するには、ニュースレターを購読してください