- 首页
- DeepSeek 新闻
- OCR 大战升级:百度发布 PaddleOCR-VL-1.5,剑指 DeepSeek

OCR 大战升级:百度发布 PaddleOCR-VL-1.5,剑指 DeepSeek
就在 DeepSeek-OCR 2 发布仅两天后,百度的 PaddleOCR 团队强势反击,发布 PaddleOCR-VL-1.5,声称在文档解析方面性能更优。
OCR 大战升级:百度发布 PaddleOCR-VL-1.5
2026年1月30日
视觉语言模型 (VLM) 的争夺战不仅仅停留在 LLM 领域。就在 DeepSeek 发布备受赞誉的 DeepSeek-OCR 2 仅仅两天后,科技巨头百度就对其开源工具包进行了重大更新,发布了:PaddleOCR-VL-1.5。
更新了什么?
这个新版本于 2026年1月29日 悄然在 GitHub 上线,其目标直指 DeepSeek 最新产品的核心腹地:高精度文档解析和结构提取。
Paddle 团队发布的初步基准测试表明,PaddleOCR-VL-1.5 在特定任务上可能超越了 DeepSeek-OCR 2:
- 表格提取: 声称在复杂的财务报表提取上准确率提高了 5%。
- 效率: 针对端侧部署进行了优化,在消费级 GPU 上运行速度更快。
- 多语言支持: 扩展了对混合语言文档的支持。
DeepSeek OCR 2 vs. PaddleOCR-VL-1.5
| 特性 | DeepSeek OCR 2 | PaddleOCR-VL-1.5 |
|---|---|---|
| 发布日期 | 2026年1月27日 | 2026年1月29日 |
| 核心侧重 | 视觉思维链 (Visual CoT) & 推理 | 结构化解析 & 速度 |
| 架构 | DeepEncoder V2 | 改进版 NaViT |
| 开源协议 | MIT License | Apache 2.0 |
社区反应
这个发布时机耐人寻味。“这显然是一次回应,”一位开发者在 Hacker News 上评论道。“DeepSeek 在周二设立了新标杆,百度试图在周四跨越它。”
如果你正在寻找 DeepSeek-OCR 2 的替代方案,或者需要更轻量级的部署选项,百度的这款新模型绝对值得一试。我们目前正在内部进行对比测试,验证这些性能主张。
DeepSeek 侧重于“读懂”内容(推理),而百度似乎在“读准”格式(结构化)上下了重注。
下周我们将带来详细的对比评测。
关注 DeepSeek V4 App,获取最新 AI 模型资讯。
更多文章

OpenAI 旗舰 GPT-5.4 震撼上线:1M 上下文+原生 Agent,封锁 DeepSeek V4 突围路径!
OpenAI 凌晨突袭发布其最强旗舰模型 GPT-5.4,搭载 100 万原生上下文与原生代理引擎,旨在通过技术代差在 DeepSeek V4 发布前先行筑起防御工事。


全网都在等 DeepSeek V4 开饭,为何迟迟不“揭锅”?真相可能比你想的更硬核!
为什么 DeepSeek V4 在 3 月 2 日爽约?揭秘其背后的三场顶级豪赌:国产算力底座迁移、多模态全能旗舰与战略发布窗口期。


轻量化模型之战:GPT-5.3 Instant 与 Gemini 3.1 Flash-Lite 登场,DeepSeek V4 如何保持领先?
随着 OpenAI 和 Google 同日发布 GPT-5.3 Instant 与 Gemini 3.1 Flash-Lite,轻量化模型市场再次沸腾。本文深入分析这两款模型对 OpenClaw 等 Agent 生态的影响,以及 DeepSeek V4 在这一变局中的核心竞争优势。

新闻通讯
加入社区
订阅我们的新闻通讯,获取最新新闻和更新