- Главная
- Новости DeepSeek
- Войны OCR накаляются: Baidu выпускает PaddleOCR-VL-1.5, чтобы бросить вызов DeepSeek

Войны OCR накаляются: Baidu выпускает PaddleOCR-VL-1.5, чтобы бросить вызов DeepSeek
Всего через несколько дней после выхода DeepSeek-OCR 2 команда Baidu PaddleOCR наносит ответный удар выпуском PaddleOCR-VL-1.5, заявляя о превосходной производительности в парсинге документов.
Войны OCR накаляются: Baidu выпускает PaddleOCR-VL-1.5
30 января 2026 г.
Битва за доминирование визуальных языковых моделей (VLM) не ограничивается LLM. Всего через несколько дней после того, как DeepSeek выпустил свой признанный DeepSeek-OCR 2, технологический гигант Baidu ответил крупным обновлением своего инструментария с открытым исходным кодом: PaddleOCR-VL-1.5.
Что нового?
Выпущенная тихо на GitHub 29 января 2026 года, эта новая версия нацелена на ту же нишу, что и последнее предложение DeepSeek: высокоточный парсинг документов и извлечение структуры.
Первоначальные тесты, опубликованные командой Paddle, предполагают, что PaddleOCR-VL-1.5 может превзойти DeepSeek-OCR 2 в конкретных задачах:
- Извлечение таблиц: Заявленная точность на 5% выше на сложных финансовых таблицах.
- Эффективность: Оптимизировано для развертывания на периферии, работает быстрее на потребительских графических процессорах.
- Многоязычная поддержка: Расширенная поддержка документов на смешанных языках.
DeepSeek OCR 2 против PaddleOCR-VL-1.5
| Функция | DeepSeek OCR 2 | PaddleOCR-VL-1.5 |
|---|---|---|
| Дата выпуска | 27 янв. 2026 | 29 янв. 2026 |
| Фокус | Визуальный CoT и Рассуждения | Парсинг структуры и Скорость |
| Архитектура | DeepEncoder V2 | Модифицированный NaViT |
| Открытый исходный код | Лицензия MIT | Apache 2.0 |
Реакция сообщества
Время выбрано не случайно. «Это явно ответ», — говорит один разработчик на Hacker News. «DeepSeek установил новую планку во вторник, а Baidu попытался преодолеть ее в четверг».
В настоящее время мы проводим собственные внутренние тесты для проверки этих утверждений. В то время как DeepSeek-OCR 2 сильно фокусируется на аспекте «рассуждения» чтения (понимание того, что он читает), Baidu, похоже, удваивает ставку на «структурную» точность (идеальное воспроизведение макета).
Следите за нашим полным сравнительным обзором на следующей неделе.
Следите за DeepSeek V4 App, чтобы узнавать последние новости о моделях ИИ.
Author

More Posts

OpenAI запускает флагман GPT-5.4: 2 млн контекста + нативные агенты для блокировки DeepSeek V4!
OpenAI внезапно представила свою самую мощную флагманскую модель GPT-5.4 с 1 миллионми нативного контекста и движком агентов, стремясь создать технологический барьер перед выходом DeepSeek V4.


Весь интернет ждет выхода DeepSeek V4 – почему «блюдо» до сих пор не подано? Правда может быть куда серьезнее, чем вы думаете!
Почему DeepSeek V4 пропустил запуск 2 марта? Раскрываем три стратегические причины задержки: миграция на отечественную вычислительную базу, мультимодальный флагман и стратегическое окно релиза.


Война легких моделей: GPT-5.3 Instant и Gemini 3.1 Flash-Lite вступают в бой — как DeepSeek V4 сохраняет лидерство?
С одновременным выпуском GPT-5.3 Instant и Gemini 3.1 Flash-Lite от OpenAI и Google рынок легких моделей снова закипает. Анализ влияния этих моделей на экосистемы агентов, такие как OpenClaw, и конкурентные преимущества DeepSeek V4.

Новостная рассылка
Присоединяйтесь к сообществу
Подпишитесь на нашу рассылку для получения последних новостей и обновлений