- 홈
- DeepSeek 뉴스
- OCR 전쟁 가열: Baidu, DeepSeek에 도전하기 위해 PaddleOCR-VL-1.5 출시

OCR 전쟁 가열: Baidu, DeepSeek에 도전하기 위해 PaddleOCR-VL-1.5 출시
DeepSeek-OCR 2 출시 며칠 후, Baidu의 PaddleOCR 팀은 문서 파싱에서 우수한 성능을 주장하며 PaddleOCR-VL-1.5로 반격합니다.
OCR 전쟁 가열: Baidu, PaddleOCR-VL-1.5 출시
2026년 1월 30일
시각 언어 모델(VLM) 지배권을 위한 전투는 LLM에서 멈추지 않습니다. DeepSeek가 호평을 받은 DeepSeek-OCR 2를 출시한 지 불과 며칠 만에 거대 기술 기업 Baidu는 오픈 소스 툴킷에 대한 주요 업데이트인 PaddleOCR-VL-1.5로 대응했습니다.
새로운 점은 무엇입니까?
2026년 1월 29일 GitHub에 조용히 출시된 이 새 버전은 DeepSeek의 최신 제품과 정확히 동일한 틈새 시장인 고정밀 문서 파싱 및 구조 추출을 목표로 합니다.
Paddle 팀이 공개한 초기 벤치마크에 따르면 PaddleOCR-VL-1.5는 특정 작업에서 DeepSeek-OCR 2를 능가할 수 있습니다:
- 표 추출: 복잡한 재무 표에서 5% 더 높은 정확도를 주장합니다.
- 효율성: 엣지 배포에 최적화되어 소비자 등급 GPU에서 더 빠르게 실행됩니다.
- 다국어 지원: 혼합 언어 문서에 대한 지원이 확대되었습니다.
DeepSeek OCR 2 대 PaddleOCR-VL-1.5
| 기능 | DeepSeek OCR 2 | PaddleOCR-VL-1.5 |
|---|---|---|
| 출시일 | 2026년 1월 27일 | 2026년 1월 29일 |
| 초점 | 시각적 CoT 및 추론 | 구조 파싱 및 속도 |
| 아키텍처 | DeepEncoder V2 | 수정된 NaViT |
| 오픈 소스 | MIT 라이선스 | Apache 2.0 |
커뮤니티 반응
타이밍은 부인할 수 없습니다. Hacker News의 한 개발자는 "이것은 분명히 반응입니다."라고 말합니다. "DeepSeek는 화요일에 새로운 기준을 세웠고, Baidu는 목요일에 그것을 넘으려고 했습니다."
우리는 현재 이러한 주장을 확인하기 위해 자체 내부 벤치마크를 실행하고 있습니다. DeepSeek-OCR 2는 읽기의 "추론" 측면(무엇을 읽는지 이해)에 중점을 두지만, Baidu는 "구조적" 정확성(레이아웃을 완벽하게 가져오기)에 집중하는 것 같습니다.
다음 주 전체 비교 리뷰를 계속 지켜봐 주십시오.
최신 AI 모델 뉴스를 보려면 DeepSeek V4 App을 팔로우하십시오.
더 많은 게시물

OpenAI 플래그십 GPT-5.4 전격 출시: 1M 컨텍스트+네이티브 에이전트로 DeepSeek V4 저지!
OpenAI가 100만 네이티브 컨텍스트와 에이전트 엔진을 탑재한 최강 플래그십 모델 GPT-5.4를 기습 발표했습니다. DeepSeek V4 출시 전 기술적 격차를 통해 방어선을 구축하려는 전략입니다.


전 세계가 DeepSeek V4 출시를 기다리고 있습니다. 왜 아직 '뚜껑'을 열지 않았을까요? 그 이면의 진실은 생각보다 하드코어합니다!
왜 DeepSeek V4는 3월 2일 약속을 어겼을까요? 그 배후에 숨겨진 세 가지 핵심 도박: 국산 컴퓨팅 기반 마이그레이션, 멀티모달 올라운드 플래그십, 그리고 전략적 출시 윈도우.


경량화 모델의 전쟁: GPT-5.3 Instant와 Gemini 3.1 Flash-Lite 등장, DeepSeek V4는 어떻게 우위를 점할 것인가?
OpenAI와 Google이 같은 날 GPT-5.3 Instant와 Gemini 3.1 Flash-Lite를 발표하면서 경량화 모델 시장이 다시 뜨거워지고 있습니다. 본 기사에서는 이 두 모델이 OpenClaw와 같은 에이전트 생태계에 미치는 영향과 DeepSeek V4의 핵심 경쟁 우위를 심층 분석합니다.

뉴스레터
커뮤니티 가입
최신 뉴스 및 업데이트를 받으려면 뉴스레터 구독