- Beranda
- Berita DeepSeek
- Perang OCR Memanas: Baidu Merilis PaddleOCR-VL-1.5 untuk Menantang DeepSeek

Perang OCR Memanas: Baidu Merilis PaddleOCR-VL-1.5 untuk Menantang DeepSeek
Hanya beberapa hari setelah rilis DeepSeek-OCR 2, tim PaddleOCR Baidu menyerang balik dengan PaddleOCR-VL-1.5, mengklaim kinerja superior dalam penguraian dokumen.
Perang OCR Memanas: Baidu Merilis PaddleOCR-VL-1.5
30 Jan 2026
Pertempuran untuk dominasi model bahasa visual (VLM) tidak berhenti di LLM. Hanya beberapa hari setelah DeepSeek merilis DeepSeek-OCR 2 yang terkenal, raksasa teknologi Baidu telah menanggapi dengan pembaruan besar pada toolkit open-source-nya: PaddleOCR-VL-1.5.
Apa yang Baru?
Dirilis secara diam-diam di GitHub pada 29 Januari 2026, versi baru ini menargetkan ceruk yang sama persis dengan penawaran terbaru DeepSeek: penguraian dokumen presisi tinggi dan ekstraksi struktur.
Tolok ukur awal yang dirilis oleh tim Paddle menunjukkan bahwa PaddleOCR-VL-1.5 mungkin mengungguli DeepSeek-OCR 2 dalam tugas-tugas tertentu:
- Ekstraksi Tabel: Mengklaim akurasi 5% lebih tinggi pada tabel keuangan yang kompleks.
- Efisiensi: Dioptimalkan untuk penyebaran edge, berjalan lebih cepat pada GPU tingkat konsumen.
- Dukungan Multibahasa: Dukungan yang diperluas untuk dokumen bahasa campuran.
DeepSeek OCR 2 vs. PaddleOCR-VL-1.5
| Fitur | DeepSeek OCR 2 | PaddleOCR-VL-1.5 |
|---|---|---|
| Tanggal Rilis | 27 Jan 2026 | 29 Jan 2026 |
| Fokus | CoT Visual & Penalaran | Penguraian Struktur & Kecepatan |
| Arsitektur | DeepEncoder V2 | Modifikasi NaViT |
| Open Source | Lisensi MIT | Apache 2.0 |
Reaksi Komunitas
Waktunya tidak dapat disangkal. "Ini jelas sebuah tanggapan," kata seorang pengembang di Hacker News. "DeepSeek menetapkan standar baru pada hari Selasa, dan Baidu mencoba memecahkannya pada hari Kamis."
Kami saat ini sedang menjalankan tolok ukur internal kami sendiri untuk memverifikasi klaim ini. Sementara DeepSeek-OCR 2 sangat berfokus pada aspek "penalaran" membaca (memahami apa yang dibacanya), Baidu tampaknya menggandakan akurasi "struktural" (membuat tata letak menjadi sempurna).
Nantikan ulasan perbandingan lengkap kami minggu depan.
Ikuti DeepSeek V4 App untuk berita model AI terbaru.
Penulis

Lebih Banyak Postingan

OpenAI Luncurkan GPT-5.4: Konteks 1M + Agen Native untuk Menghadang DeepSeek V4!
OpenAI secara mengejutkan merilis model unggulan terkuatnya, GPT-5.4, yang dilengkapi dengan 1 juta konteks native dan mesin agen, bertujuan membangun benteng teknologi sebelum peluncuran DeepSeek V4.


Seluruh Internet Menunggu DeepSeek V4 – Mengapa Belum Juga 'Matang'? Kebenarannya Mungkin Lebih Keras dari yang Anda Kira!
Mengapa DeepSeek V4 melewatkan jadwal 2 Maret? Ungkap tiga taruhan besar di balik penundaan ini: migrasi ke infrastruktur komputasi domestik, kapal induk multimodal, dan jendela rilis strategis.


Perang Model Ringan: GPT-5.3 Instant dan Gemini 3.1 Flash-Lite Hadir – Bagaimana DeepSeek V4 Mempertahankan Keunggulannya?
Dengan peluncuran GPT-5.3 Instant dan Gemini 3.1 Flash-Lite secara bersamaan oleh OpenAI dan Google, pasar model ringan kembali memanas. Analisis dampak pada ekosistem Agent seperti OpenClaw dan keunggulan kompetitif DeepSeek V4.

Buletin
Bergabunglah dengan Komunitas
Berlangganan buletin kami untuk berita dan pembaruan terbaru