- الرئيسية
- أخبار DeepSeek
- حروب التعرف الضوئي على الحروف (OCR) تشتعل: Baidu تطلق PaddleOCR-VL-1.5 لتحدي DeepSeek

حروب التعرف الضوئي على الحروف (OCR) تشتعل: Baidu تطلق PaddleOCR-VL-1.5 لتحدي DeepSeek
بعد أيام فقط من إصدار DeepSeek-OCR 2، يرد فريق PaddleOCR في Baidu بإطلاق PaddleOCR-VL-1.5، مدعيًا أداءً فائقًا في تحليل المستندات.
حروب OCR تشتعل: Baidu تطلق PaddleOCR-VL-1.5
30 يناير 2026
معركة الهيمنة على نموذج اللغة المرئية (VLM) لا تتوقف عند نماذج اللغة الكبيرة (LLMs). بعد أيام فقط من إصدار DeepSeek لنموذجها المشاد به DeepSeek-OCR 2، ردت عملاقة التكنولوجيا Baidu بتحديث كبير لمجموعة أدواتها مفتوحة المصدر: PaddleOCR-VL-1.5.
ما الجديد؟
تم إصدار هذا الإصدار الجديد بهدوء على GitHub في 29 يناير 2026، ويستهدف نفس المكانة بالضبط مثل أحدث عروض DeepSeek: تحليل المستندات عالية الدقة واستخراج البنية.
تشير المعايير الأولية التي أصدرها فريق Paddle إلى أن PaddleOCR-VL-1.5 قد يتفوق على DeepSeek-OCR 2 في مهام محددة:
- استخراج الجدول: يُزعم أن الدقة أعلى بنسبة 5٪ في الجداول المالية المعقدة.
- الكفاءة: مُحسَّن للنشر على الحافة، ويعمل بشكل أسرع على وحدات معالجة الرسومات المخصصة للمستهلكين.
- دعم متعدد اللغات: دعم موسع للمستندات مختلطة اللغة.
DeepSeek OCR 2 مقابل PaddleOCR-VL-1.5
| الميزة | DeepSeek OCR 2 | PaddleOCR-VL-1.5 |
|---|---|---|
| تاريخ الإصدار | 27 يناير 2026 | 29 يناير 2026 |
| التركيز | سلسلة التفكير البصري والاستدلال | تحليل البنية والسرعة |
| الهندسة المعمارية | DeepEncoder V2 | NaViT المعدل |
| مفتوح المصدر | رخصة MIT | Apache 2.0 |
رد فعل المجتمع
التوقيت لا يمكن إنكاره. يقول أحد المطورين على Hacker News: "من الواضح أنه رد". "وضعت DeepSeek معيارًا جديدًا يوم الثلاثاء، وحاولت Baidu تجاوزه يوم الخميس".
نقوم حاليًا بتشغيل معاييرنا الداخلية للتحقق من هذه الادعاءات. بينما يركز DeepSeek-OCR 2 بشكل كبير على جانب "الاستدلال" للقراءة (فهم ما يقرأه)، يبدو أن Baidu تضاعف دقة "الهيكل" (الحصول على التخطيط المثالي).
ترقبوا مراجعة المقارنة الكاملة الأسبوع المقبل.
تابع DeepSeek V4 App للحصول على أحدث أخبار نماذج الذكاء الاصطناعي.
المؤلف

المزيد من المشاركات

إطلاق GPT-5.4 من OpenAI: سياق 1 مليون + عملاء أصليون لعرقلة DeepSeek V4!
أطلقت OpenAI بشكل مفاجئ نموذجها الرائد الأقوى GPT-5.4، المزود بسياق أصلي يصل إلى 1 مليون ومحرك عملاء، بهدف بناء حصن تقني قبل إصدار DeepSeek V4.


الجميع ينتظر إطلاق DeepSeek V4، فلماذا لم تُفتح «القدر» بعد؟ الحقيقة قد تكون أكثر تعقيداً مما تظن!
لماذا لم تلتزم DeepSeek V4 بموعد 2 مارس؟ نكشف الرهانات الثلاثة الكبرى وراء التأخير: الانتقال إلى البنية التحتية للحوسبة المحلية، الرائد متعدد الوسائط، ونافذة الإطلاق الاستراتيجية.


حرب النماذج الخفيفة: GPT-5.3 Instant و Gemini 3.1 Flash-Lite يدخلان الساحة - كيف يحافظ DeepSeek V4 على الصدارة؟
مع إصدار OpenAI و Google لنماذج GPT-5.3 Instant و Gemini 3.1 Flash-Lite في نفس اليوم، يشتعل سوق النماذج الخفيفة. تحليل تأثيرها على أنظمة الـ Agents مثل OpenClaw ومزايا DeepSeek V4.

النشرة الإخبارية
انضم إلى المجتمع
اشترك في نشرتنا الإخبارية للحصول على أحدث الأخبار والتحديثات