- خانه
- اخبار دیپسیک
- جنگهای OCR بالا میگیرد: Baidu مدل PaddleOCR-VL-1.5 را برای به چالش کشیدن DeepSeek منتشر کرد

جنگهای OCR بالا میگیرد: Baidu مدل PaddleOCR-VL-1.5 را برای به چالش کشیدن DeepSeek منتشر کرد
تنها چند روز پس از انتشار DeepSeek-OCR 2، تیم PaddleOCR بایدو با PaddleOCR-VL-1.5 پاسخ میدهد و ادعای عملکرد برتر در تجزیه اسناد دارد.
جنگهای OCR بالا میگیرد: Baidu مدل PaddleOCR-VL-1.5 را منتشر کرد
30 ژانویه 2026
نبرد برای تسلط بر مدل زبان بصری (VLM) در LLM متوقف نمیشود. تنها چند روز پس از انتشار DeepSeek-OCR 2 تحسینشده توسط DeepSeek، غول فناوری Baidu با یک بروزرسانی بزرگ در ابزار منبع باز خود پاسخ داده است: PaddleOCR-VL-1.5.
چه چیزی جدید است؟
این نسخه جدید که در 29 ژانویه 2026 در GitHub منتشر شد، دقیقاً همان جایگاهی را هدف قرار میدهد که آخرین پیشنهاد DeepSeek است: تجزیه اسناد با دقت بالا و استخراج ساختار.
معیارهای اولیه منتشر شده توسط تیم Paddle نشان میدهد که PaddleOCR-VL-1.5 ممکن است در وظایف خاصی از DeepSeek-OCR 2 پیشی بگیرد:
- استخراج جدول: ادعای 5 درصد دقت بالاتر در جداول مالی پیچیده.
- کارایی: برای استقرار در لبه بهینه شده است و سریعتر روی پردازندههای گرافیکی مصرفکننده اجرا میشود.
- پشتیبانی چند زبانه: پشتیبانی گسترده برای اسناد با زبانهای ترکیبی.
مقایسه DeepSeek OCR 2 و PaddleOCR-VL-1.5
| ویژگی | DeepSeek OCR 2 | PaddleOCR-VL-1.5 |
|---|---|---|
| تاریخ انتشار | 27 ژانویه 2026 | 29 ژانویه 2026 |
| تمرکز | CoT بصری و استدلال | تجزیه ساختار و سرعت |
| معماری | DeepEncoder V2 | NaViT اصلاح شده |
| منبع باز | مجوز MIT | Apache 2.0 |
واکنش جامعه
زمانبندی غیرقابل انکار است. یکی از توسعهدهندگان در Hacker News میگوید: "این به وضوح یک پاسخ است." "DeepSeek روز سهشنبه معیار جدیدی تعیین کرد و Baidu سعی کرد روز پنجشنبه آن را پشت سر بگذارد."
ما در حال حاضر بنچمارکهای داخلی خود را برای تأیید این ادعاها اجرا میکنیم. در حالی که DeepSeek-OCR 2 به شدت بر جنبه "استدلال" خواندن (درک آنچه میخواند) تمرکز دارد، به نظر میرسد Baidu بر روی دقت "ساختاری" (کامل کردن طرحبندی) تمرکز کرده است.
منتظر بررسی مقایسه کامل ما در هفته آینده باشید.
برای آخرین اخبار مدل هوش مصنوعی، DeepSeek V4 App را دنبال کنید.
پستهای بیشتر

عرضه GPT-5.4 پرچمدار OpenAI: با ۱ میلیون زمینه + ایجنتهای بومی برای مهار DeepSeek V4!
شرکت OpenAI به طور غافلگیرانهای قدرتمندترین مدل پرچمدار خود GPT-5.4 را با ۱ میلیون زمینه بومی و موتور ایجنت عرضه کرد تا پیش از انتشار DeepSeek V4، یک سد دفاعی تکنولوژیک ایجاد کند.


همه منتظر DeepSeek V4 هستند، چرا هنوز منتشر نشده؟ واقعیت ممکن است از آنچه فکر میکنید جدیتر باشد!
چرا DeepSeek V4 در تاریخ ۲ مارس منتشر نشد؟ فاش کردن سه قمار بزرگ پشت پرده: مهاجرت به زیرساختهای محاسباتی داخلی، پرچمدار چندمنظوره و پنجره استراتژیک انتشار.


نبرد مدلهای سبک: GPT-5.3 Instant و Gemini 3.1 Flash-Lite وارد میشوند - DeepSeek V4 چگونه پیشتازی خود را حفظ میکند؟
با عرضه همزمان GPT-5.3 Instant و Gemini 3.1 Flash-Lite توسط OpenAI و گوگل، بازار مدلهای سبک دوباره داغ شده است. تحلیل تأثیر بر اکوسیستمهای ایجنت مانند OpenClaw و مزایای رقابتی DeepSeek V4.

خبرنامه
به جامعه بپیوندید
برای دریافت آخرین اخبار و بروزرسانیها در خبرنامه ما مشترک شوید