DeepSeek v4
DeepSeek v4Beta
  • विशेषताएँ
  • समाचार और लीक
  • Playground
  • अक्सर पूछे जाने वाले प्रश्न (FAQ)
DeepSeek V4 आर्किटेक्चर

OCR 2 विजन

विजुअल-लैंग्वेज MoE। जटिल दस्तावेज़ों की पिक्सेल-परफेक्ट समझ।

Share:
प्रतीक्षा सूची में शामिल हों

OCR 2 क्या है?

DeepSeek OCR 2 दृश्य दस्तावेज़ समझ में एक आदर्श बदलाव का प्रतिनिधित्व करता है। यह एक नए 'DeepEncoder V2' आर्किटेक्चर का उपयोग करता है, जो दृश्य समझ को पीढ़ी से अलग करता है। यह मानव-समान पढ़ने के क्रम में दस्तावेजों को समझने के लिए प्रशिक्षित है, जिससे यह जटिल लेआउट, नेस्टेड टेबल और गणितीय सूत्रों को पिक्सेल से मार्कडाउन/LaTeX में पूरी तरह से पुनर्निर्माण करने की अनुमति देता है।
चित्र 1: मानक OCR बनाम DeepEncoder V2

चित्र 1: मानक OCR बनाम DeepEncoder V2

OCR 1.0 बनाम OCR 2.0

DeepSeek OCR 1.0

बाउंडिंग बॉक्स डिटेक्शन। जटिल लेआउट और हस्तलेखन के साथ संघर्ष किया।

DeepSeek OCR 2.0

एंड-टू-एंड विजुअल-लैंग्वेज मॉडल। 91% सटीकता। किसी भी लेआउट, हस्तलेखन और फॉर्मूले को संभालता है।

OmniDocBench स्कोर

डायनेमिक टाइलिंग और जानूस-प्रो

OCR 2 बिना किसी विरूपण के किसी भी पहलू अनुपात के उच्च-रिज़ॉल्यूशन इनपुट को संभालने के लिए 'डायनेमिक टाइलिंग' रणनीति का उपयोग करता है। यह जानूस-प्रो ढांचे द्वारा संचालित है, जो दृश्य सुविधा निष्कर्षण (SigLIP) और दृश्य टोकन पीढ़ी (VQ) के लिए अलग-अलग एनकोडर का उपयोग करता है, यह सुनिश्चित करता है कि उच्च अर्थपूर्ण समझ और सटीक विस्तार पुनर्निर्माण दोनों।

सामान्य प्रश्न

Share:
संबंधित पठन
  • DeepSeek V4 रिलीज़ तिथि भविष्यवाणी
  • DeepSeek V4 बनाम GPT-5 गहन तुलना
  • DeepSeek विकास
V4 लीक प्राप्त करें
50,000+ डेवलपर्स ट्रैकिंग V4 में शामिल हों।
DeepSeek v4DeepSeek v4

Engram मेमोरी आर्किटेक्चर के साथ अगली पीढ़ी का कोडिंग AI।

TwitterX (Twitter)Email
उत्पाद
  • विशेषताएँ
  • Engram मेमोरी
  • MHC
  • OCR 2 Vision
  • नेटिव रीजनिंग
  • लाइटनिंग इंडेक्सर
संसाधन
  • समाचार और लीक
  • Playground
  • अक्सर पूछे जाने वाले प्रश्न (FAQ)
कंपनी
  • हमारे बारे में
  • संपर्क करें
  • प्रतीक्षा सूची
कानूनी
  • कुकी नीति
  • गोपनीयता नीति
  • सेवा की शर्तें
© 2026 DeepSeek v4 सर्वाधिकार सुरक्षित