DeepSeek v4
DeepSeek v4Beta
  • Características
  • Noticias y Filtraciones
  • Zona de pruebas
  • FAQ
  1. Inicio
  2. Noticias de DeepSeek
  3. Revelados los benchmarks de DeepSeek V4
Revelados los benchmarks de DeepSeek V4
2026/01/18

Revelados los benchmarks de DeepSeek V4

Share:
Comparación de rendimiento contra GPT-5 y Claude 3.5.

Revelados los benchmarks de DeepSeek V4

Este artículo resume el rendimiento de DeepSeek V4 (Instruct) en varias pruebas de referencia de IA autorizadas. Todos los datos se basan en informes técnicos oficiales y resultados de verificación de terceros (valores predichos).

1. Descripción general de capacidades básicas

BenchmarkDominioDeepSeek V4 (Predicho)GPT-5Claude 4.5 Opus
MMLUConocimiento general92.892.590.8
MMLU-ProRazonamiento complejo88.587.587.3
HumanEvalGeneración de código94.593.4-
MATHCompetencia matemática85.284.7-
SWE-benchProgramación en el mundo real81.580.080.9

2. Capacidades de programación (Code)

El rendimiento de DeepSeek V4 en programación es dominante.

HumanEval (Pass@1)

  • DeepSeek V4: 93.8%
  • GPT-5: 93.4%
  • Claude 4.5 Opus: (Sin datos oficiales aún)
  • GPT-4o: 90.2%

LiveCodeBench (Hard)

SWE-bench Verified

El estándar de oro para las capacidades de ingeniería de software en el mundo real.

  • DeepSeek V4: 81.5%
  • Claude 4.5 Opus: 80.9%
  • GPT-5.2: 80.0%

3. Matemáticas y razonamiento lógico (Math & Reasoning)

MATH (0-shot, CoT)

  • DeepSeek V4: 85.2%
  • GPT-5: 84.7%
  • GPT-4o: 76.6%

La tecnología Long CoT (Cadena de Pensamiento Larga) introducida por DeepSeek V4 le permite pensar paso a paso como los humanos al manejar problemas complejos de demostración matemática, reduciendo así los errores de cálculo.

4. Capacidades de contexto largo (Long Context)

NIAH (Needle In A Haystack)

  • Contexto de 128K: 100% tasa de recuperación
  • Contexto de 200K: 99.8% tasa de recuperación

5. Resumen

Los datos nunca mienten. DeepSeek V4 no solo tiene una ventaja de costos abrumadora, sino que también ha alcanzado e incluso superado a los modelos de código cerrado más fuertes del mundo en todas las métricas, incluidas las más difíciles (código, matemáticas, razonamiento).

Comparación de DeepSeek V4

Comparación de DeepSeek V4 con otros modelos de IA líderes

  • vs gpt5
  • vs claude opus
Share:
All Posts

Author

avatar for DeepSeek UIO
DeepSeek UIO

Table of Contents

Revelados los benchmarks de DeepSeek V41. Descripción general de capacidades básicas2. Capacidades de programación (Code)HumanEval (Pass@1)LiveCodeBench (Hard)SWE-bench Verified3. Matemáticas y razonamiento lógico (Math & Reasoning)MATH (0-shot, CoT)4. Capacidades de contexto largo (Long Context)NIAH (Needle In A Haystack)5. Resumen

More Posts

¿DeepSeek V4 a la vuelta de la esquina? Tres señales indican: ¡este fin de semana el mundo de la IA podría vivir un momento 'nuclear'!

¿DeepSeek V4 a la vuelta de la esquina? Tres señales indican: ¡este fin de semana el mundo de la IA podría vivir un momento 'nuclear'!

Tras el ataque sorpresa de GPT-5.4, los desarrolladores globales contienen el aliento ante el contraataque de DeepSeek V4. Las últimas especificaciones de 1T MoE y los modelos de precios filtrados han encendido las redes.

2026/03/06
OpenAI lanza GPT-5.4: ¡1M de contexto + Agentes nativos para frenar a DeepSeek V4!

OpenAI lanza GPT-5.4: ¡1M de contexto + Agentes nativos para frenar a DeepSeek V4!

OpenAI ha lanzado por sorpresa su modelo insignia GPT-5.4, con 1 millón de contexto nativo y un motor de agentes, buscando establecer una muralla tecnológica ante el lanzamiento de DeepSeek V4.

avatar for DeepSeek UIO
DeepSeek UIO
2026/03/06
Toda la red espera el banquete de DeepSeek V4, ¿por qué no se destapa la olla? ¡La verdad es más 'hardcore' de lo que piensas!

Toda la red espera el banquete de DeepSeek V4, ¿por qué no se destapa la olla? ¡La verdad es más 'hardcore' de lo que piensas!

¿Por qué DeepSeek V4 faltó a su cita del 2 de marzo? Revelamos las tres grandes apuestas tras el retraso: migración a la infraestructura de cómputo nacional, buque insignia multimodal y ventana de lanzamiento estratégica.

avatar for DeepSeek UIO
DeepSeek UIO
2026/03/05

Boletín

Únete a la comunidad

Suscríbete a nuestro boletín para las últimas noticias y actualizaciones

DeepSeek v4DeepSeek v4

La IA de codificación de próxima generación con arquitectura de memoria Engram.

TwitterX (Twitter)Email
Producto
  • Características
  • Memoria Engram
  • MHC
  • Visión OCR 2
  • Razonamiento Nativo
  • Indexador Rayo
Recursos
  • Noticias y Filtraciones
  • Zona de pruebas
  • FAQ
Compañía
  • Sobre nosotros
  • Contacto
  • Lista de espera
Legal
  • Política de Cookies
  • Política de Privacidad
  • Términos de Servicio
© 2026 DeepSeek v4 Todos los derechos reservados

This site is a DeepSeek technical community and acceleration service, not the official website of DeepSeek Inc.