El 24 d'abril, DeepSeek va llançar la preview de V4. Dos models open-source amb llicencia MIT, 1 milió de tokens de context, i benchmarks que es posen a l'alçada de GPT-5.4 i Claude Opus 4.6. A Delbion l'estem avaluant per als nostres agents interns i ja tenim algunes conclusions clares.
Aquest article no es una ressenya de premsa. Es el que ens interessa a nosaltres com a empresa que implementa agents IA: que pot fer, que no, quant costa de veritat, i si mereix la pena per a una PIME.
1. Per que DeepSeek V4 importa ara
DeepSeek ja ens va sorprendre amb V3 al desembre de 2024: un model entrenat per 5,6M$ que competia amb GPT-4 entrenat per mes de 100M$. V4 fa un pas mes en tres direccions concretes:
- Context d'1 milió de tokens. Aixo son uns 750.000 paraules. Un agent pot llegir un contracte complet, tot l'historial d'un client o una base de codi sencera sense fragmentar res.
- Open-source amb llicencia MIT. El baixes, el modifies, l'executes als teus servidors. No hi ha vendor lock-in.
- Cost d'inferencia molt baix. V4-Pro usa nomes el 27% dels FLOPs de V3.2 per processar 1M tokens de context. El KV cache es redueix un 90%.
La combinacio dels tres es el que el fa interessant per a PIMEs. No es nomes que sigui potent. Es que pots correr-lo a la teva pròpia infraestructura sense pagar les tarifes d'OpenAI o Anthropic.
2. Els dos models: Pro i Flash
DeepSeek V4 arriba en dos sabors:
| Model | Parametres totals | Parametres actius | Per a que |
|---|---|---|---|
| V4-Pro | 1,6 bilions (1,6T) | 49.000 milions (49B) | Raonament complex, agents autònoms |
| V4-Flash | 284.000 milions (284B) | 13.000 milions (13B) | Respostes rapides, alt volum, cost minim |
Tots dos usen arquitectura Mixture-of-Experts (MoE). La diferencia clau: dels 1,6T parametres de V4-Pro, nomes 49B s'activen per cada token. Es com tenir un equip enorm on nomes treballen els especialistes que fan falta per a cada tasca concreta.
Tambe suporten tres modes de raonament:
- Non-think: respon rapid, sense deliberar. Bo per a tasques rutinaries.
- Think High: analitza abans de respondre. Mes lent, mes precís. El mode que usem per als agents.
- Think Max: raona al maxim. Per a problemes on la qualitat importa mes que el temps.
Per als agents IA, Think High es l'equilibri correcte
Non-think es massa superficial per a decisions de negoci. Think Max consumeix massa recursos per a la majoria de tasques operatives. Think High dona resultats de qualitat sense cremar costos.
3. 1 milió de tokens: que canvia en la practica
El context ample es la millora amb mes impacte en agents IA. Vegem casos concrets:
Atencio al client. Un agent que abans nomes veia els ultims 20 missatges d'un client ara pot accedir a tot l'historial. Detecta patrons, enten el context de reclamacions anteriors, i dona respostes coherents amb el que va passar fa mesos.
Documentacio tecnica. Un agent de suport pot llegir un manual complet (centenars de pagines) i respondre preguntes especifiques sense que ningú l'hagi fragmentat abans en chunks.
Desenvolupament de software. Amb 1M tokens, un agent com Claude Code o Codex pot tenir tota la base de codi d'un projecte mitja en context. No necessita endevinar quin fitxer tocar: ho sap.
DeepSeek V4 ho aconsegueix amb una arquitectura hibrida d'atencio (CSA + HCA). No es magia: es enginyeria. El resultat es que processar 1M tokens costa un 73% menys que amb V3.2.
4. Els numeros: com es compara amb GPT-5.4 i Claude
Els benchmarks oficials de DeepSeek situen V4-Pro com el millor model open-source disponible. Aquests son les dades:
| Benchmark | DeepSeek V4-Pro | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|---|
| LiveCodeBench (coding) | 93,5 | 92,1 | 91,8 | 89,4 |
| Codeforces Rating | 3.206 | 3.178 | 2.987 | 3.102 |
| GPQA Diamond (raonament) | 90,1 | 89,7 | 91,3 | 87,2 |
| SWE-Verified (agents software) | 80,6 | 79,2 | 80,6 | 80,6 |
| BrowseComp (navegacio web) | 83,4 | 81,7 | 82,1 | 79,8 |
| MCPAtlas Public (us d'eines) | 73,6 | 70,2 | 71,8 | 68,4 |
Nota sobre aquests numeros
Els benchmarks de DeepSeek comparen contra les variants de maxim esforc de cada model (GPT-5.4 xHigh, Claude Opus 4.6 Max, Gemini 3.1 Pro High). En us normal, les diferencies es redueixen. Un benchmark no es un cas d'us real.
On V4-Pro guanya clarament es a MCPAtlas Public (us d'eines). Aixo es rellevant perque els agents IA passen la major part del temps cridant APIs, navegant per webs i executant accions, no generant text bonic.
5. Que canvia per als agents IA
A Delbion usem agents cada dia. Aixo es el que V4 ens permet fer que abans no podiem (o era massa car):
1. Agents mes barats sense perdre qualitat. Un agent d'atencio al client que usa GPT-4o com a backend costa al voltant de 0,50€ per conversa. Amb V4-Flash, aquest cost baixa a menys de 0,05€. Per a una empresa amb 1.000 interaccions mensuals, la diferencia es de 450€ al mes.
2. Memoria sense infraestructura addicional. Amb 1M tokens de context, la majoria de tasques no necessiten un sistema RAG (memoria vectorial externa). L'agent mant tota la informacio rellevant dins la propia conversacio. Menys peces mobils, menys coses que trencar.
3. Execucio local per a dades sensibles. Aixo es clau per als nostres clients en salut i finances. Amb llicencia MIT, poden executar V4-Pro als seus propis servidors. Les dades del pacient o del client no surten mai de la infraestructura de l'empresa.
4. Menys dependencia d'un proveidor. Si dema DeepSeek puja els preus o canvia la llicencia, pots migrar a un altre model open-source sense reescriure el teu stack. Amb OpenAI o Anthropic, aquest vendor lock-in es un risc real.
6. Que significa per a una PIME
Si estes pensant en implementar agents IA a la teva empresa, V4 canvia algunes coses importants:
El cost ja no es la barrera. V4-Flash te nomes 13B parametres actius. Es pot executar en hardware accessible. L'API de DeepSeek costa una fraccio de la d'OpenAI. Si la teva excusa per no automatitzar era el preu, ja no val.
No has d'enviar les teves dades a ningú. Per a una clinica dental, una assessoria fiscal o una correduria d'assegurances, aixo importa. V4-Pro corre als teus servidors. Compleix amb el GDPR sense configuracions extres.
Els agents ja son prou bons. Un SWE-Verified de 80,6 significa que un agent pot resoldre tasques de software complexes. Un BrowseComp de 83,4 significa que pot navegar per webs i extreure informacio. No es ciencia ficcio. Es el que ja fan eines com Claude Code o Codex.
La barrera ara es saber que automatitzar. El model existeix, es barat i es bo. El que falta a la majoria de PIMEs es saber quins processos conv automatitzar, com integrar l'agent en el flux de treball existent, i com mesurar si realment aporta valor.
Dada Delbion
A les auditories d'IA que fem, el problema mai es tecnologic. El 90% de les empresas tenen les dades i la infraestructura necessaria. El que els falta es un pla: que automatitzar primer, com fer-ho i qui l'opera. Per aixo tenim formacio bonificada per FUNDAE especifica en agents IA.
7. Costos i self-hosting
Per posar numeros concrets:
- V4-Pro (49B actius): necessita almenys una GPU A100 (80GB) per a inferencia fluida. En cloud (AWS, GCP), aixo son uns 2-3$/hora. Per a us intensiu, compensa mes comprar el hardware.
- V4-Flash (13B actius): corre en configuracions de consumidor d'alta gamma. Una RTX 4090 (24GB) pot gestionar-lo per a us moderat.
- API de DeepSeek: les tarifes publicades son entre 10x i 50x mes barates que OpenAI per al mateix volum de tokens.
El calcul rapid: si avui pagues 500€/mes en API d'OpenAI per als teus agents, amb DeepSeek V4 estaries pagant entre 10€ i 50€ pel mateix volum. La diferencia no es marginal. Es un ordre de magnitud.
8. Veredicte
DeepSeek V4 no es nomes un model mes potent. Es la prova que la IA de frontera pot ser oberta, barata i accessible per a empresas de qualsevol mida. Els benchmarks son solids, la llicencia MIT elimina el vendor lock-in, i el cost d'inferencia fa que els agents IA siguin viables economicament per a PIMEs.
El que segueix sent el coll d'ampolla no es la tecnologia. Es l'organitzacio. Saber que automatitzar, com integrar-ho i com formar l'equip perque en treui profit.
Si vols explorar com els agents IA poden transformar la teva empresa, oferim una auditoria gratuïta de processos automatitzables. Sense compromis.
El teu equip necessita formacio en IA segura
L'EU AI Act exigeix alfabetitzacio IA per a tota la plantilla des d'agost 2026. Els nostres cursos cobreixen compliance, agents IA i governanca. FUNDAE pot subvencionar el 100% del cost.