Januari 2025
DeepSeek-R1 — de open source schok
Het Chinese DeepSeek lanceert R1: een open source redeneermodel dat GPT-4o evenaart tegen een fractie van de kosten, en de mythe doorbreekt dat frontier-AI exclusief Amerikaans is.
De schok van januari 2025
Op 20 januari 2025 bracht het Chinese AI-lab DeepSeek zijn R1-model volledig open source uit. De impact was seismisch: technisch, economisch en geopolitiek tegelijk. Technisch overtrof DeepSeek-R1 op redeneer-benchmarks vrijwel alle concurrenten, inclusief OpenAI's o1. Economisch stortte de aandelenmarkt in: NVIDIA verloor op één dag meer dan 500 miljard dollar aan beurswaarde. Geopolitiek bewees het dat China een frontier-AI-model kon bouwen ondanks Amerikaanse exportbeperkingen op geavanceerde chips.
DeepSeek: achtergrond
DeepSeek was opgericht in 2023 door Liang Wenfeng, mede-oprichter van het quantumfonds High-Flyer Capital Management, dat zijn AI-expertise had opgebouwd voor algoritmic trading. In 2024 bracht DeepSeek al indrukwekkende modellen uit (DeepSeek-V2 en V3), maar R1 was de echte doorbraak. R1 was een redeneermodel — getraind om stap-voor-stap redeneerketens te produceren, vergelijkbaar met OpenAI's o1 — maar het werd gepubliceerd met volledige gewichten en een technisch rapport.
Technische innovaties
DeepSeek-R1 was opmerkelijk efficiënt. Naar verluidt kostte de training minder dan 6 miljoen dollar — een fractie van wat westerse labs uitgeven. De sleutels waren meerdere architectuurinnovaties. Group Relative Policy Optimization (GRPO) verving de gebruikelijke PPO-reinforcement learning methode door een efficiëntere aanpak die minder geheugen vereiste. Een Mixture of Experts-architectuur activeerde slechts een deel van de parameters voor elke invoer, wat de inferentiekosten drastisch verlaagde. Multi-token prediction versnelde de training.
R1 gebruikte ook een vernieuwende trainingsaanpak: in plaats van te beginnen met een bestaand goed getraind model en dat te finetunen op redeneerdata, leerde R1 chain-of-thought redeneren bijna van nul. Het model werd meerdere malen verfijnd en destillatie werd toegepast om kleinere, efficiënte varianten te creëren.
De NVIDIA-schok
Op maandag 27 januari 2025 opende de aandelenmarkt met een crash in tech-aandelen. NVIDIA verloor meer dan 16% van zijn beurswaarde — een verlies van meer dan 500 miljard dollar aan marktkapitalisatie, het grootste ééndaagse verlies van één aandeel in de Amerikaanse beursgeschiedenis. De redenering was eenvoudig: als een goedkoper model met minder chips even goed presteerde, waren de duizenden NVIDIA H100-GPU's die de AI-industrie had ingekocht misschien overbodig. Andere AI-chipmakers verloren ook zwaar.
Geopolitieke betekenis
De geopolitieke implicaties waren even significant. De VS had exportbeperkingen opgelegd op geavanceerde GPU's naar China, waaronder NVIDIA H100s, in de overtuiging dat dit China zou remmen bij het bouwen van frontier-AI. DeepSeek R1 bewees dat dit niet volledig werkte. China kon ofwel genoeg chips opslaan voor het trainen, ofwel methoden ontwikkelen die minder chips vereisten. Dit leidde tot een herziening van de exportcontrole-strategie en een debat over of technologie-beperkingen effectief waren.
Bronnen
- DeepSeek-AI et al. (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv:2501.12948.
- DeepSeek-R1 op GitHub
- Wikipedia — DeepSeek