januari 2025

DeepSeek-R1 — de open-source schok

Het Chinese DeepSeek lanceert R1: een open-source redeneermodel dat GPT-4o evenaart tegen een fractie van de kosten, waarmee de mythe wordt doorbroken dat frontier-AI exclusief Amerikaans is.

Het schot dat de AI-wereld deed opschrikken

In januari 2025 bracht het Chinese AI-lab DeepSeek DeepSeek-R1 uit — een open-source redeneermodel dat GPT-4o en Claude 3.5 Sonnet op meerdere benchmarks evenaarde of overtrof, waaronder wiskunde, coderen en wetenschappelijk redeneren. De schok was niet alleen de prestatie, maar de kosten: DeepSeek beweerde R1 te hebben getraind voor ongeveer $5,6 miljoen aan rekenkrachtskosten — een fractie van de honderden miljoenen die naar verluidt werden besteed aan vergelijkbare Amerikaanse modellen. Het aandeel van Nvidia daalde op één dag met 17%.

Hoe DeepSeek dit bereikte

DeepSeek-R1 gebruikte versterkend leren van nul — beginnend vanuit een basismodel en RL gebruikend om redeneervermogens te ontwikkelen zonder gesuperviseerde chain-of-thought-data. Dit was een methodologisch andere aanpak dan OpenAI's o1 en was naar verluidt aanzienlijk rekenkrachtefficiënt. DeepSeek gebruikte ook mixture-of-experts (MoE)-architectuur en agressieve kwantisering. Onderzoekers die het paper bestudeerden, merkten op dat het technisch rigoureus was en de resultaten reproduceerbaar.

Geopolitieke en strategische implicaties

DeepSeek-R1 versloeg de aanname dat frontier-AI de enorme rekenkrachtmiddelen en het kapitaal vereist die alleen beschikbaar zijn voor Amerikaanse techgiganten. Het toonde aan dat Chinese labs — ondanks exportbeperkingen op geavanceerde NVIDIA-chips — de frontier konden bereiken of benaderen via algoritmische innovatie. Het herlaadde het debat over AI-exportcontroles, rekenkrachtbestuur en of hardwarebeperkingen een effectieve strategie zijn om AI-voordeel te behouden. Het bevestigde ook open-source AI als een levensvatbaar pad naar frontierbekwaamheid.

Bronnen

DeepSeek-AI (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv:2501.12948.
Wikipedia — DeepSeek

Auteur: Claude claude-sonnet-4-6

Gerelateerde mijlpalen

1943 — Het eerste kunstmatige neuron

1950 — De Turing-test

1951 — SNARC — het eerste neurale netwerk in hardware

DeepSeek-R1 — de open-source schok

Het schot dat de AI-wereld deed opschrikken

Hoe DeepSeek dit bereikte

Geopolitieke en strategische implicaties

Bronnen

Gerelateerde mijlpalen

Ster Software

Verkennen

Over

Juridisch