januari 2025

DeepSeek-R1 — de open-source schok

Het Chinese DeepSeek lanceert R1: een open-source redeneermodel dat GPT-4o evenaart tegen een fractie van de kosten, waarmee de mythe wordt doorbroken dat frontier-AI exclusief Amerikaans is.

Het schot dat de AI-wereld deed opschrikken

In januari 2025 bracht het Chinese AI-lab DeepSeek DeepSeek-R1 uit — een open-source redeneermodel dat GPT-4o en Claude 3.5 Sonnet op meerdere benchmarks evenaarde of overtrof, waaronder wiskunde, coderen en wetenschappelijk redeneren. De schok was niet alleen de prestatie, maar de kosten: DeepSeek beweerde R1 te hebben getraind voor ongeveer $5,6 miljoen aan rekenkrachtskosten — een fractie van de honderden miljoenen die naar verluidt werden besteed aan vergelijkbare Amerikaanse modellen. Het aandeel van Nvidia daalde op één dag met 17%.

Hoe DeepSeek dit bereikte

DeepSeek-R1 gebruikte versterkend leren van nul — beginnend vanuit een basismodel en RL gebruikend om redeneervermogens te ontwikkelen zonder gesuperviseerde chain-of-thought-data. Dit was een methodologisch andere aanpak dan OpenAI's o1 en was naar verluidt aanzienlijk rekenkrachtefficiënt. DeepSeek gebruikte ook mixture-of-experts (MoE)-architectuur en agressieve kwantisering. Onderzoekers die het paper bestudeerden, merkten op dat het technisch rigoureus was en de resultaten reproduceerbaar.

Geopolitieke en strategische implicaties

DeepSeek-R1 versloeg de aanname dat frontier-AI de enorme rekenkrachtmiddelen en het kapitaal vereist die alleen beschikbaar zijn voor Amerikaanse techgiganten. Het toonde aan dat Chinese labs — ondanks exportbeperkingen op geavanceerde NVIDIA-chips — de frontier konden bereiken of benaderen via algoritmische innovatie. Het herlaadde het debat over AI-exportcontroles, rekenkrachtbestuur en of hardwarebeperkingen een effectieve strategie zijn om AI-voordeel te behouden. Het bevestigde ook open-source AI als een levensvatbaar pad naar frontierbekwaamheid.


Bronnen

  • DeepSeek-AI (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv:2501.12948.
  • Wikipedia — DeepSeek

Ster Software

Het meest complete Nederlandstalige informatieplatform over kunstmatige intelligentie.

Kraaienjagersweg 24
7341 PT Beemte Broekland


© 2026 Ster Software BV · KvK 75474913

Inhoud gegenereerd door Claude (Anthropic) · model: claude-sonnet-4-6

Deze website is gebouwd met Obelisk MCP Services van Ster Software.