Remue-ménage dans l'IA

Les avancées du laboratoire chinois DeepSeek bousculent les lignes

Cafétech
4 min ⋅ 01/02/2025

Tous les vendredis, l’édition hebdomadaire de Cafétech vous propose un tour d’horizon des principales actus tech de la semaine écoulée.

Bonne lecture et bon week-end.


| GRAND ANGLE |

DeepSeek, la start-up chinoise qui rebat les cartes de l'IA

Une véritable onde de choc. La semaine dernière, le laboratoire chinois DeepSeek a lancé un grand modèle de langage rivalisant avec les meilleurs du marché, mais n’ayant coûté que quelques millions de dollars à concevoir. De quoi faire voler en éclats les certitudes du secteur de l’intelligence artificielle générative, en particulier aux États-Unis, persuadés de leur supériorité technologique. Celles d’OpenAI ou de Meta, lancés dans une course à l’armement pour se doter d’une immense puissance de calcul informatique, devant leur permettre d’entraîner et faire tourner les prochains modèles. Celles de Microsoft, d’Amazon ou de Google, qui investissent massivement pour accroître les capacités de leur offre de cloud. Et aussi celles de Nvidia, leader incontesté des cartes graphiques (GPU), dont l’action a chuté lundi de 17%.

Premier sur l’App Store – Longtemps inconnu, DeepSeek avait déjà suscité la curiosité fin décembre, avec un premier modèle, baptisé V3. Mais le laboratoire, créé il y a moins de deux ans, est entré dans une nouvelle dimension avec un modèle de raisonnement, appelé R1. Sur la plateforme Hugging Face, celui-ci caracole en tête des modèles open source les plus téléchargés par les développeurs. Sur l’App Store, DeepSeek vient de détrôner ChatGPT de son statut d’application mobile la plus populaire aux États-Unis. Comparaisons à l’appui – des données à toujours prendre avec précaution –, le groupe chinois revendique des performances similaires, voire supérieures, aux modèles équivalents d’OpenAI, Meta ou Anthropic. Il n’a pourtant pas accès aux GPU les plus puissants de Nvidia, considérés jusqu’à présent comme indispensables.

5,6 millions de dollars – À l’automne 2022, les États-Unis ont en effet imposé de sévères restrictions sur les exportations de puces vers la Chine. Dans un article de recherche, DeepSeek explique ainsi avoir utilisé des puces H800 de Nvidia, une version bridée pour passer sous les seuils de puissance fixés par Washington. Pour rivaliser avec les groupes américains, qui bénéficient d’une puissance de calcul bien supérieure, le laboratoire a donc dû innover. Il a délaissé la méthode d’apprentissage auto-supervisé. À la place, il a simplement utilisé une technique appelée apprentissage par renforcement, qui doit permettre à une IA de réfléchir seule. Résultat: DeepSeek assure que l’entraînement de son modèle V3 n’a coûté que 5,6 millions de dollars, soit une toute petite fraction des centaines de millions dépensés par OpenAI et les autres.

Menace – Ces chiffres sont impossibles à vérifier. Mais ils suscitent déjà un vent de panique dans la Silicon Valley et à Wall Street. Et pour cause: les avancées de DeepSeek menacent tout le modèle d’investissement qui s’est mis en place depuis deux ans. Le danger ne vient pas nécessairement du laboratoire de recherche, ou d’autres start-up chinoises. D’abord, parce que ses modèles sont soumis à la censure chinoise. Ensuite, parce qu’il sera probablement rattrapé par le RGPD européen sur l’envoi de données vers la Chine. Enfin, parce qu’il pourrait tout simplement être interdit pour des raisons de sécurité, en particulier aux États-Unis. Le danger pour les acteurs en place, c’est davantage que les modèles de DeepSeek, disponibles en open source, ou sa méthode d’entraînement se diffusent à l’ensemble de l’écosystème.

Retour sur investissement – Ce scénario devrait se traduire par une baisse des prix, alors que la start-up chinoise vend l’accès à ses API (interfaces de programmation) dix fois moins cher. Et par une intensification de la concurrence, avec des rivaux plus petits qui ne seront plus limités par leurs ressources financières. Dans ces conditions, comment OpenAI ou Anthropic pourront rentabiliser les investissements qui ont déjà réalisés ? Même question pour les géants du cloud, qui ont dépensé sans compter pour anticiper d’un bond de la demande. Ces nouveaux modèles demanderont en effet moins de puissance pour être entraînés et pourront tourner en local, directement sur un ordinateur ou un smartphone. Et comment Nvidia va pouvoir continuer à vendre toujours plus de GPU à des prix très élevés ? Ou ASML avec ses machines de lithographie ?

Pour aller plus loin:
– “L’IA ? La plus grande bulle de tous les temps”
– Dans l’IA, des start-up prometteuses sont devenues des start-up zombies


| EN BREF |

Nvidia dédramatise après les avancées de DeepSeek

Près de 600 milliards de dollars de capitalisation boursière envolés en une seule séance. Record pulvérisé. Lundi, Nvidia a subi une sévère correction à Wall Street – avant de regagner une partie de ses pertes mardi. Le géant américain des cartes graphiques (GPU) a pris de plein fouet les avancées du laboratoire chinois DeepSeek, qui ont démontré qu’il était possible de concevoir une intelligence artificielle générative très performante avec une puissance informatique limitée. Cela représente un potentiel changement de paradigme sur un secteur habitué à dépenser des sommes folles pour accroître ses capacités de calcul, en achetant des dizaines ou centaines de milliers de GPU vendus à prix d’or. Et donc une menace sur la croissance à venir des ventes de Nvidia, dont le ralentissement commençait déjà à inquiéter certains investisseurs.


DeepSeek, symbole d’un échec du modèle américain dans l’IA

Dans son style provocateur, Alex Karp avait déjà déclaré la fin de la guerre. “Les États-Unis sont au tout début d’une révolution qui nous appartient: la révolution de l’intelligence artificielle. On devrait l’appeler la révolution américaine de l’IA”, avait-il lancé en décembre, au cours d’une conférence consacrée à la défense. Peu d’observateurs pouvaient alors imaginer que cette déclaration le rattraperait à peine deux mois plus tard, tant la domination des groupes américains était évidente, de la conception des modèles aux cartes graphiques dédiées, en passant par les plateformes de cloud. Sans compter l’accès à des capitaux beaucoup plus importants. S’il pensait surtout à la faible concurrence européenne, ne manquant pas de critiquer un excès de régulation, le dirigeant avait complètement négligé de potentielles avancées chinoises.


Mark Zuckerberg promet de ne pas ralentir les investissements dans l'IA

Pas question de changer de cap. Du moins, pas encore. Alors que les avancées du laboratoire chinois DeepSeek font vaciller les certitudes du secteur de l’intelligence artificielle générative, Mark Zuckerberg a réaffirmé mercredi son intention d’investir “massivement” dans son infrastructure informatique. “Cela va être un avantage stratégique à long terme”, a-t-il assuré en marge des résultats annuels de Meta. La maison mère de Facebook et d’Instagram anticipe ainsi des dépenses en capital comprises entre 60 et 65 milliards de dollars cette année, contre 39 milliards en 2024. Elle a notamment lancé la construction d’un immense data center en Louisiane. Et elle prévoit de “terminer l’année avec plus de 1,3 million de cartes graphiques”, explique son patron, qui souhaite aussi accroître “considérablement les équipes d’IA”.


En quête de revanche, Masayoshi Son “fait tapis” sur OpenAI

Masayoshi Son n’attendait que cela. Lui qui avait été contraint de se faire plus discret après une série de paris désastreux, lui faisant rater la première vague d’investissement dans l’intelligence artificielle générative. Depuis dix jours, le revoilà désormais au centre de l’attention. Aux côtés de Donald Trump à la Maison Blanche, pour annoncer l’ambitieux projet Stargate – qui vise à investir 500 milliards de dollars en quatre ans dans la construction d'immenses centres de données pour accompagner le développement d’OpenAI. En coulisses également, pour investir une somme colossale dans le créateur de ChatGPT. Selon le Financial Times, l’homme d’affaires japonais, via son groupe Softbank, serait prêt à injecter entre 15 et 25 milliards de dollars, ce qui lui permettrait d’en devenir le premier actionnaire, devant Microsoft.


| ET AUSSI |

>> Les États-Unis promettent d'imposer des droits de douane sur les puces


Crédit photos: DeepSeek - Nvidia

Cafétech

Cafétech

Par Jérôme Marin

Les derniers articles publiés