logo_blanc
Rechercher

Story | Le boom des puces d’IA a sauvé Groq, la start-up veut désormais rivaliser avec Nvidia

GroqJonathan Ross, PDG de Groq. | Source : capture d’écran vidéo

Forte de sa valorisation à 2,8 milliards de dollars grâce à une nouvelle levée de fonds de 640 millions de dollars, la start-up Groq pense pouvoir défier l’une des entreprises les plus importantes au monde avec une puce spécialement conçue pour l’IA.

Article de Richard Nieva pour Forbes US – traduit par Flora Lucas

 

Jonathan Ross a été le premier à se rendre compte que quelque chose n’allait pas lorsqu’en février il s’est adressé à une foule de membres du Parlement norvégien et de dirigeants d’entreprises technologiques à Oslo. Jonathan Ross, 42 ans, PDG de Groq, une start-up spécialisée dans les puces d’IA, était au milieu d’une démo qui, espérait-il, donnerait de la vitalité à l’entreprise en perte de vitesse : un chatbot d’IA capable de répondre à des questions presque instantanément, plus vite qu’un être humain ne peut lire. Cependant, pour une raison ou une autre, ce chatbot était légèrement à la traîne. Cela a troublé Jonathan Ross, qui présentait un projet de centre de données européen alimenté par Groq pour mettre en valeur les puces spécialisées à l’origine de ces réponses ultrarapides. « Je n’arrêtais pas de vérifier les chiffres », se souvient-il. « Les gens ne comprenaient pas pourquoi j’étais si distrait. »

Le coupable était un afflux de nouveaux utilisateurs. Un jour avant la réunion de Jonathan Ross à Oslo, un tweet viral d’un développeur enthousiaste vantant les mérites d’un « moteur de réponse IA rapide comme l’éclair » a envoyé des tonnes de trafic supplémentaire vers la démo en ligne, ce qui a fait plier les serveurs de l’entreprise. C’était un problème, mais un problème utile.

 

Répondre à l’inférence

Lorsqu’il a fondé Groq il y a huit ans, Jonathan Ross voulait concevoir des puces d’IA explicitement pour ce qui est connu dans l’industrie sous le nom d’« inférence » : la partie de l’intelligence artificielle (IA) qui imite le raisonnement humain en appliquant ce qu’elle a appris à de nouvelles situations. C’est ce qui permet à votre smartphone d’identifier votre chien comme un Corgi sur une photo qu’il n’a jamais vue auparavant, ou à un générateur d’images d’imaginer le pape François dans un manteau Balenciaga. C’est tout à fait différent de l’autre tâche informatique de l’IA : l’entraînement des modèles massifs pour commencer.

Cependant, jusqu’à ce qu’OpenAI lance ChatGPT fin 2022, déclenchant une frénésie mondiale pour l’IA, la demande d’inférence ultrarapide était limitée et la start-up faisait du surplace. « Groq a failli mourir à de nombreuses reprises », explique Jonathan Ross depuis le laboratoire de semi-conducteurs de la start-up à San Jose, en Californie, se souvenant d’un moment critique en 2019 où la start-up était à un mois de se retrouver à court d’argent. « Nous avons lancé Groq peut-être un peu trop tôt ».

Cependant, maintenant, avec la demande de puissance de calcul pour construire et exécuter des modèles d’IA si intense que cela contribue à une pénurie mondiale d’électricité, le temps de Groq est apparemment venu : soit comme un acteur majeur potentiel, soit comme une cible d’acquisition pour les géants des puces. Lundi 5 août, la start-up a annoncé en exclusivité à Forbes qu’elle avait levé un énorme fonds de série D de 640 millions de dollars, ce qui lui a permis d’atteindre une valorisation de 2,8 milliards de dollars, contre 1,1 milliard de dollars en 2021. Le tour de table, mené par BlackRock Private Equity Partners, comprend également Cisco Investments et le Samsung Catalyst Fund, une branche de capital-risque du géant de l’électronique qui se concentre sur l’infrastructure et l’IA.

 


« Groq a failli mourir à de nombreuses reprises. »

Jonathan Ross, PDG, Groq


 

Le besoin de puissance de calcul est si insatiable qu’il a fait grimper la capitalisation boursière de Nvidia à 3 000 milliards de dollars pour un chiffre d’affaires de 60,9 milliards de dollars en 2023. Groq est encore minuscule en comparaison, avec un chiffre d’affaires de 3,4 millions de dollars en 2023 et une perte nette de 88,3 millions de dollars, selon les documents financiers consultés par Forbes. Cependant, comme ses puces suscitent un vif intérêt, la start-up a prévu un chiffre d’affaires peut-être optimiste de 100 millions de dollars cette année, selon des sources qui doutent toutefois que l’entreprise puisse atteindre cet objectif. Groq a refusé de commenter ces chiffres.

 

Le marché des puces d’IA

Le marché des puces d’IA devrait atteindre 1 100 milliards de dollars d’ici 2027, et Jonathan Ross voit une opportunité de s’approprier une partie des 80 % de parts de marché de Nvidia en se concentrant sur l’inférence. Ce marché devrait valoir environ 39 milliards de dollars cette année et atteindre 60,7 milliards de dollars dans les quatre prochaines années, selon le cabinet d’études IDC. « Le calcul est le nouveau pétrole », affirme Jonathan Ross.

Les challengers comme Groq sont optimistes, car les puces de Nvidia n’ont même pas été conçues à l’origine pour l’IA. Lorsque le PDG Jensen Huang a présenté ses processeurs graphiques (GPU) en 1999, ils étaient conçus pour faire tourner des jeux vidéo gourmands en ressources graphiques. C’est par hasard que ces puces ont été les mieux adaptées à l’entraînement de l’IA. Toutefois, Groq et une nouvelle vague de start-up spécialisées dans les puces de nouvelle génération, dont Cerebras (valorisation de 4 milliards de dollars) et SambaNova (valorisation de 5,1 milliards de dollars), voient une ouverture. « Aucun acteur du secteur parti de rien n’a choisi de fabriquer un GPU pour ce type de tâche », déclare Andrew Feldman, PDG de Cerebras.

Les start-up ne sont pas les seules à vouloir détrôner Nvidia. Amazon et Microsoft construisent leurs propres puces d’IA. Cependant, les puces de Groq, appelées Language Processing Units (LPU), sont si rapides que l’entreprise pense avoir une chance de rivaliser. Dans une présentation aux investisseurs, la start-up présente ses puces comme quatre fois plus rapides, cinq fois moins chères et trois fois plus économes en énergie que les GPU de Nvidia lorsqu’ils sont utilisés pour l’inférence. Nvidia a refusé de commenter cette affirmation.

« Leurs vitesses d’inférence sont clairement supérieures à tout ce qui existe sur le marché », déclare Aemish Shah, cofondateur de General Global Capital, qui a investi dans plusieurs tours de financement de Groq.

 

Les débuts de Groq

Groq a commencé à vendre ses puces il y a deux ans et a depuis gagné des clients comme Argonne National Labs, un centre de recherche fédéral américain dont les origines remontent au « projet Manhattan » et qui a utilisé les puces Groq pour étudier la fusion nucléaire. Aramco Digital, la branche technologique de la compagnie pétrolière saoudienne, a également conclu un partenariat pour utiliser les puces Groq.

En mars, Groq a lancé GroqCloud, qui permet aux développeurs de louer l’accès à ses puces sans les acheter. Pour attirer les développeurs, Groq leur a offert un accès gratuit : au cours du premier mois, 70 000 d’entre eux se sont inscrits. Aujourd’hui, ils sont 350 000, et ce n’est pas fini. Le 30 juin, la société a commencé à effectuer des paiements et vient d’embaucher Stuart Pann, ancien cadre d’Intel et désormais directeur de l’exploitation de Groq, afin d’augmenter rapidement les recettes et les opérations. Stuart Pann est optimiste quant à la croissance : plus d’un quart des tickets des clients de GroqCloud sont des demandes de paiement pour plus de puissance de calcul.

« La puce Groq vise en plein dans le mille », déclare Yann LeCun, directeur scientifique de Meta, ancien professeur d’informatique de Jonathan Ross à l’université de New York, qui a récemment rejoint Groq en tant que conseiller technique. À la fin du mois dernier, le PDG Mark Zuckerberg a annoncé que Groq serait l’une des entreprises fournissant des puces pour l’inférence du nouveau modèle de Meta, le Llama 3.1, qualifiant la start-up d’« innovatrice ».

 


« La puce Groq vise en plein dans le millet. »

Yann LeCun, scientifique en chef, Meta


 

Jonathan Ross a fait ses classes chez Google, où il a travaillé dans l’équipe qui a créé les semi-conducteurs « tensor processing units » de l’entreprise, qui sont optimisés pour l’apprentissage automatique. Il a quitté l’entreprise en 2016 pour créer Groq, avec un autre ingénieur de Google, Doug Wightman, qui a été le premier PDG de l’entreprise. Cette année-là, Groq a levé un fonds de 10 millions de dollars dirigé par le fonds de capital-risque Social Capital. Cependant, à partir de là, il a été difficile de trouver de nouveaux investisseurs. Doug Wightman, cofondateur de Groq, a quitté l’entreprise quelques années plus tard et n’a pas répondu aux demandes d’interview.

Les détracteurs sont encore nombreux. Un investisseur en capital-risque qui n’a pas participé au tour de table de série D de la société a qualifié l’approche de Groq de « novatrice », mais ne pensait pas que sa propriété intellectuelle était défendable à long terme. Mitesh Agrawal, responsable de l’informatique dématérialisée pour la start-up Lambda, spécialisée dans l’infrastructure d’IA et valorisée à 1,5 milliard de dollars, déclare que son entreprise n’a pas l’intention de proposer Groq ou d’autres puces spécialisées dans son informatique dématérialisée. « Il est très difficile pour l’instant de penser à autre chose qu’à Nvidia », déclare-t-il. D’autres s’interrogent sur la rentabilité des puces Groq à grande échelle.

Jonathan Ross sait qu’il s’agit d’une tâche ardue. « C’est un peu comme si nous étions le débutant de l’année », dit-il. « Nous ne sommes pas encore à la hauteur de Nvidia. Tous les regards sont donc tournés vers nous. La question est de savoir ce que nous allons faire ensuite. »

Reportage complémentaire de Rashi Shrivastava, Alex Konrad et Kenrick Cai.

 


À lire également : À SUIVRE | Skynopy améliore la connectivité des satellites en orbite basse

Vous avez aimé cet article ? Likez Forbes sur Facebook

Newsletter quotidienne Forbes

Recevez chaque matin l’essentiel de l’actualité business et entrepreneuriat.

Abonnez-vous au magazine papier

et découvrez chaque trimestre :

1 an, 4 numéros : 30 € TTC au lieu de 36 € TTC