Baseten lève 1,5 Md$ : la ruée de l'inférence IA

Publié le juillet 4, 2026 · par ALGERIATECH Editorial

⚡ Points Clés

Baseten a levé 1,5 milliard de dollars lors d’une série F à une valorisation atteignant 13 milliards de dollars, soit une hausse de 160 % en moins de six mois, alors que son chiffre d’affaires a crû d’environ 20x en un an et que la plateforme traite désormais plus d’un milliard d’appels d’inférence IA par jour. Cette levée est survenue la même semaine que celles de ses rivaux Groq (650 millions $) et Upscale AI (190 millions $), confirmant que l’infrastructure d’inférence IA — et non l’entraînement des modèles — est désormais le terrain le plus disputé du capital-risque.

En résumé : Les fondateurs IA et les DSI d’entreprise devraient comparer le coût d’inférence par jeton entre au moins deux fournisseurs et construire des produits IA spécifiques à un secteur plutôt que d’affronter directement des acteurs d’infrastructure d’inférence bien capitalisés.

Lire l’analyse complète ↓

🧭 Radar de Décision

Pertinence pour l’Algérie
Moyenne
▾

Les équipes produit IA algériennes (fintech, e-commerce, agri-tech) sont consommatrices d’infrastructure d’inférence, pas constructrices — la pertinence réside dans le choix des fournisseurs et la gestion des coûts, pas dans la compétition pour ce type de financement.

Infrastructure prête ?
Partielle
▾

L’Algérie ne dispose pas de présence locale d’hyperscaler ou de cloud GPU, ce qui rend les équipes locales entièrement dépendantes de fournisseurs internationaux comme le réseau multi-cloud de Baseten ; les questions de latence et de résidence des données restent non résolues pour des secteurs réglementés comme la banque.

Compétences disponibles ?
Limitées
▾

L’expertise MLOps et de service d’inférence (ordonnancement GPU, routage de modèles, optimisation des coûts) est rare dans le vivier actuel de développeurs algériens, concentré surtout sur des compétences backend et DevOps génériques.

Calendrier d’action
12-24 mois
▾

Les adoptants IA algériens devraient développer une culture des coûts d’inférence au cours des un à deux prochaines années, à mesure que davantage de produits locaux intègrent des fonctionnalités IA et que la dépense d’inférence devient un poste significatif.

Parties prenantes clés
Fondateurs IA, DSI d’entreprise, responsables d’ingénierie
▾

Assessment: Fondateurs IA, DSI d’entreprise, responsables d’ingénierie. Review the full article for detailed context and recommendations.

Type de décision
Éducatif
▾

Cet article explique un changement structurel dans le financement de l’infrastructure IA et ses implications de coût, plutôt que d’exiger une décision immédiate de la plupart des lecteurs algériens.

En bref : Les startups et entreprises algériennes qui construisent des fonctionnalités IA devraient dès maintenant auditer leurs choix de fournisseurs d’inférence — des écarts de coût par jeton de 5 à 10 fois sont courants et affectent directement l’économie unitaire. Les responsables d’ingénierie devraient commencer à développer des compétences internes en inférence et MLOps avant que ce marché du talent ne se resserre davantage.

Un pari à 13 milliards $ sur la couche entre l’entraînement et le produit

Le 22 juin 2026, Baseten a annoncé avoir bouclé une levée de série F de 1,5 milliard de dollars, l’une des plus importantes de l’année pour une entreprise qui ne construit pourtant aucun modèle fondateur. L’activité de Baseten, c’est l’inférence — l’étape de calcul qui survient après qu’un utilisateur soumet une requête et qu’un modèle doit produire une réponse, rapidement, à moindre coût et à grande échelle. Les investisseurs ont valorisé cette entreprise de San Francisco, âgée de cinq ans, jusqu’à 13 milliards de dollars, un chiffre qui aurait semblé invraisemblable pour une entreprise de « plomberie IA » il y a à peine deux ans.

Le tour de table a été mené par Altimeter Capital, Conviction et Spark Capital, avec Sands Capital et Wellington Management en co-chefs de file, selon le compte rendu de citybiz sur l’opération. IVP, Greylock, 01A, Blackbird, Durable Capital Partners, Verified Capital, Battery Ventures et D.E. Shaw Ventures ont également participé, aux côtés des actionnaires existants. Ce n’est pas un syndicat de niche — c’est un échantillon représentatif des investisseurs late-stage les plus actifs du secteur IA, tous convergeant sur un seul pari d’infrastructure au cours du même trimestre.

La levée, en chiffres

L’ampleur de l’ascension de Baseten est la véritable histoire ici. Fondée en 2019, l’entreprise a levé une série D de 150 millions de dollars il y a environ 14 mois, puis une série E de 300 millions de dollars à une valorisation de 5 milliards de dollars en janvier 2026, et maintenant une série F de 1,5 milliard de dollars jusqu’à 13 milliards de dollars — soit une hausse de valorisation de 160 % en moins de six mois. Fait inhabituel, le tour a été tarifé en deux tranches : certains investisseurs sont entrés à la valorisation de 13 milliards de dollars, d’autres à 11 milliards de dollars, une structure que TechCrunch note est parfois utilisée pour permettre aux investisseurs chefs de file d’afficher un chiffre plus élevé pendant que les participants suivants obtiennent une remise modeste.

Les chiffres de croissance sous-jacents expliquent pourquoi les investisseurs étaient prêts à payer ce prix. Selon le tour d’horizon de Crunchbase News sur les plus grosses levées de la semaine, le chiffre d’affaires de Baseten a crû d’environ 20x en un an, et la plateforme traite désormais plus d’un milliard d’appels d’inférence par jour répartis sur 87 clusters de calcul dans 18 fournisseurs de cloud différents. Cette empreinte multi-cloud n’est pas accessoire — c’est le produit lui-même. L’argument de vente de Baseten auprès des entreprises est qu’elle acheminera une charge de travail IA donnée vers la combinaison de matériel, de région et de configuration de modèle qui produit le meilleur rapport latence-coût, plutôt que d’enfermer un client dans la pile technologique d’un seul fournisseur.

Le PDG et cofondateur Tuhin Srivastava a présenté la levée autour d’une thèse technique précise plutôt qu’un simple engouement générique pour l’IA : « L’avenir de l’IA reposera sur des millions de modèles spécialisés, et les entreprises qui construisent les meilleurs savent que le post-entraînement est devenu existentiel », a-t-il déclaré lors de l’annonce. L’entreprise indique qu’elle utilisera les fonds pour à peu près tripler ses effectifs dans les équipes d’ingénierie, de recherche, d’opérations et de vente.

Pourquoi l’inférence, et non l’entraînement, est désormais la couche disputée

Pendant la majeure partie du boom IA de 2023-2025, le capital-risque a poursuivi les entreprises qui entraînaient des modèles de pointe — OpenAI, Anthropic, xAI et une poignée d’autres ont absorbé l’écrasante majorité des capitaux consacrés à l’IA. Ce schéma s’est visiblement fissuré. À mesure que les modèles à poids ouverts de Meta, Mistral, DeepSeek et d’autres ont comblé l’écart de capacité avec les modèles fermés, la question économique a évolué de « qui a le meilleur modèle » à « qui peut servir n’importe quel modèle — ouvert ou fermé — à un coût suffisamment bas pour tourner en production à grande échelle ». L’inférence, et non l’entraînement, est devenue la couche où vivent réellement les marges et la défensibilité, car c’est la partie que chaque produit IA doit payer à chaque requête, indéfiniment.

Baseten n’était pas la seule entreprise d’inférence à lever un méga-tour la même semaine. Groq, une entreprise de puces et d’infrastructure cloud axée sur la vitesse d’inférence, a levé 650 millions de dollars à peine plus de six mois après que Nvidia a embauché le fondateur de Groq et son équipe clé et licencié sa technologie dans une transaction de type acquihire — preuve que même les entreprises qui perdent des talents au profit des hyperscalers continuent d’obtenir d’énormes chèques de suivi. Séparément, Upscale AI a levé une extension de série A de 190 millions de dollars pour l’infrastructure de réseau IA, portant son financement total à 500 millions de dollars pour une valorisation de 2 milliards de dollars. Trois entreprises liées à l’inférence, trois levées énormes, une seule semaine — ce que certains investisseurs appellent désormais une « ruée vers l’or » de l’inférence n’est pas une métaphore, c’est un calendrier de financement.

La logique stratégique est simple : à mesure que davantage d’entreprises déploient des fonctionnalités IA en production, le volume de requêtes d’inférence s’accumule en continu, tandis que les cycles d’entraînement restent des événements de capital ponctuels et discrets. Une entreprise qui possède la couche d’acheminement entre les modèles et les applications perçoit un péage sur chaque requête que le produit d’un client effectuera un jour — un modèle de revenus bien plus collant et évolutif que la vente d’accès à un seul modèle propriétaire.

Ce que fondateurs et DSI devraient en faire

1. Traiter le coût d’inférence par jeton comme une décision d’architecture à part entière, non un après-coup

L’argumentaire entier de Baseten repose sur le fait qu’acheminer la même requête vers différents modèles et clusters peut produire un écart de coût de 5 à 10 fois selon le fournisseur, la région et le choix du modèle. Les fondateurs qui construisent des fonctionnalités IA — un chatbot de support client, un pipeline de classification de documents, un moteur de recommandation — devraient comparer au moins deux fournisseurs d’inférence (un optimisé pour les modèles à poids ouverts, un autre proposant une API de modèle de pointe) avant de s’enfermer dans le SDK d’un seul fournisseur. L’erreur à éviter : conserver par défaut l’API utilisée lors d’un prototypage en hackathon sans jamais revoir la facture une fois le produit en usage réel.

2. Ne pas concurrencer horizontalement les acteurs d’infrastructure établis — viser la verticalisation

Avec Baseten valorisée à 13 milliards de dollars, Groq à 650 millions de dollars et Upscale AI à 2 milliards de dollars de valorisation pour des paris d’infrastructure, le marché horizontal du « routage d’inférence » est désormais dominé par des entreprises disposant de centaines de millions de dollars de capital engagé. Un fondateur qui construit aujourd’hui des outils d’inférence génériques affronte des entreprises capables de casser les prix pendant des années. Le mouvement défensible est une couche d’inférence spécifique à un secteur — par exemple, optimiser la latence et le coût pour les formes de modèles propres à un secteur (imagerie médicale, traitement du langage naturel en arabe, données de capteurs agricoles) — là où les acteurs établis n’ont aucune raison de se spécialiser.

3. Demander à chaque fournisseur IA sa redondance multi-cloud et multi-région avant de signer

L’empreinte de Baseten — 87 clusters, 18 clouds — existe parce que les clients entreprises l’exigent : une dépendance IA à une seule région ou un seul cloud est désormais considérée comme un risque de production, non une simple commodité. Les DSI qui évaluent tout fournisseur IA — pour le chat, la recherche ou le traitement de documents — devraient exiger une réponse écrite sur le comportement de basculement en cas de panne d’une région ou d’un fournisseur unique, et devraient traiter « nous ne tournons que sur un seul hyperscaler » comme un signal d’alerte pour toute charge de travail que l’entreprise considère comme critique.

4. Construire dès maintenant un vivier de compétences internes en inférence et en MLOps, avant que le besoin ne devienne urgent

Les postes que cette vague de financement crée — ingénieurs d’optimisation d’inférence, spécialistes MLOps maîtrisant l’ordonnancement GPU et le routage de modèles — sont rares et se négocient à des rémunérations élevées dans les marchés dotés d’écosystèmes IA matures. Les responsables d’ingénierie dans les marchés émergents devraient dès maintenant former des ingénieurs backend et DevOps aux frameworks de service d’inférence (vLLM, TensorRT, couches de routage de modèles), car l’écart entre « les entreprises qui ont besoin de cette compétence » et « les ingénieurs qui la possèdent » se creuse à chaque trimestre où ce rythme de financement se poursuit.

La leçon structurelle

La levée de Baseten n’est pas vraiment l’histoire d’une seule entreprise — c’est un signal indiquant où s’est déplacé le centre de gravité économique de l’industrie de l’IA. Lorsque des investisseurs sont prêts à payer une prime de valorisation de 160 % en six mois pour une entreprise qui sert les modèles des autres plutôt que de construire les siens, cela signifie que le marché a conclu que la qualité des modèles converge plus vite que l’infrastructure de déploiement ne peut évoluer pour y répondre. Les gagnants de cette prochaine phase de construction de l’IA ne seront peut-être pas les laboratoires ayant les meilleurs modèles, mais les entreprises capables de faire tourner n’importe quel modèle, n’importe où, au coût par requête le plus bas possible. Pour tout fondateur ou entreprise en dehors de la Silicon Valley, c’est une opportunité plus accessible que d’essayer de surpasser OpenAI à l’entraînement ne l’a jamais été — mais uniquement pour les équipes qui comprennent suffisamment bien l’économie de l’inférence pour construire sur cette couche plutôt que d’essayer de la reconstruire à partir de zéro.

Suivez AlgeriaTech sur LinkedIn pour des analyses tech professionnelles Suivre sur LinkedIn

Suivez @AlgeriaTechNews sur X pour des analyses tech quotidiennes Suivre sur X

Questions Fréquemment Posées

Qu’est-ce que l’inférence IA, et en quoi diffère-t-elle de l’entraînement IA ?

L’entraînement est le processus de construction d’un modèle en l’alimentant de données pendant des jours ou des semaines lors d’un cycle de calcul ponctuel et très capitalistique. L’inférence, c’est ce qui se produit chaque fois qu’un utilisateur utilise réellement ce modèle entraîné — envoyer une requête et obtenir une réponse — et cela se produit en continu, à grande échelle, pendant toute la durée de vie d’un produit. Baseten se spécialise dans l’inférence : faire tourner et acheminer des modèles déjà entraînés de manière efficace plutôt que d’en construire de nouveaux.

Pourquoi la valorisation de Baseten est-elle passée de 5 à 13 milliards de dollars en moins de six mois ?

Le chiffre d’affaires de Baseten a crû d’environ 20x en un an et la plateforme a atteint plus d’un milliard d’appels d’inférence traités par jour, selon Crunchbase News. Les investisseurs ont également intégré un changement de marché plus large : à mesure que les modèles à poids ouverts comblaient l’écart avec les modèles propriétaires, la demande pour une infrastructure capable de servir n’importe quel modèle à bas coût — plutôt que l’accès à un modèle spécifique — est devenue l’activité la plus défensible à financer.

Que signifie ce boom de financement de l’inférence pour les fondateurs IA en dehors de la Silicon Valley ?

Cela signifie que l’opportunité la plus intéressante pour la plupart des fondateurs n’est plus d’essayer de surpasser les plus grands laboratoires IA à l’entraînement, ce qui est désormais essentiellement hors de portée sans des centaines de millions de dollars de capital de calcul. Les fondateurs peuvent en revanche construire des applications spécifiques à un secteur sur l’infrastructure d’inférence que des entreprises comme Baseten fournissent désormais à une échelle quasi standardisée — mais ils doivent tout de même gérer activement les coûts d’inférence, car un écart de prix de 5 à 10 fois entre fournisseurs peut déterminer si une fonctionnalité IA est rentable.