Pourquoi les LLM vont intégrer la publicité: le vrai problème économique de l’IA générative.

Pourquoi j'ai créé Generative Ads

Je suis e-commerçant depuis 17 ans. J'ai vécu de l'intérieur toutes les grandes mutations du marketing digital: l'essor de Google Shopping, la montée en puissance de Meta Ads, les mises à jour d'algorithme qui réécrivent les règles du jeu tous les deux ans.

Aujourd'hui, je vois arriver quelque chose de bien plus profond que toutes ces évolutions réunies.

Quand j'utilise ChatGPT, Perplexity ou Claude pour chercher par exemple "le meilleur outil de gestion des stocks e-commerce" ou "quelle plateforme choisir pour lancer ma boutique ?", je réalise une chose: ces moteurs sont en train de remplacer Google dans mes habitudes de recherche, et probablement dans celles de vos clients.

Si vos clients cherchent demain leurs produits sur un LLM plutôt que sur Google, et c'est déjà en train de se passer, là où vous étiez visibles, vous devenez invisibles... à moins de comprendre les nouvelles règles de ce jeu.

C'est exactement la raison d'être de Generative Ads: aider les E-commerçants à anticiper et à maîtriser la publicité dans l'ère des moteurs génératifs, avant que vos concurrents ne le fassent à votre place.

Mais avant d'expliquer comment vous y prendre, il faut comprendre pourquoi ce basculement est inévitable, et pour cela, il faut regarder les chiffres.

Le paradoxe financier des LLM: plus ils grandissent, plus ils perdent de l'argent.

Voici une réalité que peu de gens mesurent vraiment: les grands acteurs de l'IA générative perdent des sommes colossales et la pression pour trouver de nouveaux revenus, notamment publicitaires, ne fait que s'intensifier.

OpenAI / ChatGPT : un gouffre financier sans précédent

ChatGPT est l'outil le plus utilisé au monde dans sa catégorie. Sam Altman a annoncé en octobre 2025 que le service avait franchi la barre des 800 millions d'utilisateurs hebdomadaires actifs, et OpenAI a confirmé en février 2026 avoir dépassé les 900 millions d'utilisateurs hebdomadaires. Pourtant, sa situation financière reste alarmante.

En 2024, OpenAI a généré environ 3,7 milliards de dollars de revenus (dont 2,7 milliards issus de ChatGPT), pour une perte nette estimée à 5 milliards de dollars, selon les documents internes consultés par le New York Times et confirmés par CNBC. Pour chaque dollar gagné, OpenAI en dépensait près de 2,25.

En 2025, la situation s'est aggravée. La CFO Sarah Friar a annoncé dans un billet officiel du 18 janvier 2026 que l'ARR (revenus annualisés récurrents) avait dépassé 20 milliards de dollars, contre 6 milliards en 2024. Mais les pertes ont explosé dans les mêmes proportions. Les comptes trimestriels de Microsoft, principal actionnaire, ont révélé que la perte imputable à OpenAI sur le seul trimestre clos le 30 septembre 2025 atteignait environ 12 milliards de dollars, l'une des plus grosses pertes trimestrielles de l'histoire de la tech.

D'où viennent ces pertes financières ? Trois facteurs principaux :

Les engagements d'infrastructure: Sam Altman a confirmé en novembre 2025 un plan de dépenses de 1 400 milliards de dollars sur plusieurs années en puissance de calcul, répartis entre Oracle (300 Mds$), Microsoft (250 Mds$), Nvidia (100 Mds$), Amazon AWS (38 Mds$) et AMD (90 Mds$).
Les coûts d'inférence: Chaque requête faite à ChatGPT a un coût direct (GPU, énergie) et des documents internes Microsoft obtenus par The Register indiquent qu'OpenAI a dépensé 8,7 milliards de dollars en inférence sur Azure pour les trois premiers trimestres 2025, plus du double du montant dépensé en 2024.
La course à l'innovation: GPT-5, Sora, Codex, infrastructures propriétaires: pour rester leader, OpenAI doit engager des montants R&D massifs.

Le résultat ? OpenAI ne prévoit pas d'atteindre la rentabilité avant 2029 et selon une analyse publiée par HSBC en février 2026, la société aurait besoin de 207 milliards de dollars supplémentaires d'ici 2030 pour honorer ses engagements d'infrastructure, même dans un scénario de croissance optimiste.

Le paradoxe

Plus les gens utilisent ChatGPT, plus OpenAI perd de l'argent. Seuls 5 à 6 % des utilisateurs hebdomadaires paient un abonnement, selon des sources internes rapportées par le Financial Times et Bloomberg. Le taux de conversion freemium plafonne structurellement.

Anthropic / Claude: une trajectoire plus saine, mais la même pression

Anthropic, le créateur de Claude, affiche une situation nettement plus favorable. Dans son communiqué officiel du 12 février 2026, la société a annoncé un run-rate (Le run rate indique quelle est la tendance annualisée du ou des derniers chiffres d'affaires mensuels) de 14 milliards de dollars, en croissance de plus de 10 fois par an sur les trois dernières années. Sacra et Bloomberg ont depuis rapporté un ARR estimé à 30 milliards de dollars en mars 2026, contre 9 milliards fin 2025.

Son positionnement est différent de celui d'OpenAI: Claude vise principalement les entreprises et selon Anthropic, huit des dix entreprises du Fortune 10 sont désormais clientes, et plus de 500 clients dépensent plus d'un million de dollars par an sur Claude.

Sur la question de la publicité, Anthropic a pris une position publique forte en février 2026. Dans un billet officiel publié en amont du Super Bowl LX, l'entreprise s'est engagée à ce que Claude reste sans publicité. La société a investi plusieurs millions de dollars dans quatre spots diffusés lors du Super Bowl LX (8 février 2026) avec le tagline "Ads are coming to AI. But not to Claude." Anthropic indique que plus de 80 % de ses revenus proviennent de contrats enterprise et d'abonnements, sans dépendance à la publicité.

Mais même avec ce modèle solide, Anthropic fait face à une pression financière intense. La société a clôturé en février 2026 une série de 30 milliards de dollars à une valorisation post-money de 380 milliards de dollars, montant principalement destiné à financer l'infrastructure de calcul.

Perplexity: le laboratoire du futur de la pub IA

Perplexity est l'acteur le plus instructif à observer pour comprendre ce qui attend les e-commerçants.

En novembre 2024, Perplexity est devenue la première startup IA à tester des formats publicitaires dans ses réponses. Le format retenu sont des "sponsored follow-up questions" et des espaces média adjacents aux réponses, facturés en CPM à plus de 50 dollars pour 1 000 impressions, selon le Financial Times et CNBC. Les premiers annonceurs partenaires incluaient Indeed, Whole Foods Market, Universal McCann et PMG.

Les résultats ont été mitigés. En octobre 2025, Perplexity a mis en pause l'accueil de nouveaux annonceurs et s'est recentrée sur les abonnements et le B2B. Pourtant, la startup affichait près de 200 millions de dollars d'ARR en septembre 2025, contre 35 millions mi-2024, avec une valorisation portée à 20 milliards de dollars après une levée de 200 M$ menée en septembre 2025.

La leçon de Perplexity est claire: la publicité dans les LLM n'est pas encore au point techniquement et commercialement mais elle reste inévitable. Ce n'est qu'une question de format et de timing.

Google Gemini et Microsoft Copilot: les géants qui ont déjà le modèle

Google et Microsoft ont un avantage décisif sur les pure players IA car ils possèdent déjà des modèles publicitaires rodés et des milliards d'utilisateurs captifs.

Google a intégré la publicité dans ses AI Overviews, ces résumés générés par IA qui apparaissent en haut des résultats de recherche. En juillet 2025, Sundar Pichai a annoncé lors du call trimestriel qu'AI Overviews atteignait plus de 2 milliards d'utilisateurs mensuels dans plus de 200 pays et 40 langues. Selon les données publiées début 2026, les publicités apparaissent désormais dans 25,5 % des résultats AI Overviews, contre environ 3 % en janvier 2025, soit une hausse de 394 % en un an. Pour Google, la publicité dans l'IA n'est pas un pivot stratégique, c'est la continuité naturelle d'un modèle économique historique.

Pour ces deux géants, la question n'est pas "si" mais "comment" maximiser les revenus publicitaires dans leurs interfaces IA.

Pourquoi la publicité est structurellement adaptée aux LLM

Au-delà de la pression financière, il existe une raison plus profonde, presque mathématique, pour laquelle la publicité finit toujours par s'imposer dans les LLM. Cette raison tient à la façon dont les LLM fabriquent leurs réponses. À chaque question posée, ChatGPT (ou Claude, ou Gemini) doit générer une réponse mot par mot, en mobilisant des serveurs puissants et contrairement à une recherche Google, qui consulte un index déjà construit, un LLM calcule sa réponse à la volée, à chaque fois et chaque calcul coûte de l'argent réel en électricité et en puissance de calcul.

Le coût marginal par requête: un modèle radicalement différent de Google

Chez Google, répondre à une requête supplémentaire coûte quasiment zéro. L'essentiel de la dépense est concentré dans l'indexation du web et la maintenance de l'infrastructure, des coûts fixes qui s'amortissent sur un volume colossal. Selon SemiAnalysis, le coût marginal d'une requête Google est d'environ 1,06 cent par requête pour un revenu moyen de 1,61 cent, soit un modèle économiquement viable dès le premier utilisateur.

Les LLM fonctionnent à l'inverse. Chaque requête mobilise physiquement des GPU pour générer une réponse, token après token. Aucune mutualisation n'est possible entre utilisateurs et deux questions identiques produiront deux réponses distinctes, chacune facturée en ressources de calcul. Les analyses publiques estiment le coût d'une requête ChatGPT entre 0,01 et 0,03 dollar en coût de calcul brut, selon la complexité du modèle et la longueur de la réponse, soit un ordre de grandeur au-dessus d'une recherche Google. Les modèles de raisonnement (comme o1 ou o3 d'OpenAI) poussent ce coût encore plus haut, en raison des longues chaînes de raisonnement qu'ils produisent avant de répondre.

Une étude publiée par Epoch AI en 2025 mesure ce différentiel sur le plan énergétique : une requête GPT-4o consomme en moyenne 0,42 Wh, contre 0,30 Wh pour une recherche Google, soit environ 40 % de consommation supplémentaire. Traduit en infrastructure, cela représente plusieurs milliards de dollars de dépenses d'inférence chaque année pour un acteur comme OpenAI.

Le besoin d'un modèle scalable

Le modèle par abonnement a un plafond structurel. Le Financial Times et Bloomberg ont rapporté que seulement 5 à 6 % des utilisateurs hebdomadaires de ChatGPT paient un abonnement. Même en multipliant par deux ou trois ce taux de conversion (ce qu'aucun acteur du secteur n'a jamais réussi), les revenus récurrents ne suffiraient pas à couvrir les engagements d'infrastructure de 1 400 milliards de dollars pris par OpenAI.

Pire, le modèle premium présente un défaut structurel, reconnu publiquement par Sam Altman. Même au prix de 200 dollars par mois, l'abonnement ChatGPT Pro reste déficitaire, car certains utilisateurs intensifs consomment plus de ressources que le tarif ne couvre. C'est l'inverse exact de SaaS traditionnel, où le coût marginal d'un utilisateur supplémentaire tend vers zéro.

La publicité, elle, obéit à une logique inverse. Plus l'audience grandit, plus le revenu publicitaire augmente linéairement (voire exponentiellement, via la personnalisation et les enchères). C'est le modèle qui scale avec l'usage, précisément là où le modèle par abonnement bute.

Le coût d'indexation Google vs le coût d'inférence IA

La comparaison avec Google est éclairante. Quand Google indexe le web, il construit un actif réutilisable, le même index sert à répondre à des milliards de requêtes. Le coût est "one-shot", amorti sur un volume massif. Quand ChatGPT génère une réponse, il consomme des ressources à chaque fois, sans possibilité de mise en cache efficace sur des requêtes uniques. L'économie est celle d'un service à la demande, pas d'une infrastructure partagée.

Dimension	Google Search	LLM (ChatGPT, Claude, Gemini)
Coût principal	Indexation (fixe, amorti)	Inférence (variable, par requête)
Coût marginal par requête	≈ 1 cent	1 à 3 cents et plus
Effet d'échelle	Coût unitaire qui baisse avec le volume	Coût unitaire stable, scaling linéaire
Rentabilité de l'abonnement	Non applicable (modèle pub natif)	Limite basse : 5-6 % de conversion, plafond naturel

Bonne nouvelle pour les LLM : le coût d'inférence baisse rapidement. Selon Andreessen Horowitz, le prix d'inférence d'un modèle de qualité équivalente est divisé par 10 chaque année, et Epoch AI confirme des baisses de 9x à 900x par an selon les benchmarks. Mais cette baisse ne suffit pas à elle seule à refermer l'écart : les modèles les plus avancés restent structurellement plus coûteux par requête qu'une recherche classique, et les usages évoluent vers des modèles de raisonnement encore plus gourmands.

Conclusion : la publicité n'est pas un choix stratégique parmi d'autres, c'est une conséquence mathématique de la structure de coûts des LLM. Face à un coût marginal non nul par requête et à un plafond structurel sur l'abonnement, seul un modèle publicitaire peut absorber la demande grand public à une échelle de plusieurs centaines de millions d'utilisateurs gratuits.

Le tournant OpenAI : la publicité est déjà là

Pendant des années, Sam Altman a publiquement exprimé ses réserves sur l'introduction de publicité dans ChatGPT. Mais en janvier 2026, le virage a été acté.

Le 16 janvier 2026, OpenAI a annoncé dans un billet officiel son intention de tester la publicité dans ChatGPT aux États-Unis, pour les utilisateurs adultes connectés sur les formules Free et Go. Le test a démarré le 9 février 2026. Plus de 30 clients d'Omnicom Media ont été confirmés comme partenaires du pilote.

Les résultats sont déjà significatifs. Selon plusieurs sources concordantes, le pilote publicitaire d'OpenAI a dépassé 100 millions de dollars d'ARR en moins de 6 semaines. Une trajectoire qui confirme la projection d'Evercore ISI : l'analyste Mark Mahaney anticipe plusieurs milliards de dollars de revenus publicitaires dès 2026, et plus de 25 milliards par an d'ici 2030.

La conclusion inévitable : la publicité colonise les LLM

Regardons les chiffres en face.

Acteur	Revenus / ARR 2025	Position sur la pub
OpenAI / ChatGPT	20 Mds$ ARR	Publicité lancée en test (février 2026)
Anthropic / Claude	9 Mds$ ARR (fin 2025), 14 Mds$ (février 2026)	Anti-pub, engagement public
Perplexity	~200 M$ ARR	Testé en 2024, mis en pause en octobre 2025
Google / Gemini	Intégré à Alphabet	Pub dans 25,5 % des AI Overviews
Microsoft / Copilot	Intégré à Microsoft	Pub dans Bing Copilot

Le constat est sans appel: Les LLM indépendants brûlent des milliards sans atteindre la rentabilité. Les géants ont déjà intégré la publicité dans leurs surfaces IA. Et ceux qui s'y opposent aujourd'hui (Anthropic, et Perplexity à date) construisent des alternatives enterprise qui ne pourront pas absorber toute la pression financière du marché grand public.

La publicité n'est donc pas une option parmi d'autres. Il s'agit du seul levier de monétisation de masse aujourd’hui compatible avec un usage grand public à très grande échelle, exactement comme Google l'a compris en 2000 avec son moteur de recherche.

Ce que cela signifie concrètement pour vous, e-commerçant

Si la publicité est désormais une réalité dans les LLM, et si vos clients migrent progressivement vers ces interfaces pour leurs recherches d'achat, la question n'est plus de savoir si vous devez vous y préparer, mais quand et comment ?

Voici ce qui se dessine pour les e-commerçants dans les 12 à 24 prochains mois:

À retenir

De nouveaux formats publicitaires émergent déjà: Réponses sponsorisées, recommandations de produits intégrées, résultats shopping dans les LLM. Les règles du jeu seront différentes de Google Ads ou Meta Ads.
La visibilité organique dans les LLM (GEO) devient un enjeu clé. Avant même la publicité payante, être cité comme source dans les réponses des LLM est déjà une forme de visibilité que vous pouvez travailler dès aujourd'hui.
Les early adopters auront un avantage considérable comme ceux qui ont investi dans Google Ads en 2002 ou dans Facebook Ads en 2012, ceux qui comprendront et maîtriseront la publicité générative en premier prendront une longueur d'avance décisive.

Conclusion

Nous entrons dans une économie du coût par réponse, où chaque interaction utilisateur génère une dépense réelle. Et dans ce modèle, la publicité devient mécaniquement la variable d’équilibre.

Dans les LLM, la publicité ne s’affichera pas à côté de la réponse. Elle sera intégrée dans la réponse.

Le passage de Google aux LLM marque le passage du ‘coût par clic’ au ‘coût par réponse’ et la visibilité ne dépendra plus du classement SEO, mais de la probabilité d’être cité par une IA.

E-commerçants : la publicité change, votre visibilité aussi.