
Tape le nom de ton entreprise dans ChatGPT. Demande-lui ce que tu fais, qui sont tes clients, ce que tu vends. Le résultat te ressemble ? Ou il invente, mélange tes services avec ceux d'un concurrent, oublie tes dernières offres ? Si oui, tu n'es pas seul. La plupart des sites d'entreprise sont aujourd'hui invisibles ou mal résumés par les IA, et la majorité des dirigeants ne le savent même pas.
Je suis Johan Iavarone, Product Builder indépendant. Je travaille principalement sur Webflow et sur l'écosystème no-code. Cet article explique comment les IA voient (ou ne voient pas) ton site en 2026, et la méthode publique pour maximiser tes chances d'être cité, en m'appuyant sur des sources vérifiables.
Pourquoi les IA ne voient qu'une partie du web
Les IA génératives ne lisent pas Internet en entier. Une étude récente de l'Inria, relayée par Le Monde en juin 2026 (entretien avec Fabien Gandon, Inria et W3C), pose un ordre de grandeur clair : les IA ne voient en moyenne qu'environ 10 % du web total. Le reste leur échappe : pages sans liens entrants, contenu caché derrière des formulaires, sites mal structurés, plateformes fermées comme Facebook ou Instagram, deep web, et 6 657 langues sur 7 000 qui ne sont pas correctement indexées en ligne.
Conséquence directe : quand un prospect demande à ChatGPT « quels sont les meilleurs cabinets d'expertise comptable à Lyon » ou « quel outil pour automatiser ma facturation », l'IA ne te cite pas si tu n'es pas dans ces 10 % visibles. Et même avec un site bien référencé sur Google, tu peux être absent des réponses IA si certaines règles techniques ne sont pas respectées.
Pourquoi c'est urgent ? D'après un sondage Ifop de 2025 cité par plusieurs médias français, environ quatre Français sur dix utilisent régulièrement ChatGPT et ses concurrents. Quand tes prospects posent leurs questions métier à une IA plutôt qu'à Google, et que tu n'es pas dans la réponse, tu perds le contact avant même de l'avoir eu. Le trafic IA reste encore une faible part du trafic web mondial (autour de 1 % selon Similarweb), mais sa croissance est rapide.
Les trois types de robots IA, et la décision à prendre pour chacun
Pour comprendre comment exister dans ChatGPT ou Claude, il faut d'abord comprendre qui visite ton site. Tous les sites web sont parcourus en permanence par des robots, des programmes automatiques qui passent de page en page. En 2026, ces robots se répartissent en trois familles. C'est là que se joue ta visibilité.
Famille 1 : les robots d'entraînement. Ils aspirent ton contenu pour nourrir la prochaine version de l'IA. Les plus connus s'appellent GPTBot (OpenAI), ClaudeBot (Anthropic), Google-Extended, ou Bytespider (ByteDance). D'après les données 2026 publiées par Cloudflare et par ALM Corp (TechnologyChecker), 69 % des sites bloquent ClaudeBot et 62 % bloquent GPTBot. C'est défendable pour un journal qui veut protéger ses articles, mais pour une PME ou un cabinet, c'est souvent une décision par défaut sans contrepartie bénéfique.
Famille 2 : les robots de réponse en direct. Ce sont eux qui font la différence et que peu de gens connaissent. Quand un utilisateur pose une question à ChatGPT en mode recherche, l'IA envoie un robot lire ton site à cet instant précis pour fabriquer sa réponse. Ce robot s'appelle OAI-SearchBot pour ChatGPT, Claude-User pour Claude, PerplexityBot pour Perplexity. Seulement environ la moitié des sites les bloquent, souvent par confusion avec les robots d'entraînement.
Famille 3 : les robots Google et Bing. Ce sont les classiques. Tu les laisses passer parce qu'ils alimentent l'index sur lequel les IA s'appuient pour trouver les pages à lire en direct. Les bloquer, c'est se rendre invisible à tout, y compris aux IA.
La stratégie qui se dégage de 2026 est de laisser passer les robots de réponse en direct (Famille 2) et de choisir consciemment pour les robots d'entraînement (Famille 1). Cette discipline simple est l'opposé de ce que la plupart des sites font par défaut.
Le piège du fichier llms.txt
Tu as peut-être entendu parler d'un fichier appelé llms.txt. C'est un petit fichier texte qu'on place à la racine du site pour expliquer aux IA comment lire le contenu. La proposition a fait du bruit fin 2024, et une partie du web l'a adoptée (Anthropic, Stripe, Cloudflare le publient).
Le problème : la plupart des IA n'utilisent quasiment pas ce fichier. ChatGPT, Claude, Perplexity, plusieurs analyses indépendantes publiées au printemps 2026 (notamment par John Mueller côté Google et par les équipes Search Engine Journal et Cloudflare) ont confirmé que les principaux crawlers fetchent rarement llms.txt. Mettre ce fichier en place ne te rend pas plus visible dans ChatGPT à court terme.
Pourquoi je le précise ? Parce que plusieurs prestataires SEO continuent de vendre llms.txt comme la solution miracle. Ce n'est pas le cas en 2026. Ce qui marche est plus ennuyeux : du contenu bien structuré, des chiffres datés, des sources fiables, un site propre et régulièrement mis à jour. Le SEO classique, recalibré pour les IA.
La méthode en 5 mouvements
Voici les cinq actions à prendre dans l'ordre. Elles sortent toutes de la documentation publique (spécifications de robots.txt, Schema.org, guidelines E-E-A-T de Google) et de bonnes pratiques SEO consensuelles en 2026.
1. Régler le fichier de règles d'accès. Le robots.txt est le fichier qui dit aux robots ce qu'ils peuvent lire. Le réglage recommandé en 2026 pour une PME ou un cabinet qui veut être cité par les IA : laisser passer Googlebot, Bingbot, OAI-SearchBot, ChatGPT-User, Claude-User et PerplexityBot. Choisir au cas par cas pour GPTBot, ClaudeBot et Google-Extended (bloquer si tu veux protéger ton contenu de l'entraînement, autoriser si tu veux maximiser ta présence future). Sur Webflow, ce fichier se modifie en quelques clics dans les paramètres du site.
2. Ajouter des balises de structure (Schema.org). Ce sont des informations cachées dans le code HTML qui aident les IA à comprendre de quoi parle la page : qui est l'auteur, quand l'article a été écrit, quel type de contenu (Article, BlogPosting, Service, Product, FAQPage, HowTo). Sans ces balises, ta page reste un mur de texte. Avec, elle devient plus facilement citable. La doc de référence est schema.org.
3. Écrire des contenus avec des chiffres datés et des sources externes. Les IA citent ce qu'elles peuvent vérifier. Un article avec cinq chiffres vérifiables, sources hyperliées et dates précises a mécaniquement plus de chances d'être repris dans une réponse qu'un article d'opinion sans chiffres. C'est le pilier Authoritativeness du framework E-E-A-T posé par Google.
4. Donner un vrai auteur à chaque page. Une page sans nom d'auteur, sans biographie, sans date de mise à jour est de plus en plus déclassée dans les réponses IA. Le pilier Experience et Expertise du E-E-A-T. Sur Webflow, tu peux créer une fiche auteur avec photo, biographie courte, lien LinkedIn et Schema.org Person. C'est ce qui te différencie d'un article générique.
5. Mesurer le trafic IA. Dans Google Analytics 4, crée des segments personnalisés pour voir combien de visiteurs viennent de chat.openai.com, claude.ai, perplexity.ai et gemini.google.com. ChatGPT génère aujourd'hui l'essentiel du trafic IA vers les sites (autour de 75-80 % d'après les données Similarweb 2026), mais sa part diminue avec la montée de Gemini et Perplexity. Sans cette mesure, tu travailles à l'aveugle.
Comment tester si la méthode marche pour toi
Trois tests simples à faire avant et après la mise en place de la méthode :
Test 1. Tape dans ChatGPT trois questions que poseraient tes clients idéaux. « Quel cabinet de [ton métier] choisir à [ta ville] », « Comment résoudre [le problème que tu résous] », « Quels sont les meilleurs outils pour [ton domaine] ». Note si ton nom apparaît, et dans quel contexte.
Test 2. Demande à ChatGPT et à Perplexity de te résumer ton entreprise à partir de l'URL. Compare ce qu'ils disent avec ta réalité. Les écarts te disent où ton site est mal lu ou pas lu du tout.
Test 3. Surveille dans tes logs serveur (accessibles via Cloudflare gratuitement) quels robots IA aspirent ton site et à quelle fréquence. Si tu ne vois ni OAI-SearchBot ni Claude-User ni PerplexityBot dans tes logs, c'est qu'ils sont probablement bloqués par ton robots.txt.
Pourquoi c'est un actif et pas une dépense
Un site optimisé pour les réponses IA est un actif qui se cumule. Chaque page bien structurée nourrit trois canaux à la fois : Google classique, les réponses ChatGPT et Claude en direct, et la prochaine version des modèles d'IA quand ils réindexeront le web. Trois flux qui se nourrissent les uns les autres.
Une PME qui apparaît régulièrement dans les réponses ChatGPT sur sa spécialité gagne une visibilité que les enchères Google Ads ne ramènent plus aussi facilement. Ce capital se construit lentement, mais il se compose dans le temps.
Si tu veux échanger sur la visibilité IA de ton site ou sur la mise en place de la méthode, tu peux m'écrire via la page contact. Premier échange sans engagement pour comprendre ton cas et te dire honnêtement ce qui me semble prioritaire à corriger.
FAQ : visibilité dans ChatGPT, méthode et passage à l'action
Comment savoir si mon site est visible dans ChatGPT ?
La façon la plus simple : pose à ChatGPT trois questions que poseraient tes clients idéaux. Si ton nom n'apparaît jamais, tu as un problème. La méthode plus rigoureuse : surveille dans Google Analytics les visites venant de chat.openai.com, claude.ai et perplexity.ai. Si tu n'as rien, tu es probablement absent.
Je suis sur Webflow, est-ce que la méthode marche pour moi ?
Oui. Webflow permet de modifier le robots.txt, d'injecter du Schema.org sur les pages CMS, de créer des fiches auteurs et d'éditer les balises meta. Pas besoin de toucher au code pour mettre en place la méthode.
Faut-il bloquer GPTBot et ClaudeBot dans robots.txt ?
Pas systématiquement. Pour une PME ou un cabinet, bloquer ces robots d'entraînement est souvent contreproductif : tu disparais des futures réponses IA sans bénéfice clair. La stratégie raisonnable : laisser passer tous les robots de réponse en direct (OAI-SearchBot, ChatGPT-User, Claude-User, PerplexityBot), et choisir au cas par cas pour les robots d'entraînement selon ta sensibilité au contenu copié.
Le fichier llms.txt sert-il à quelque chose en 2026 ?
Pas pour le SEO ou la visibilité ChatGPT court terme. Les principales IA ne le lisent quasiment pas, comme l'ont confirmé plusieurs analyses publiées au printemps 2026. Ça coûte cinq minutes à mettre en place et ça signale une bonne hygiène technique, mais n'attends pas de résultats mesurables côté trafic.
Quels outils utiliser pour mesurer la visibilité IA ?
Google Analytics 4 (gratuit) pour le trafic venant de ChatGPT, Claude et Perplexity. Les logs serveur (gratuits via Cloudflare) pour voir quels robots aspirent ton site. Et une grille de questions test que tu poses régulièrement aux IA pour suivre l'évolution dans le temps.













.jpg)
