# ============================================================ # robots.txt — electromall.ma # WordPress + WooCommerce # Compatible Google, Bing, AI crawlers # Dernière mise à jour : 2026-03-13 # ============================================================ # =================== # RÈGLES GÉNÉRALES # =================== User-agent: * Allow: / # WordPress — zones admin / fichiers sensibles Disallow: /wp-admin/ Allow: /wp-admin/admin-ajax.php Disallow: /wp-login.php Disallow: /wp-signup.php Disallow: /wp-register.php Disallow: /xmlrpc.php Disallow: /readme.html Disallow: /license.txt # WordPress — cache et contenu dupliqué Disallow: /wp-content/cache/ Disallow: /wp-json/wp/v2/users # WordPress — flux, embeds, trackbacks Disallow: /feed/ Disallow: /comments/feed/ Disallow: /trackback/ Disallow: */embed/ # WordPress — tags (pages faible valeur / bloat) Disallow: /tag/ # WordPress — prévisualisation Disallow: /*?preview=true* # =================== # WOOCOMMERCE # =================== # Pages privées / sans intérêt SEO Disallow: /panier/ Disallow: /cart/ Disallow: /checkout/ Disallow: /commande/ Disallow: /mon-compte/ Disallow: /my-account/ # Actions dynamiques WooCommerce Disallow: /*?add-to-cart=* Disallow: /*?removed_item=* Disallow: /*?undo_item=* # Paramètres de tri et filtres (contenu dupliqué) Disallow: /*?orderby=* Disallow: /*?order=* Disallow: /*?filter_* # =================== # RECHERCHE INTERNE # =================== Disallow: /?s= Disallow: /search/ # =================== # PARAMÈTRES DE TRACKING # =================== # Note : srsltid est un paramètre Google Merchant injecté # automatiquement. Il est safe à bloquer. Disallow: /*?srsltid=* Disallow: /*?taxonomy=* # ============================================================ # BOTS IA — RECHERCHE / VISIBILITÉ (autorisés) # Ces bots permettent à electromall.ma d'apparaître dans # les résultats des moteurs de recherche IA (ChatGPT Search, # Perplexity, Claude Search, etc.) # ============================================================ User-agent: ChatGPT-User Allow: / User-agent: OAI-SearchBot Allow: / User-agent: Claude-User Allow: / User-agent: Claude-SearchBot Allow: / User-agent: PerplexityBot Allow: / # ============================================================ # BOTS IA — TRAINING / SCRAPING (bloqués) # Ces bots collectent du contenu pour entraîner des modèles. # Bloquer = protéger votre contenu sans perdre en visibilité. # ============================================================ # OpenAI — training User-agent: GPTBot Disallow: / # Anthropic — training User-agent: ClaudeBot Disallow: / User-agent: anthropic-ai Disallow: / # ============================================================ # GOOGLE — TOUS SERVICES AUTORISÉS # Indexation, recherche classique, AI Overviews (SGE), Gemini, # Ads, Analytics. Essentiel pour la visibilité des visiteurs. # ============================================================ User-agent: Googlebot Allow: / User-agent: Googlebot-Image Allow: / User-agent: Googlebot-News Allow: / User-agent: Googlebot-Video Allow: / User-agent: Google-InspectionTool Allow: / # Google AI — Gemini, AI Overviews, recherche générative User-agent: Google-Extended Allow: / User-agent: Google-CloudVertexBot Allow: / # Apple — training Apple Intelligence User-agent: Applebot-Extended Disallow: / # Meta / Facebook — tous services autorisés (aperçus liens, etc.) User-agent: FacebookBot Allow: / User-agent: Meta-ExternalAgent Allow: / User-agent: Meta-ExternalFetcher Allow: / User-agent: InstagramBot Allow: / # Common Crawl — dataset ouvert utilisé pour le training IA User-agent: CCBot Disallow: / # ByteDance — training User-agent: Bytespider Disallow: / # Cohere — training User-agent: Cohere-ai Disallow: / User-agent: cohere-training-data-crawler Disallow: / # Autres scrapers IA User-agent: Diffbot Disallow: / User-agent: Omgili Disallow: / User-agent: Omgilibot Disallow: / User-agent: img2dataset Disallow: / User-agent: Timpibot Disallow: / User-agent: Webzio-Extended Disallow: / User-agent: YouBot Disallow: / User-agent: ImagesiftBot Disallow: / User-agent: PanguBot Disallow: / User-agent: AI2Bot Disallow: / User-agent: DuckAssistBot Disallow: / # ============================================================ # CRAWLERS SEO / SCRAPING AGRESSIF (bloqués) # Économise bande passante et CPU sur le serveur dédié. # ============================================================ User-agent: SemrushBot Disallow: / User-agent: AhrefsBot Disallow: / User-agent: DotBot Disallow: / User-agent: MJ12bot Disallow: / User-agent: PetalBot Disallow: / User-agent: Sogou Disallow: / User-agent: BLEXBot Disallow: / User-agent: DataForSeoBot Disallow: / User-agent: Rogerbot Disallow: / # ============================================================ # MOTEURS DE RECHERCHE SECONDAIRES (bloqués — optionnel) # Décommentez si vous ne ciblez pas ces marchés. # ============================================================ # Yandex — moteur russe (pas de marché CIS pour electromall.ma) User-agent: YandexBot Disallow: / # =================== # SITEMAP # =================== Sitemap: https://electromall.ma/sitemap_index.xml