# robots.txt optimizado para MiMorelia.com # Objetivo: Indexación máxima + citas en IA, pero bloqueo de scrapers basura. User-agent: * Allow: / # Bloqueamos solo carpetas de sistema o scripts si existen: # Disallow: /admin/ # Disallow: /api/ Sitemap: https://mimorelia.com/sitemap.xml Sitemap: https://mimorelia.com/news_sitemap.xml # ======================================================== # 1) IA QUE QUEREMOS (Citas, resúmenes y búsqueda) # ======================================================== # Estos bots alimentan ChatGPT Search y Perplexity. # Si los bloqueas, dejas de aparecer como fuente en sus respuestas. User-agent: GPTBot Allow: / User-agent: ChatGPT-User Allow: / User-agent: PerplexityBot Allow: / User-agent: OAI-SearchBot Allow: / # ======================================================== # 2) IA QUE NO QUEREMOS (Entrenamiento puro sin tráfico) # ======================================================== # Google-Extended es el bot que usa Google para entrenar Gemini # SIN afectar tu SEO en el buscador normal. User-agent: Google-Extended Disallow: / User-agent: CCBot Disallow: / User-agent: Claude-Web Disallow: / # ======================================================== # 3) SEO Y REDES SOCIALES (Permitir todo) # ======================================================== User-agent: Googlebot User-agent: Bingbot User-agent: Twitterbot User-agent: facebookexternalhit User-agent: WhatsApp User-agent: TelegramBot Allow: / Allow: /images/ # ======================================================== # 4) BOTS BASURA / SCRAPERS AGRESIVOS (Bloqueo total) # ======================================================== # Estos bots suelen ser herramientas SEO de competencia o scrapers # que solo consumen recursos de tu servidor sin darte nada a cambio. User-agent: SemrushBot User-agent: AhrefsBot User-agent: DotBot User-agent: MJ12bot User-agent: BLEXBot User-agent: PetalBot User-agent: grapeshot Disallow: /