# robots.txt — Instaquim (instaquim.com) # Optimitzat per permetre crawlers d'IA generativa # IMPORTANT: Aquest fitxer ha de ser accessible a https://instaquim.com/robots.txt # ============================================ # CRAWLERS D'IA — PERMETRE ACCÉS # ============================================ # OpenAI (ChatGPT, GPT-4) User-agent: GPTBot Allow: / Allow: /llms.txt # OpenAI - ChatGPT plugins User-agent: ChatGPT-User Allow: / # Anthropic (Claude) User-agent: ClaudeBot Allow: / Allow: /llms.txt # Anthropic - Claude Web User-agent: Claude-Web Allow: / # Google (Gemini, Bard, SGE) User-agent: Google-Extended Allow: / # Perplexity AI User-agent: PerplexityBot Allow: / Allow: /llms.txt # Cohere User-agent: cohere-ai Allow: / # Meta AI User-agent: Meta-ExternalAgent Allow: / # Microsoft Copilot / Bing Chat User-agent: Bingbot Allow: / # Common Crawl (font de dades per moltes IA) User-agent: CCBot Allow: / # ============================================ # CERCADORS TRADICIONALS — PERMETRE # ============================================ User-agent: Googlebot Allow: / User-agent: Bingbot Allow: / User-agent: DuckDuckBot Allow: / User-agent: Yandex Allow: / # ============================================ # REGLES GENERALS # ============================================ User-agent: * Allow: / Disallow: /admin/ Disallow: /api/ Disallow: /cart/ Disallow: /checkout/ Disallow: /account/ Disallow: /wp-admin/ # ============================================ # SITEMAPS # ============================================ Sitemap: https://instaquim.com/sitemap.xml # ============================================ # FITXER LLMs.txt # ============================================ # Ubicació: https://instaquim.com/llms.txt # Descripció completa de l'empresa per a IA generativa