Acceso de rastreadores de IA

Shopify robots.txt para rastreadores de IA

Una guía práctica sobre Shopify robots.txt, acceso de rastreadores de IA, rutas privadas, riesgo de Googlebot y monitoreo para visibilidad de compras agentes.

ShopGox Editorial23/5/2026es
Shopify robots.txt para rastreadores de IA: qué permitir, bloquear y monitorear

Los sistemas de compras de IA no pueden recomendar lo que no pueden rastrear, leer o confiar. Para las tiendas Shopify, robots.txt es una de las primeras puertas entre su catálogo de productos y los motores de búsqueda, asistentes de inteligencia artificial, agentes de compras y rastreadores comerciales.

El objetivo no es permitirlo todo. El objetivo es mantener accesibles las rutas importantes de productos, colecciones, imágenes y datos estructurados, al mismo tiempo que se protegen las rutas de carrito, pago, cuenta, búsqueda, filtro y utilidades internas que no ayudan al descubrimiento.

Robots.txt controla el rastreo, no la calidad del contenido

Robots.txt indica a los rastreadores compatibles qué rutas no deben solicitar. No agrega esquema de producto, corrige variantes duplicadas, mejora descripciones breves ni garantiza la indexación. Trátelo como un control de acceso para los rastreadores, no como un sustituto del SEO técnico.

Lo que Shopify suele manejar bien por defecto

Mantenga estos valores predeterminados a menos que tenga una razón clara

  • check_circleLas páginas de productos y colecciones deben seguir siendo rastreables.
  • check_circleLos recursos estáticos necesarios para representar el contenido del producto deben seguir siendo rastreables.
  • check_circleLas rutas de carrito, pago, cuenta y búsqueda interna generalmente no necesitan acceso del rastreador.
  • check_circleLas rutas de los mapas del sitio deben permanecer visibles.
  • check_circleEl robot de Google no debe bloquearse a menos que desees eliminar intencionalmente el acceso a la Búsqueda de Google.

Una política sensata de rastreo de IA para Shopify

Visual summary diagram for Shopify robots.txt for AI Crawlers: What to Allow, Block, and Monitor.

Para un sitio de comercio electrónico en etapa de crecimiento, una política equilibrada suele ser mejor que un bloqueo general. Permita rastreadores que puedan crear valor de descubrimiento, proteger rutas privadas y de bajo valor y monitorear registros o análisis de CDN para detectar tráfico anormal.

Una política sensata de rastreo de IA para Shopify

Tipo de rutaPolítica recomendadaPor qué es importante
Páginas de productosPermitirContienen los datos comerciales que necesitan los sistemas de compras con IA.
Páginas de colecciónPermitirAyudan a los rastreadores a comprender categorías, agrupaciones de inventario y enlaces internos.
Imágenes del productoPermitirLas imágenes respaldan la búsqueda visual, vistas previas y una comprensión más completa del producto.
Carrito y pagoNo permitirNo ayudan al descubrimiento y pueden generar desperdicio de rastreo.
Páginas de cuentas de clientesNo permitirSon privados o de poco valor para el descubrimiento público.
Búsqueda interna y URL filtradasNormalmente no permitirPueden crear rutas de rastreo duplicadas o infinitas.
Mapa del sitioPermitirAyuda a los rastreadores a encontrar URL canónicas de manera eficiente.

Ejemplo de reglas de Shopify robots.txt para rastreadores de IA

Las tiendas Shopify pueden personalizar las reglas de los robots a través de la plantilla robots.txt.liquid del tema. Mantenga las reglas personalizadas pequeñas, documentadas y fáciles de revertir. No copie ciegamente una lista de bloqueo de rastreadores de otra tienda.

User-agent: *
Disallow: /cart
Disallow: /checkout
Disallow: /account
Disallow: /search
Disallow: /*?*sort_by=
Disallow: /*?*filter.

User-agent: Googlebot
Allow: /

User-agent: GPTBot
Disallow: /cart
Disallow: /checkout
Disallow: /account

User-agent: Google-Extended
Disallow: /

Google-Extended no es lo mismo que Googlebot

Google-Extended es un control independiente para ciertos casos de uso de productos y capacitación sobre IA de Google. Bloquear Google Extendido es diferente a bloquear Googlebot. Si su prioridad es la visibilidad de la Búsqueda, nunca los trate como intercambiables.

Qué monitorear después de cambiar el archivo robots.txt

Comprobaciones posteriores al cambio

  1. 1Abra /robots.txt y confirme que el archivo final renderizado es el que esperaba.
  2. 2Verifique que las URL de productos y colecciones no estén bloqueadas para Googlebot.
  3. 3Compruebe que las URL del mapa del sitio aún estén accesibles.
  4. 4Ejecute una verificación de acceso del rastreador en páginas de productos representativos.
  5. 5Observe los análisis del servidor, CDN o Shopify para detectar picos de rastreo.
  6. 6Mantenga una nota fechada de cada cambio en el archivo robots.txt para poder retroceder rápidamente.

Errores comunes del archivo robots.txt de Shopify

Errores comunes del archivo robots.txt de Shopify

  • errorBloquear todos los parámetros de consulta cuando las URL variantes importantes dependen de los parámetros.
  • errorBloqueo de carpetas de imágenes necesarias para vistas previas de productos.
  • errorBloquear el robot de Google al intentar bloquear solo los rastreadores de entrenamiento de IA.
  • errorSuponiendo que el archivo robots.txt pueda corregir contenido duplicado por sí solo.
  • errorOlvidar que algunos rastreadores pueden ignorar el archivo robots.txt o utilizar cadenas de agente de usuario cambiantes.

FAQ

¿Las tiendas Shopify deberían bloquear los rastreadores de IA?keyboard_arrow_down

No de forma predeterminada. Si la visibilidad de las compras mediante IA es importante, permita el acceso de los rastreadores a páginas públicas de productos y colecciones y, al mismo tiempo, bloquee rutas privadas o de bajo valor, como carrito, pago, cuenta, búsqueda y filtros duplicados.

¿Puede el archivo robots.txt eliminar páginas de productos de Shopify de Google?keyboard_arrow_down

Robots.txt controla el rastreo. Si Google ya conoce una URL, bloquear el rastreo no es lo mismo que una estrategia limpia de noindex. Para la Búsqueda de Google, tenga especial cuidado de no bloquear el robot de Google en páginas de productos importantes.

¿Shopify permite la personalización del archivo robots.txt?keyboard_arrow_down

Sí, Shopify admite la personalización de robots.txt a través de la plantilla robots.txt.liquid del tema. Mantenga los cambios conservadores y pruebe el archivo /robots.txt renderizado después de publicarlo.

¿Qué URL de Shopify deberían seguir siendo rastreables para compras con IA?keyboard_arrow_down

Las páginas de productos, las páginas de colecciones, las imágenes de productos, las URL canónicas y las URL de mapas de sitio normalmente deberían permanecer rastreables porque contienen datos del producto, contexto de categoría y enlaces de descubrimiento.

Herramientas relacionadas

Artículos relacionados