Dostęp crawlerów AI

Shopify plik robots.txt dla robotów AI

Praktyczny przewodnik po pliku robots.txt Shopify, dostępie robota AI, ścieżkach prywatnych, ryzyku Googlebota i monitorowaniu widoczności zakupów przez agenta.

ShopGox Editorial23.05.2026pl
Shopify plik robots.txt dla robotów AI: na co zezwalać, blokować i monitorować

Systemy zakupowe AI nie mogą polecać tego, czego nie mogą zaindeksować, przeczytać ani któremu nie można zaufać. W przypadku sklepów Shopify plik robots.txt to jedna z pierwszych bramek między katalogiem produktów a wyszukiwarkami, asystentami AI, agentami handlowymi i robotami komercyjnymi.

Celem nie jest pozwalanie na wszystko. Celem jest zapewnienie dostępności ważnych ścieżek produktów, kolekcji, obrazów i danych strukturalnych przy jednoczesnej ochronie koszyka, realizacji transakcji, konta, wyszukiwania, filtrowania i wewnętrznych ścieżek narzędzi, które nie ułatwiają odkrywania.

Plik Robots.txt kontroluje indeksowanie, a nie jakość treści

Plik Robots.txt informuje zgodne roboty indeksujące, jakich ścieżek nie powinny żądać. Nie dodaje schematu produktu, nie poprawia zduplikowanych wariantów, nie poprawia cienkich opisów ani nie gwarantuje indeksowania. Traktuj to jako kontrolę dostępu dla robotów indeksujących, a nie substytut technicznego SEO.

Z czym Shopify zwykle domyślnie radzi sobie dobrze

Zachowaj te ustawienia domyślne, chyba że masz wyraźny powód

  • check_circleStrony produktów i kolekcji powinny być możliwe do indeksowania.
  • check_circleZasoby statyczne potrzebne do renderowania treści produktu powinny być możliwe do zindeksowania.
  • check_circleKoszyk, realizacja transakcji, konto i wewnętrzne ścieżki wyszukiwania zazwyczaj nie wymagają dostępu robota.
  • check_circleŚcieżki mapy witryny powinny pozostać możliwe do odnalezienia.
  • check_circleGooglebota nie należy blokować, chyba że chcesz celowo zablokować dostęp do wyszukiwarki Google.

Rozsądna polityka robota AI dla Shopify

Visual summary diagram for Shopify robots.txt for AI Crawlers: What to Allow, Block, and Monitor.

W przypadku witryny e-commerce na etapie rozwoju zrównoważona polityka jest zwykle lepsza niż ogólna blokada. Zezwalaj robotom indeksującym na tworzenie wartości do odkrycia, ochronę ścieżek prywatnych i ścieżek o niskiej wartości oraz monitorowanie dzienników lub analiz CDN pod kątem nietypowego ruchu.

Rozsądna polityka robota AI dla Shopify

Typ ścieżkiZalecane zasadyDlaczego jest to ważne
Strony produktówZezwalajZawierają fakty handlowe potrzebne systemom zakupowym AI.
Strony kolekcjiZezwalajPomagają robotom zrozumieć kategorie, grupowania zasobów reklamowych i linki wewnętrzne.
Zdjęcia produktówZezwalajObrazy ułatwiają wyszukiwanie wizualne, podglądy i lepsze zrozumienie produktu.
Koszyk i płatnośćNie zezwalajNie ułatwiają odkrywania i mogą powodować straty podczas indeksowania.
Strony konta klientaNie zezwalajSą prywatne lub mają niewielką wartość do publicznego odkrycia.
Wyszukiwanie wewnętrzne i filtrowane adresy URLZwykle nie zezwalajMogą tworzyć zduplikowane lub nieskończone ścieżki indeksowania.
Mapa witrynyZezwalajPomaga robotom indeksującym skutecznie znajdować kanoniczne adresy URL.

Przykładowe reguły Shopify w pliku robots.txt dla robotów AI

Sklepy Shopify mogą dostosowywać reguły robotów za pomocą szablonu motywu robots.txt.liquid. Staraj się, aby niestandardowe reguły były małe, udokumentowane i łatwe do wycofania. Nie kopiuj na ślepo listy zablokowanych robotów z innego sklepu.

User-agent: *
Disallow: /cart
Disallow: /checkout
Disallow: /account
Disallow: /search
Disallow: /*?*sort_by=
Disallow: /*?*filter.

User-agent: Googlebot
Allow: /

User-agent: GPTBot
Disallow: /cart
Disallow: /checkout
Disallow: /account

User-agent: Google-Extended
Disallow: /

Google-Extended to nie to samo, co Googlebot

Google-Extended to oddzielna kontrola dla niektórych szkoleń Google AI i przypadków użycia produktów. Blokowanie Google-Extended różni się od blokowania Googlebota. Jeśli Twoim priorytetem jest widoczność w wyszukiwarce, nigdy nie traktuj ich jako wymiennych.

Co monitorować po zmianie pliku robots.txt

Kontrole po zmianie

  1. 1Otwórz plik /robots.txt i potwierdź, że końcowy wyrenderowany plik jest zgodny z oczekiwaniami.
  2. 2Sprawdź, czy adresy URL produktów i kolekcji nie są blokowane dla Googlebota.
  3. 3Sprawdź, czy adresy URL map witryn są nadal dostępne.
  4. 4Przeprowadź kontrolę dostępu robota do reprezentatywnych stron produktów.
  5. 5Śledź analizę serwera, CDN lub Shopify pod kątem skoków indeksowania.
  6. 6Zapisz każdą zmianę w pliku robots.txt z datą, aby móc szybko ją wycofać.

Typowe błędy Shopify w pliku robots.txt

Typowe błędy Shopify w pliku robots.txt

  • errorBlokowanie wszystkich parametrów zapytania, gdy ważne adresy URL wariantów zależą od parametrów.
  • errorBlokowanie folderów obrazów potrzebnych do podglądu produktów.
  • errorBlokowanie Googlebota podczas próby blokowania tylko robotów szkolących AI.
  • errorZakładając, że plik robots.txt może sam naprawić zduplikowaną treść.
  • errorZapominając, że niektóre roboty mogą ignorować plik robots.txt lub używać zmieniających się ciągów agenta użytkownika.

FAQ

Czy sklepy Shopify powinny blokować roboty AI?keyboard_arrow_down

Domyślnie nie. Jeśli widoczność zakupów AI ma znaczenie, zezwól robotom na dostęp do publicznych stron produktów i kolekcji, blokując jednocześnie ścieżki prywatne lub ścieżki o niskiej wartości, takie jak koszyk, realizacja transakcji, konto, wyszukiwanie i filtry duplikatów.

Czy plik robots.txt może usunąć strony produktów Shopify z Google?keyboard_arrow_down

Plik Robots.txt kontroluje indeksowanie. Jeśli Google zna już adres URL, blokowanie indeksowania nie jest tym samym, co czysta strategia noindex. W przypadku wyszukiwarki Google zachowaj szczególną ostrożność, aby nie zablokować Googlebotowi dostępu do ważnych stron produktów.

Czy Shopify umożliwia dostosowywanie pliku robots.txt?keyboard_arrow_down

Tak, Shopify obsługuje dostosowywanie pliku robots.txt za pomocą szablonu motywu robots.txt.liquid. Zachowaj konserwatywne zmiany i przetestuj wyrenderowany plik /robots.txt po opublikowaniu.

Które adresy URL Shopify powinny pozostać możliwe do indeksowania w przypadku zakupów AI?keyboard_arrow_down

Strony produktów, strony kolekcji, zdjęcia produktów, kanoniczne adresy URL i adresy URL map witryn powinny zwykle umożliwiać indeksowanie, ponieważ zawierają informacje o produktach, kontekst kategorii i linki do odkrywania.

Powiązane narzędzia

Powiązane wpisy