AI 爬蟲存取

適用於 AI 爬蟲的 Shopify robots.txt

Shopify robots.txt、AI 抓取工具存取、私人路徑、Googlebot 風險以及代理購物可見性監控的實用指南。

ShopGox Editorial2026/5/23zh-TW
適用於 AI 爬蟲的 Shopify robots.txt:允許、封鎖和監控的內容

人工智慧購物系統無法推薦他們無法抓取、閱讀或信任的商品。對於 Shopify 商店,robots.txt 是產品目錄與搜尋引擎、人工智慧助理、購物代理和商業爬蟲之間的首要入口之一。

我們的目標不是允許一切。目標是保持重要的產品、集合、圖像和結構化資料路徑可訪問,同時保護購物車、結帳、帳戶、搜尋、過濾器和無助於發現的內部實用程式路徑。

Robots.txt 控制抓取,而非內容品質

Robots.txt 告訴合規爬蟲它們不應要求哪些路徑。它不會添加產品架構、修復重複變體、改進精簡描述或保證索引。將其視為爬蟲的存取控制,而不是技術 SEO 的替代品。

預設情況下 Shopify 通常可以很好地處理哪些內容

保留這些預設設置,除非有明確的原因

  • check_circle產品和產品系列頁面應保持可抓取狀態。
  • check_circle呈現產品內容所需的靜態資源應保持可抓取狀態。
  • check_circle購物車、結帳、帳戶和內部搜尋路徑通常不需要抓取工具存取權限。
  • check_circle站點地圖路徑應保持可發現性。
  • check_circle除非您有意刪除 Google 搜尋存取權限,否則不應阻止 Googlebot。

Shopify 的合理 AI 抓取工具策略

Visual summary diagram for Shopify robots.txt for AI Crawlers: What to Allow, Block, and Monitor.

對於成長階段的電子商務網站來說,平衡的政策通常比一攬子封鎖更好。允許爬蟲創造發現價值、保護私有和低價值路徑以及監控日誌或 CDN 分析以發現異常流量。

Shopify 的合理 AI 抓取工具策略

路徑類型推薦政策為什麼它很重要
產品頁面允許它們包含人工智慧購物系統所需的商業事實。
收藏頁允許它們幫助抓取工具了解類別、庫存分組和內部連結。
產品圖片允許影像支援視覺搜尋、預覽和更豐富的產品理解。
購物車與結帳禁止它們無助於發現,並且可能會造成抓取浪費。
客戶帳號頁禁止它們是私有的或對公眾發現而言價值較低。
內部搜尋與過濾的網址通常不允許他們可以創造重複或無限的抓取路徑。
站點地圖允許它可以幫助爬蟲有效地找到規範的網址。

AI 抓取工具的 Shopify robots.txt 規則範例

Shopify 商店可以透過主題的 robots.txt.liquid 範本自訂機器人規則。保持自訂規則較小、記錄在案且易於撤銷。不要盲目地從其他商店複製爬蟲阻止清單。

User-agent: *
Disallow: /cart
Disallow: /checkout
Disallow: /account
Disallow: /search
Disallow: /*?*sort_by=
Disallow: /*?*filter.

User-agent: Googlebot
Allow: /

User-agent: GPTBot
Disallow: /cart
Disallow: /checkout
Disallow: /account

User-agent: Google-Extended
Disallow: /

Google 擴充與 Googlebot 不同

Google-Extended 是某些 Google AI 訓練和產品用例的單獨控制項。阻止 Google-Extend 與封鎖 Googlebot 不同。如果您的首要任務是搜尋可見性,切勿將它們視為可互換的。

更改 robots.txt 後要監控的內容

更改後檢查

  1. 1開啟 /robots.txt 並確認最終渲染的檔案符合您的預期。
  2. 2驗證 Googlebot 沒有屏蔽產品和產品系列網址。
  3. 3檢查網站地圖網址是否仍可存取。
  4. 4針對代表性產品頁面執行抓取工具存取檢查。
  5. 5觀察伺服器、CDN 或 Shopify 分析以了解抓取峰值。
  6. 6為 robots.txt 的每項變更保留註明日期的註釋,以便您可以快速回滾。

常見的 Shopify robots.txt 錯誤

常見的 Shopify robots.txt 錯誤

  • error當重要的變體 URL 依賴參數時,阻止所有查詢參數。
  • error阻止產品預覽所需的圖片資料夾。
  • error阻止 Googlebot,同時嘗試僅阻止 AI 訓練抓取工具。
  • error假設 robots.txt 可以自行修復重複內容。
  • error忘記某些抓取工具可能會忽略 robots.txt 或使用更改的使用者代理字串。

常見問題

Shopify 商店應該阻止 AI 爬蟲嗎?keyboard_arrow_down

預設不是。如果人工智慧購物可見性很重要,請允許爬蟲存取公共產品和產品系列頁面,同時阻止私人或低價值路徑,例如購物車、結帳、帳戶、搜尋和重複過濾器。

robots.txt 能否從 Google 中刪除 Shopify 產品頁面?keyboard_arrow_down

Robots.txt 控制抓取。如果 Google 已經知道某個 URL,則阻止抓取與乾淨的 noindex 策略不同。對於 Google 搜索,請特別小心,不要阻止 Googlebot 訪問重要的產品頁面。

Shopify 是否允許 robots.txt 自訂?keyboard_arrow_down

是的,Shopify 支援透過主題的 robots.txt.liquid 範本進行 robots.txt 自訂。保持更改保守並在發布後測試渲染的 /robots.txt 檔案。

哪些 Shopify 網址應保持可抓取以供 AI 購物使用?keyboard_arrow_down

產品頁面、產品系列頁面、產品圖片、規格 URL 和網站地圖 URL 通常應保持可抓取狀態,因為它們包含產品事實、類別上下文和發現連結。

相關工具

相關文章