Quy tắc robots.txt
Review liệu sản phẩm quan trọng URL hoặc nhóm trình thu thập thông tin có bị chặn bởi robots.txt hay không, bao gồm các quy tắc nhằm mục đích tìm kiếm và AI tác nhân người dùng trình thu thập thông tin.
Kiểm tra xem trình thu thập thông tin tìm kiếm và AI có thể khám phá, tìm nạp, lập chỉ mục và tin cậy các trang sản phẩm của bạn hay không bằng cách xem xét robots.txt, meta robots, X-Robots-Tag, sơ đồ trang web, canonical và tín hiệu trang được hiển thị.
Không cần đăng nhập · Quét miễn phí · Báo cáo trực tuyến tức thì
Phạm vi kiểm toán
Review liệu sản phẩm quan trọng URL hoặc nhóm trình thu thập thông tin có bị chặn bởi robots.txt hay không, bao gồm các quy tắc nhằm mục đích tìm kiếm và AI tác nhân người dùng trình thu thập thông tin.
Kiểm tra meta robots và lệnh X-Robots-Tag có thể ngăn chặn việc lập chỉ mục hoặc theo dõi các liên kết ngay cả khi robots.txt cho phép tìm nạp.
Xem sơ đồ trang web, canonical, hreflang và các tín hiệu liên kết nội bộ để trình thu thập thông tin có thể tìm thấy sản phẩm ưa thích URL.
Xác định các trang trong đó JavaScript, chuyển hướng, cổng mật khẩu, khoanh vùng địa lý hoặc lỗi ứng dụng ẩn thông tin sản phẩm khỏi trình thu thập thông tin.
Bản đồ truy cập trình thu thập thông tin
Truy cập trình thu thập thông tin không phải là một công tắc. Một trang có thể được cho phép trong robots.txt, bị chặn bởi noindex, bị thiếu trong sơ đồ trang web, canonicalbị xóa hoặc có thể đọc được đối với trình duyệt nhưng không đầy đủ đối với trình thu thập thông tin. Trình kiểm tra này tách từng lớp để bạn có thể biết cổng nào đang tạo ra rủi ro.
robots.txt kiểm soát xem tác nhân người dùng cụ thể có được phép tìm nạp URL hay không. Nó rất hữu ích cho việc kiểm soát thu thập thông tin nhưng nó không giống như lập chỉ mục, xếp hạng hoặc khả năng hiển thị AI.
Tín hiệu mẫu
User-agent: OAI-SearchBot / GPTBot / ClaudeBot / Claude-SearchBot / PerplexityBot / Google-Extended; Disallow: /products/Những gì cần xác minh
Trình thu thập thông tin có thể tìm nạp một trang nhưng vẫn được yêu cầu không lập chỉ mục trang đó. Robot meta và tiêu đề HTTP X-Robots-Tag thường giải thích lý do tại sao một sản phẩm URL có thể được tìm thấy nhưng lại không xuất hiện trong tìm kiếm.
Tín hiệu mẫu
meta robots: noindex, nofollow; X-Robots-Tag: noindexNhững gì cần xác minh
Sơ đồ trang web và canonical cho trình thu thập thông tin biết sản phẩm URL nào sẽ đại diện cho mặt hàng đó. Sự trôi dạt ở đây có thể khiến AI và hệ thống tìm kiếm thu thập sai bối cảnh biến thể, thị trường hoặc bộ sưu tập.
Tín hiệu mẫu
sitemap.xml URL + canonical sản phẩm URL + hreflang tương đương thị trườngNhững gì cần xác minh
AI và trình thu thập thông tin tìm kiếm cần thông tin thực tế về sản phẩm cuối cùng chứ không chỉ là một cái vỏ trống rỗng. Lỗi hiển thị có thể làm cho các thuộc tính lược đồ, giá cả, tình trạng còn hàng hoặc sản phẩm trở nên vô hình.
Tín hiệu mẫu
HTML được hiển thị: Product lược đồ, giá cả, tình trạng còn hàng, thuộc tính, đánh giá, bối cảnh trả lại và vận chuyểnNhững gì cần xác minh
Trình chặn thông thường
Các quy tắc có thể không cho phép GPTBot, OAI-SearchBot, ClaudeBot, Claude-SearchBot và PerplexityBot hoặc chọn không tham gia thông qua Google-Extended. Các mẫu bot rộng cũng có thể vô tình chặn các trang sản phẩm.
Một trang sản phẩm có thể tìm nạp được nhưng vẫn bị loại trừ bởi meta robot hoặc lệnh X-Robots-Tag noindex.
Trình thu thập thông tin có thể phát hiện một URL trong khi canonical, hreflang hoặc các mục trong sơ đồ trang web trỏ đến một thị trường, biến thể hoặc bộ sưu tập khác URL.
JavaScript bị trì hoãn, tiện ích ứng dụng, chuyển hướng hoặc bảo vệ bot có thể khiến giá, tình trạng còn hàng, lược đồ hoặc thuộc tính nằm ngoài trang hiển thị cho trình thu thập thông tin.
Quy trình làm việc
01
Sử dụng trang sản phẩm công khai mà bạn muốn công cụ tìm kiếm và hệ thống AI khám phá chứ không phải bản xem trước hoặc quản trị viên URL.
02
ShopGox kiểm tra robots.txt, chỉ thị trang, sơ đồ trang web và các tín hiệu canonical cũng như đầu ra sản phẩm được hiển thị cùng nhau.
03
Sử dụng báo cáo để quyết định xem bản sửa lỗi có thuộc về robots.txt, mẫu chủ đề, tiêu đề, cài đặt sơ đồ trang web, quy tắc ứng dụng hay cấu hình nền tảng hay không.
Câu hỏi thường gặp
Thêm công cụ
Máy quét sẵn sàng mua sắm AI
Quét các trang sản phẩm thương mại điện tử để biết mức độ sẵn sàng tìm kiếm của AI, Lược đồ sản phẩm, tín hiệu truy cập của trình thu thập thông tin, thuộc tính sản phẩm, độ rõ ràng về ngữ nghĩa và tính nhất quán của dữ liệu có cấu trúc.
Trình kiểm tra lược đồ sản phẩm
Kiểm tra các trang sản phẩm thương mại điện tử để biết Lược đồ sản phẩm, Dữ liệu ưu đãi, tính nhất quán JSON-LD, giá cả, tình trạng còn hàng, thuộc tính và mức độ sẵn sàng tìm kiếm AI.
Trình kiểm tra lược đồ Shopify
Trình kiểm tra lược đồ Shopify miễn phí cho các trang sản phẩm. Quét lược đồ Sản phẩm, ưu đãi biến thể, siêu dữ liệu được ứng dụng đưa vào, tín hiệu của Shopify Markets và mức độ sẵn sàng tìm kiếm bằng AI.