قواعد ملف Robots.txt
Review سواء تم حظر المنتجات المهمة URL أو مجموعات الزاحف بواسطة robots.txt، بما في ذلك القواعد التي تستهدف البحث ووكلاء مستخدم الزاحف AI.
تحقق مما إذا كان بإمكان برامج زحف البحث وAI اكتشاف صفحات منتجك وجلبها وفهرستها والوثوق بها من خلال مراجعة robots.txt والروبوتات التعريفية وX-Robots-Tag وخريطة الموقع وcanonical وإشارات الصفحة المعروضة.
لا يلزم تسجيل الدخول · فحص مجاني · تقرير فوري عبر الإنترنت
تغطية التدقيق
Review سواء تم حظر المنتجات المهمة URL أو مجموعات الزاحف بواسطة robots.txt، بما في ذلك القواعد التي تستهدف البحث ووكلاء مستخدم الزاحف AI.
تحقق من الروبوتات التعريفية وتوجيهات X-Robots-Tag التي يمكن أن تمنع فهرسة الروابط أو متابعتها حتى عندما يسمح robots.txt بالجلب.
انظر إلى خريطة الموقع، canonical، hreflang، وإشارات الارتباط الداخلي حتى تتمكن برامج الزحف من العثور على المنتج المفضل URL.
حدد الصفحات التي يؤدي فيها JavaScript أو عمليات إعادة التوجيه أو بوابات كلمة المرور أو السياج الجغرافي أو فشل التطبيق إلى إخفاء حقائق المنتج عن برامج الزحف.
خريطة وصول الزاحف
الوصول إلى الزاحف ليس مفتاحًا واحدًا. يمكن السماح بالصفحة في robots.txt، أو حظرها بواسطة noindex، أو فقدها من خرائط الموقع، أو canonical، أو يمكن قراءتها للمتصفحات ولكنها غير مكتملة لبرامج الزحف. يقوم هذا المدقق بفصل كل طبقة حتى تتمكن من معرفة البوابة التي تسبب المخاطر.
يتحكم robots.txt فيما إذا كان يُسمح لوكلاء مستخدم محددين بجلب URL. وهو مفيد للتحكم في الزحف، ولكنه ليس مثل الفهرسة أو التصنيف أو رؤية AI.
إشارات المثال
User-agent: OAI-SearchBot / GPTBot / ClaudeBot / Claude-SearchBot / PerplexityBot / Google-Extended; Disallow: /products/ما للتحقق
يمكن للزاحف جلب صفحة ويظل يُطلب منه عدم فهرستها. غالبًا ما تشرح الروبوتات التعريفية ورؤوس HTTP X-Robots-Tag سبب كون المنتج URL قابلاً للاكتشاف ولكنه غائب عن البحث.
إشارات المثال
meta robots: noindex, nofollow; X-Robots-Tag: noindexما للتحقق
تخبر ملفات Sitemap وcanonicals برامج الزحف بالمنتج URL الذي يجب أن يمثل العنصر. يمكن أن يؤدي الانجراف هنا إلى جعل AI وأنظمة البحث تجمع المتغير أو السوق أو سياق المجموعة الخاطئ.
إشارات المثال
sitemap.xml URL + canonical المنتج URL + hreflang المكافئات السوقيةما للتحقق
AI وبرامج زحف البحث تحتاج إلى حقائق المنتج النهائية، وليس مجرد غلاف فارغ. يمكن أن يؤدي فشل العرض إلى جعل المخطط أو السعر أو التوفر أو سمات المنتج غير مرئية.
إشارات المثال
HTML المعروض: Product المخطط والسعر والتوفر والسمات والمراجعات وسياق الإرجاع والشحنما للتحقق
المحظورات المشتركة
قد لا تسمح القواعد بـ GPTBot، وOAI-SearchBot، وClaudeBot، وClaude-SearchBot، وPerplexityBot، أو إلغاء الاشتراك من خلال Google-Extended. يمكن لأنماط الروبوتات الواسعة أيضًا حظر صفحات المنتج عن طريق الصدفة.
يمكن أن تكون صفحة المنتج قابلة للجلب ولكنها لا تزال مستبعدة بواسطة الروبوتات التعريفية أو توجيهات X-Robots-Tag noindex.
Crawlers may discover one URL while canonical, hreflang, or sitemap entries point to a different market, variant, or collection URL.
يمكن أن يؤدي JavaScript المؤجل أو أدوات التطبيق أو عمليات إعادة التوجيه أو حماية الروبوتات إلى إبقاء السعر أو التوفر أو المخطط أو السمات خارج الصفحة المرئية للزاحف.
سير العمل
01
استخدم صفحة المنتج العامة التي تريد أن تكتشفها محركات البحث وأنظمة AI، وليس المعاينة أو المسؤول URL.
02
يقوم ShopGox بالتحقق من robots.txt وتوجيهات الصفحة وخريطة الموقع وإشارات canonical ومخرجات المنتج المعروضة معًا.
03
استخدم التقرير لتحديد ما إذا كان الإصلاح ينتمي إلى robots.txt أو قوالب السمات أو الرؤوس أو إعدادات خريطة الموقع أو قواعد التطبيق أو تكوين النظام الأساسي.
الأسئلة الشائعة
المزيد من الأدوات
ماسح جاهزية التسوق بالذكاء الاصطناعي
قم بمسح صفحات منتجات التجارة الإلكترونية بحثًا عن جاهزية بحث الذكاء الاصطناعي ومخطط المنتج وإشارات وصول الزاحف وسمات المنتج والوضوح الدلالي واتساق البيانات المنظمة.
مدقق مخطط المنتج
تحقق من صفحات منتجات التجارة الإلكترونية لمعرفة مخطط المنتج، وبيانات العرض، واتساق JSON-LD، والسعر، والتوفر، والسمات، واستعداد بحث الذكاء الاصطناعي.
Shopify مدقق المخطط
مدقق مخطط Shopify مجاني لصفحات المنتج. مسح مخطط المنتج، والعروض المتنوعة، والبيانات الوصفية التي يتم إدخالها في التطبيق، وإشارات Shopify Markets، واستعداد بحث الذكاء الاصطناعي.