خريطة الموقع الخاصة بـ XML للمجموعات الضخمة. كيفية إنشاء ملف Sitemap XML لمتصفحي Yandex وGoogle: إرشادات خطوة بخطوة


أدخل اسم الموقع



اختر نوع الخريطة - xml أو html، والأولوية، وتكرار التغييرات، وصفحات الموقع المضمنة - ونتيجة لذلك، ستتلقى ملف خريطة موقع صالحًا.

مولد خريطة الموقع XML

يمكنك إنشاء خريطة موقع عبر الإنترنت مجانًا تمامًا باستخدام خدمة Saitreport الخاصة. تعتبر خريطة الموقع شرطًا ضروريًا للترويج لها. وبمساعدتها، يتم نقل المعلومات حول بنية المورد إلى محركات البحث.

عدم وجود خريطة الموقع يجعل من الصعب الترويج لها. قد لا تلاحظ معظم محركات البحث المستندات المهمة لفترة طويلة. لذلك، لفهرسة الصفحات، من الضروري إنشاء خريطة الموقع ووضعها بشكل صحيح.

تتيح لك خدمة Saitreport عبر الإنترنت إمكانية إنشاء خريطة XML وتجعل من الممكن إنشاء خريطة موقع للترويج لموقع الويب. سيسمح لك هذا الملف بتحديد أولوية فهرسة الصفحات وتكرار التحديثات ونوع المستندات المضمنة.

كيفية إنشاء خريطة الموقع؟

لإنشاء خريطة موقع، املأ جميع الحقول الضرورية على موقع الخدمة بنفسك: عنوان الصفحة الرئيسية وتاريخ التحديثات وتكرارها والأولوية وعدد الصفحات. قم بتشغيل الأداة وانتظر حتى ينتهي إنشاء ملف Sitemap.

سيقوم منشئ الخرائط بتحليل الموقع وإنشاء ملف نصي Sitemap.xml، والذي تحتاج إلى إضافته إلى الجذر بنفسك. يوفر استخدام خريطة الموقع الفوائد التالية:

  • سيتم إضافة صفحات الموقع إلى البحث.
  • ستتعرف محركات البحث على الموقع بشكل أسرع بكثير؛
  • سيزيد مستوى مطابقة البحث.

عند استخدام خدمة Saitreport، يمكنك إنشاء خريطة XML والاستفادة من الوظائف الإضافية عن طريق تعيين المعلمات.

يمكنك بسهولة إنشاء خريطة الموقع الخاصة بك. اكتب أولاً عنوان URL الخاص بك، ثم حدد المعلمات التي قد ترغب في تغييرها. (تغيير التكرار وتاريخ التعديل الأخير وأولوية الصفحة. يمكنك أيضًا تغيير الإعدادات الافتراضية لاستبعاد الامتدادات، ولا تحلل الامتدادات ومعرفات الجلسة. في الحقول التالية، يمكنك الإعلان عن عناوين URL التي تريد استبعادها من خريطة الموقع (انظر المثال أدناه). أخيرًا، يمكنك تحديد الحد الأقصى لعدد الصفحات ومستوى العمق، ويمكنك بشكل اختياري تحديد إنشاء خرائط مواقع إضافية، مثل خريطة موقع ROR أو خريطة موقع HTML أو خريطة موقع TXT.

ما هو "تكرار تغيير الصفحة"؟
يؤثر تغيير التكرار على وقت وعدد مرات زيارة عناكب محركات البحث لصفحات موقعك. قد تحتوي على واحدة من سبع قيم: دائمًا، كل ساعة، يوميًا، أسبوعيًا، شهريًا، سنويًا، أبدًا. وهذا يخبر محركات البحث بعدد مرات تحديث كل صفحة. يشير التحديث إلى التغييرات الفعلية في كود HTML أو نص الصفحة.

ما هو "تاريخ آخر تعديل"؟
يمكن أن تأخذ هذه المعلمة إحدى القيم الثلاث التالية:
استجابة الخادم.قم بتعيين تاريخ آخر تعديل للملف باستخدام رؤوس استجابة الخادم. توفر هذه القيمة لبرامج الزحف المعلومات اللازمة لعدم إعادة الزحف إلى المستندات التي لم تتغير. نوصي بالحفاظ على هذا الإعداد.
الوقت الحالي.قم بتعيين تاريخ آخر تعديل للملف باستخدام التاريخ والوقت الحاليين.
لا أحد.لا تستخدم أي قيمة للتعديل الأخير للملفات.

ما هي "أولوية الصفحة"؟
يتم تعيين الأولوية إلى رقم بين صفر وواحد. إذا لم يتم تعيين أي رقم، يتم تعيين الأولوية إلى 0.5. يحدد هذا الرقم أولوية عنوان URL معين بالنسبة للصفحات الأخرى الموجودة على نفس الموقع. قد تتم فهرسة الصفحة ذات الأولوية العالية في كثير من الأحيان وتظهر أعلى الصفحات الأخرى من نفس الموقع في نتائج البحث. تعمل الأولوية التلقائية على تقليل أولوية الصفحة حسب مستوى العمق.

ما هو "مستوى العمق"؟
مستوى عمق الصفحة يعني عدد النقرات التي تبعد هذه الصفحة عن الصفحة الرئيسية.

ما هو "استبعاد الامتدادات"؟
لا يتم تضمين الملفات ذات هذه الامتدادات الموجودة في صفحات موقع الويب الخاص بك في خريطة الموقع (لا يتم الزحف إليها). قيم الإدخال منفصلة بمسافات.

ما هو "عدم تحليل الامتدادات"؟
لن يتم جلب الملفات التي تحتوي على هذه الامتدادات من أجل توفير النطاق الترددي، لأنها ليست ملفات html ولا تحتوي على روابط مضمنة ولكن سيتم تضمينها في خريطة الموقع. قيم الإدخال منفصلة بمسافات.

ما هي "معرفات الجلسة"؟
إذا كانت عناوين URL الموجودة على موقعك تحتوي على معرفات جلسة، فيجب عليك إزالتها. قد يؤدي تضمين معرفات الجلسة في عناوين URL إلى زحف غير كامل ومتكرر إلى موقعك. معرفات الجلسة الشائعة: PHPSESSID، sid، osCsid. منفصلة بمسافات.

ما هو "استبعاد عناوين URL"؟
لن يتم تضمين عناوين URL التي تحتوي على هذه السلاسل (أو التعبير العادي) في خريطة الموقع. قيم الإدخال واحدة لكل سطر.
على سبيل المثال 1 استخدم السلسلة: عنصر/ من أجل استبعاد كافة الصفحات في www.yoursite.com/component/
إذا كان التعبير العادي، أضف في النهاية: \s* (مثال: blo\s*)
على سبيل المثال 2 إذا كان لديك أي من مواقع الويب التالية، فيمكنك استبعاد هذه السلاسل: (انسخ والصق في مربع استبعاد عناوين URL)

لقد أصدرنا كتابًا جديدًا بعنوان تسويق محتوى الوسائط الاجتماعية: كيفية الوصول إلى عقول متابعيك وجعلهم يقعون في حب علامتك التجارية.

لنفترض أن لديك موقع ويب مليئًا بالمحتوى الفريد، والذي تم تحسينه من خلال تحسين محركات البحث (SEO)، وأنت تجلس، وتفرك راحة يدك، في انتظار أن يبدأ روبوت البحث الخاص بك في الزيارة، وفهرسته وجلب حركة المرور المرغوبة. يمر الوقت، ونتيجة جهودك ليست مرئية بشكل خاص. ماذا جرى؟ ربما تم التغاضي عن شيء ما، وقد تم نسيان شيء ما في السعي وراء الأشياء الجيدة. لنفترض أن الموقع لا يزال فريدًا وأن هناك الكثير من أدوات تحسين الأداء. فأنت بحاجة إلى معرفة سبب تردد محرك البحث في زيارتك ولماذا يحدث كل شيء ببطء شديد.

يجب أن يحتوي كل مشروع ويب على ملفين مهمين، وربما رئيسيين: ملف الروبوتات (robots.txt) وخريطة الموقع (). إذا كان أي منها مفقودًا أو تم ملؤه بشكل غير صحيح، فهناك احتمال كبير بأن المورد لن يعطي النتيجة التي توقعتها. ففي نهاية المطاف، وضعت روبوتات البحث حدودًا على الوقت الذي تقضيه على المورد وعلى عدد المستندات التي يمكنها فحصها وإدخالها في قاعدة البيانات. وهذا كله يعني أنه إذا لم تحدد مسارات السفر لروبوت البحث، فقد لا يصل إلى المحتوى قريبًا جدًا، بعد أن تجول أولاً في ملفات المحرك.

لتجنب مثل هذا الالتباس، في ملف الروبوتات، نقول ما الذي لا ينبغي للروبوتات أن تضيع الوقت فيه، وبمساعدة خريطة الموقع، على العكس من ذلك، نقترح مكان البحث وأين تتجول.

لنفترض أن كل شيء قد اجتمع بالنسبة لنا وبدأت محركات البحث في فهرسة مشروعنا، لكن غياب الثاني قد يؤخر تحقيق أهدافنا. والآن المزيد عن إنشاء خريطة الموقع.

إصدارات XML وHTML لخريطة الموقع

يعمل Sitemap.html بمثابة تنقل لضيوف موردنا، مما يساعدهم على فهم بنية الموقع والعثور على القسم الذي يهتمون به.

يقوم Sitemap.xml بمطالبة روبوتات البحث ومساعدتها في اكتشاف صفحات مشروعنا والبدء في فهرستها. إذا كان لدينا مستوى عالٍ من التداخل وعدد كبير من صفحات الويب على الموقع، فإن XML يضمن عدم إغفال الروبوتات لما يجب فهرسته. كمكافأة لطيفة، نحصل على ميزة إضافية للكارما لدينا في شكل زيادة الثقة في الموارد من محركات البحث.

الجوانب الإيجابية لوجود خريطة الموقع. xml على الموقع

  • الفهرسة السريعة للصفحات التي تم إنشاؤها مؤخرًا؛
  • احتمال مئة بالمئة أن يجد محرك البحث الصفحات الضرورية؛
  • القدرة على تحديد أولويات المسح وتكرار وتاريخ آخر تحديث للصفحة؛
  • تزداد الثقة في المورد قليلاً.

مهم!

  • استخدم ترميز UTF-8 لخريطة الموقع الخاصة بك؛
  • يجب ألا يزيد وزن الملف عن 10 ميجا بايت، ويجب ألا يتجاوز محتواه 50 ألف عنوان URL.

كيفية إنشاء وإضافة خريطة الموقع. xml إلى الموقع

خذ أي محرر نصوص، على سبيل المثال Notepad++، وابدأ في الإنشاء.

الكتلة الأولى هي الجزء القياسي، والذي نشير فيه إلى:

http://Наш сайт.ru/ 2016-05-23T23:45:36+00:00 daily 1.0

معاني العلامة:

  • "loc" - قمنا بتضمين عنوان صفحة موقعنا الإلكتروني، والتي يجب على روبوتات البحث فهرستها قريبًا؛
  • "lastmod" - يعرض تاريخ التحديث الأخير للصفحة المحددة في العلامة الأولى؛
  • "changefreq" - يوضح عدد المرات التي سيتم فيها تحديث المحتوى (في حالتنا، كل يوم)؛
  • "الأولوية" - تحدد أولوية فهرسة الصفحة (من 0 إلى 1)

نقوم بحفظ الملف الناتج بتنسيق XML ونضعه في ملف . بعد ذلك، حدد المسار إليه في الروبوتات. txt بهذا السطر:

http://موقعنا/sitemap.xml

أو يمكننا استخدام أحد المولدات عبر الإنترنت. على سبيل المثال،، وهو مصمم لإنشاء ما لا يزيد عن 500 صفحة. ولكن في كثير من الأحيان لا تحتاج إلى المزيد، لذلك نحن نعمل معها.

في السطر الأول نقوم بإدخال عنوان URL الكامل لموقعناhttp:// موقعنا .

السطر الثاني والذي يسمى "تغيير التردد "يُظهر لروبوتات البحث عدد المرات التي سيتم فيها تحديث صفحات الويب. يمكننا أن نختار:أبدًا، أسبوعيًا، يوميًا، كل ساعة، شهريًا، سنويًا.

السطر الثالث "آخر تعديل" " يظهر آخر تحديث للصفحة، يمكننا تحديد إما التاريخ الذي قررنا فيه إنشاء خريطة الموقع، أو تحديد "استخدم استجابة الخادم " - سيقوم المولد تلقائيًا بإدخال تاريخ آخر تغيير.

والسطر الرابع "أولوية "، كما ناقشنا سابقًا يسمح لك بتحديد أولوية الفهرسة، حدد "الأولوية المحسوبة تلقائيا».

اضغط على زر "ابدأ" وانتظر حتى يتم إنشاؤهخريطة الموقع بصيغة XML، ثم نقوم مرة أخرى بإجراء عمليات المعالجة بوضعه في الجذر وتحديد المسار في ملف robots.txt.

كيفية الإبلاغ عن ملف خريطة الموقع بعد الإنشاء إلى Google وYandex

انتقل إلى مشرف الموقع وتابع كما يلي.

حدد التحقق من خريطة الموقع:

وقم بتعيين المسار إلى ملف خريطة الموقع الخاص بنا.

دعونا نتحقق مما حدث:

التأكد من أن كل شيء على ما يراموانتقل إلى الانحناء لجوجل.

للوصول إلى Google Search Console، حيث يمكنك في الواقع الإبلاغ عن خريطتنا، انتقل إلى

قم بتحديث الصفحة- أمامنا نتيجة الشيك، وإذا كانت هناك شرطة في عمود "المشاكل"، فهذا يعني أننا فعلنا كل شيء بشكل صحيح.

دعونا نلخص ذلك

إنشاء ووضع ملف خريطة الموقع. XML على المورد هو في الواقع مسألة دقائق، لذلك يمكنك استخدام أي محرر نصوص أو مولد عبر الإنترنت. إذا كان لديك خريطة موقع على المورد الخاص بك، فإنك تقوم بتسريع وتبسيط الحياة لروبوت البحث، الذي يتبع المسار المحدد ويقوم بفهرسة الصفحات الضرورية. وهذا يعني أن نتيجة عملك التحسين لديها فرصة لتصبح ملحوظة بشكل أسرع. ولكن من المهم عدم نسيان خريطة الموقع وتحديثها بشكل دوري، لأن قد تتوقف الصفحة عن المشاركة في الترويج، وستستمر الروبوتات في زيارتها، مما سيؤثر على المناصب. أيضًا، يمكن لمستكشف XML الخاص بنا أن يعمل كمساعد ليس فقط للروبوتات، ولكن أيضًا لصوص المحتوى، لأننا في خريطة الموقع نشير إلى المستندات التي نحتاجها، مما يبسط إلى حد كبير حياة النسخ. لذلك، نوصي بالتحقق بشكل دوري من محتوى المورد الخاص بك للتأكد من تفرده. باتباع هذه القواعد، يمكنك زيادة ثقة محركات بحث Google وYandex في موردك.

تحيات أصدقاء!

نواصل إعداد مواقعنا للترقية. في الدرس الأخير قمنا بإنشاء ملف، واليوم هدفنا هو إنشاء ملف خريطة الموقع، والمعروف أيضًا باسم "خريطة الموقع".

Sitemap.xml هو ملف يحدد الصفحات التي سيتم فهرستها بأولوية معينة لـ .

من وجهة نظر واحدة، ليست هناك حاجة إلى sitemap.xml على الإطلاق: فالروبوت نفسه يقوم بعمل ممتاز. ولكن إذا نظرت من الجانب الآخر، فستجد أن هناك حاجة فعلية إلى خريطة الموقع. الشيء هو أن بعض الصفحات أكثر أهمية بكثير من غيرها. وقبل كل شيء، يجب على الروبوت فهرسة الصفحات المهمة، ثم الصفحات الأخرى.

يسمح لك ملف Sitemap.xml بإخبار الروبوت بالصفحات التي يجب فهرستها أولاً وأي الصفحات يجب فهرستها بعد ذلك. ومن هذا المنطلق، هناك حاجة إلى خريطة للموقع. ولهذا السبب يخرج هذا الدرس.

حسنًا؟ دعنا نذهب!

كيف يتم فهرسة الموقع؟

لفهم سبب الحاجة إلى الخريطة بشكل كامل، دعونا نتحدث عنها. إذا تحدثنا بشكل بسيط ومفهوم للجميع، فستبدو العملية كما يلي:

تخيل هذا الموقف: تحتاج إلى العثور على شيء ما في كتاب عن الفيزياء، وذهبت إلى المكتبة لتجد هذا الكتاب بالذات هناك. جاؤوا ووجدوه وفتحوه. بعد ذلك، تبدأ في البحث عن المعلومات التي تحتاجها دون أي توجيه. وهكذا، من خلال تصفح الكتاب، بدأت في إدراك جميع المعلومات الموجودة هناك، أي الفهرسة.

وهذا ما تبدو عليه عملية الفهرسة. أنت، مثل الروبوت، بدأت في النظر في كل شيء في الكتاب وتذكره، على الرغم من أن معظم المحتوى له أهمية ثانوية. للتنقل بسرعة في الكتاب، يتم توفير جدول المحتويات: صفحة تحتوي على عناوين الفصول وأرقام الصفحات (الروابط). يعد ملف Sitemap.xml، في نهاية المطاف، نوعًا ما من المحتوى، ولكنه مخصص لروبوت البحث فقط.

كيفية إنشاء ملف sitemap.xml؟

يمكنك إنشاء خريطة موقع باستخدام مولدات خاصة عبر الإنترنت، وهي عبارة عن عشرة سنتات على الإنترنت. وبالنسبة لأولئك الذين تعمل مواقعهم على نظام إدارة المحتوى (CMS)، يمكنك استخدام المكونات الإضافية (المدونة تعمل على WordPress، وأنا أستخدم البرنامج الإضافي Yoast SEO).

هناك أيضًا أولئك الذين يريدون كتابة Sitemap.xml بأنفسهم، والجزء التالي من الدرس مخصص لك فقط. لكن أولاً أريدك أن تقوم بتنزيل محرر Notepad++، وفي هذا المحرر يمكنك حفظ الملف بتنسيق .xml:

الآن دعونا نلقي نظرة فاحصة على القيم الموجودة في العلامة :

  • — علامة مطلوبة تحتوي على رابط للصفحة؛
  • — تاريخ تحديث الصفحة؛
  • — يحدد تكرار تحديث الصفحة، ويحتوي على القيم التالية:

    • كل ساعة - كل ساعة؛
    • يوميا - يوميا؛
    • أسبوعي - أسبوعي؛
    • فمويا - شهريا؛
    • سنويا - سنويا؛
    • أبدا أبدا.
  • - أولوية فهرسة الصفحة. لديه قيم من 0.1 - 1؛

دعونا ننظر إلى الأولوية بمزيد من التفصيل. ليست هناك حاجة لتحديد أولوية عالية لكل صفحة في ملف sitemap.xml. يتم تحديده فقط بالنسبة للصفحات المحددة في الملف. أي أنه إذا كانت الصفحة site.ru/1.html في خريطة الموقع لها الأولوية 1 (عالية)، والصفحة site.ru/2.html لها الأولوية 0.5، فسيتم فهرسة site.ru/1.html أولاً والصفحة الثانية على التوالي الثانية. لذلك العلامة - هذا ترتيب فهرسة معين.

خاتمة: بالنسبة للصفحات التي يتم الترويج لها، قم بتعيين الأولوية 1، وللقيم الأخرى الأقل أهمية أقل.

تحتاج إلى تحميل sitemap.xml إلى جذر مجلد الموقع!

يجب أن تكون خريطة الموقع متاحة على: http://site.ru/sitemap.xml

إذا كانت البطاقة غير متوفرة في هذا العنوان، فهذا يعني أنك قمت بتحميلها إلى المكان الخطأ!

القيود المفروضة على sitemap.xml

لقد اكتشفنا كيفية إنشاء ملف sitemap.xml، والآن لنتحدث عن القيود الموجودة في الملف:

  1. يجب أن تشير الروابط إلى نفس الموقع؛
  2. يجب ألا يتجاوز طول الرابط 2048 حرفًا؛
  3. الحد الأقصى لعدد الروابط 50.000؛
  4. حجم الملف لا يزيد عن 10 ميجابايت.

في بعض الأحيان يحدث أن ملفًا واحدًا لا يحتوي على جميع المعلومات؛ وفي هذه الحالة، سيساعدك ملف الفهرس.

ملف الفهرس هو نفس ملف sitemap.xml، الذي يحتوي على روابط لخرائط الموقع التي أنشأناها أعلاه.

وهذا ما يبدو عليه ملف الفهرس من الداخل:

http://www.site.ru/sitemap1.xml http://www.sait.ru/sitemap2.xml

احفظه واستخدمه إذا لزم الأمر، مع استبدال الروابط الخاصة بك.

تذكر: إن sitemap.xml مطلوب لجميع المواقع تقريبًا، باستثناء المواقع الصغيرة. يساعد كثيرا في فهرسة الموقع.

حسنا، هذا كل شيء، أيها الأصدقاء الأعزاء!

اراك قريبا!

المقال السابق
المقالة التالية