क्या कोई स्पष्ट संकेतक है कि मेरा साइटमैप फ़ाइल फायदेमंद है?


73

मैंने हाल ही में एक साइटमैप .xml फ़ाइल बनाई है और इसे अपने Google वेबमास्टर्स टूल खाते में अपलोड किया है । Google ने मेरी साइट के अपलोड किए गए साइटमैप के साथ किसी भी समस्या या त्रुटियों की रिपोर्ट नहीं की है।

अब मेरा सवाल है:

  • मुझे कैसे पता चलेगा कि मेरा साइटमैप Google वेबमास्टर टूल्स के भीतर काम कर रहा है?

मेरे पूछने का कारण यह है कि मुझे नहीं पता कि मैं क्या देख रहा हूं या ढूंढ रहा हूं, और ऐसा लगता है कि मैंने बेकार फाइल अपलोड कर दी है।

जवाबों:


93

एक साइटमैप फ़ाइल के लिए खोज इंजन में मदद करता है के नए और बेहतर URL की खोज अपनी वेबसाइट पर। विशेष रूप से, यदि आपकी वेबसाइट काफी बड़ी है, तो यह उन्हें नई और अपडेट की गई सामग्री पर ध्यान केंद्रित करने में सक्षम बनाने में मदद कर सकता है, बजाय इसके कि वह कुछ भी बदल गया है या नहीं, यह देखने के लिए सब कुछ के माध्यम से अंधा करने के लिए। इसके परिणामस्वरूप नई सामग्री बहुत तेज़ी से मिल सकती है, जो विशेष रूप से ध्यान देने योग्य हो सकती है यदि साइट बड़ी या अधिक जटिल है।

विशेष रूप से Google के साथ (मैं Google पर काम करता हूं; मुझे नहीं पता कि अन्य खोज इंजन इनसे कैसे निपटते हैं), यह निम्न कार्य भी करता है:

  • अपनी वेबसाइट के लिए अनुक्रमित URL की संख्या ज्ञात करें: ये आँकड़े दैनिक और बहुत सटीक हैं। आप इन्हें साइटमैप विवरण पृष्ठ में पा सकते हैं ।
  • कैनोनिज़लाइज़ेशन के मुद्दों की खोज करें: यदि वहाँ की संख्याएँ मेल नहीं खातीं , तो यह अक्सर संकेत होता है कि आप साइटमैप फ़ाइल में URL निर्दिष्ट कर रहे हैं जो हमारे क्रॉलिंग के दौरान हमें नहीं मिलते। यह आमतौर पर एक संकेत है कि आपको विहितकरण पर काम करने की आवश्यकता है ।
  • विहितकरण में सहायता करें: जब हम आपकी साइट पर एक से अधिक URL दिखाते हैं जो समान सामग्री दिखाते हैं, तो हम कोई भी URL देंगे जो साइटमैप में एक अतिरिक्त किनारे पर सूचीबद्ध हो, भले ही आप अन्य विहितीकरण विधियों का उपयोग न करें।
  • अपनी साइट के बुरी तरह से अनुक्रमित भागों का पता लगाएं: इन गणनाओं को साइटमैप फ़ाइल के अनुसार आपूर्ति की जाती है, इसलिए आप अपनी साइट के तार्किक वर्गों के लिए अलग साइटमैप फ़ाइलों का निर्माण कर सकते हैं, उन क्षेत्रों की खोज करने के लिए जहां Google जितना चाहे उतना अनुक्रमित नहीं करता है।
  • क्रॉल त्रुटियों को प्राथमिकता दें: में क्रॉल त्रुटियों खंड पर जो URL Sitemaps फ़ाइलें में निर्दिष्ट किया गया अलग-अलग सूचीबद्ध कर रहे हैं। चूंकि आपने विशेष रूप से इन URL की आपूर्ति की है, इसलिए हम मानते हैं कि आप उन्हें अनुक्रमित करना चाहते हैं, और यह कि कोई भी क्रॉल त्रुटियां महत्वपूर्ण हैं।

इसके अतिरिक्त, आप साइटमैप फ़ाइलों (जैसे छवियों, वीडियो, समाचार या अंतर्राष्ट्रीयकरण के लिए) में कई एक्सटेंशन का उपयोग कर सकते हैं, क्या आपको ऐसा करने का चयन करना चाहिए। ये एक्सटेंशन सभी वैकल्पिक हैं।

अधिकांश वेबसाइटों के लिए, साइटमैप फ़ाइलों का सबसे दृश्य तत्व यह है कि आप अनुक्रमित URL गणना देख सकते हैं। प्रकट होने में एक या दो दिन लग सकते हैं, इसलिए यदि आपने पहली बार साइटमैप प्रस्तुत किया है, तो आपको थोड़ा धैर्य रखने की आवश्यकता हो सकती है। जबकि अन्य तरीके (जैसे कि एक साइट: -क्वारी) बहुत, बहुत मोटे अनुमान हैं, यह गिनती बेहद जटिल है।

जोड़ने के लिए संपादित: एक और बात जो मुझे व्यक्तिगत रूप से साइटमैप के संबंध में बेहद उपयोगी लगती है, वह यह है कि यदि आप उन्हें सीधे अपने सीएमएस के साथ नहीं बना रहे हैं, तो आप हमेशा यह पता लगा सकते हैं कि आपकी वेबसाइट कैसे क्रॉल करने योग्य है, और किस प्रकार के URL खोजे गए हैं उस प्रक्रिया के दौरान। मैंने कई मामलों को देखा है, जहां आपके पक्ष में एक उपकरण के साथ एक वेबसाइट क्रॉल करना (जैसे साइटमैप जनरेटर) उन मुद्दों को बुदबुदाएगा जिन्हें आप अन्यथा याद कर सकते हैं, हो सकता है कि URL में सत्र-आईडी, URL अंतर के माध्यम से डुप्लिकेट सामग्री, अनंत स्थान (जैसे) अंतहीन कैलेंडर के रूप में), या यहां तक ​​कि एक साइट के कुछ हिस्से जो बिल्कुल भी लिंक नहीं हैं।


बढ़िया जानकारी। मैंने यह भी सुना है कि कुछ उच्च ट्रैफ़िक वाले अत्यधिक क्रॉल की गई साइटों के साथ साइटमैप का उपयोग न करना बेहतर है क्योंकि Google बेहतर कार्य करता है क्रॉलिंग और यदि आपके साइटमैप से कुछ भी गायब है तो यह अनुक्रमित होना बंद हो सकता है।
क्रिस_ओ

3
@Chris_O आप विभिन्न समस्याओं को एक साथ मिटा रहे हैं। उस उदाहरण में, ऐसा नहीं है कि Google अपने दम पर "बेहतर" काम कर रहा है; साइटमैप ही दोषपूर्ण है। यह तर्क की एक सीधी रेखा नहीं है "सभी में साइटमैप का उपयोग न करें।" उस स्थिति का समाधान साइटमैप को ठीक करना है। इसके अतिरिक्त, साइटमैप सूचनात्मक होते हैं, निर्देश नहीं। साइटमैप से गायब होने का अर्थ यह नहीं है कि Google इसे अपने आप नहीं ढूंढेगा, या इसकी अवहेलना नहीं करेगा।
सु

विचाराधीन साइट में 40k से अधिक अनुक्रमित पृष्ठ हैं और नई सामग्री 5 मिनट से कम समय में (बिना साइट मैप के) अनुक्रमित हो जाती है। आपके उत्तर के आधार पर हम उनका निर्माण शुरू करने जा रहे हैं और उन्हें वर्षों में तोड़ देंगे।
क्रिस_ओ

@ जॉन-म्यूएलर हाय श्री। म। - मैंने एक बार 1000 URL के साथ एक परीक्षण साइटमैप प्रस्तुत किया था, हमें लगभग 700 का एक इंडेक्स काउंट वापस मिला, अब हमने साइट के माध्यम से सभी 1000 URL का परीक्षण किया: www.complete.org/url/to/the/page.html, हम वापस आ गए 700 urls (200 क्षेत्र में अधिक) के नीचे एक गणना तरीका। इसका क्या मतलब है?
फ्रांज

2
@ फ्रांज में कभी-कभी ऐसे विवरण शामिल होते हैं जो साइट: -सीरीज के साथ अनुक्रमित URL गणना को पुन: पेश करना कठिन बनाते हैं। उदाहरण के लिए, ऐसी परिस्थितियाँ होती हैं जहाँ हम कई URL जोड़ सकते हैं और उनमें से किसी एक को साइट के लिए दिखा सकते हैं: -query। इसलिए यदि आप वहां अंतर देखते हैं, तो यह आमतौर पर चिंता का विषय नहीं है।
जॉन म्यूलर

6

यदि आपको कोई त्रुटि नहीं मिल रही है, तो आप मान सकते हैं कि Google ने इसे पार्स कर दिया है और सामग्री से अवगत है। लेकिन इसका मतलब यह नहीं है कि वे उन पृष्ठों को क्रॉल और / या अनुक्रमित करेंगे। साइटमैप खोज इंजन को आपके पृष्ठों के बारे में बताने का एक और तरीका है। वे उन सभी पृष्ठों को क्रॉल और इंडेक्स करने के लिए बाध्य नहीं हैं। वही उन पर लागू होता है जो लिंक या URL सबमिशन के माध्यम से पेज ढूंढते हैं।


1
अतिरिक्त जानकारी के अनुसार, यह देखना बहुत आसान है कि Google साइटमैप को समझता है या नहीं। अनुकूलन के तहत जाँच करें -> साइटमैप। यह आपको बताएगा कि साइटमैप में कितने URL सबमिट किए गए हैं। साइटमैप सफलतापूर्वक सामग्री को पढ़ा है और इसमें यह कई लिंक मिला है। दूसरी संख्या यह है कि कितने को अनुक्रमित किया गया है और जैसा कि जॉन बताते हैं, पूरी तरह से Google पर निर्भर करता है कि क्या वे कोई भी, कुछ या आपकी अधिकांश सामग्री को सार्थक पाते हैं। यह हमेशा सबमिट की गई राशि से कम होगी, Google को बस कुछ पृष्ठ ऐसे हैं जो बहुत गर्म नहीं हैं और उनके साथ परेशान नहीं करते हैं।
फियास्को लैब्स

1

यदि आपके पास अच्छी गुणवत्ता वाले लिंक हैं, तो Google आमतौर पर आपकी वेबसाइट को क्रॉल करने का अच्छा काम करता है। यदि आपका बहुत समय आपके द्वारा अनुक्रमित पृष्ठों की संख्या को देखने में व्यतीत होता है, तो मैं आपकी साइट को बेहतर बनाने और कुछ गुणवत्ता लिंक प्राप्त करने के लिए इसका बेहतर सुझाव दूंगा।


0

शायद इस तरह एक साइटमैप सत्यापन उपकरण , हालांकि मैंने कभी भी "नहीं" नहीं देखा है साइटमैप को किक करने के लिए शुरू होता है।


फ़ाइल को पहले ही मान्य किया जा चुका है। यह सवाल नहीं है।
सु

0

बड़ी वेबसाइट के लिए, उदाहरण के लिए सैकड़ों, हजारों या लाखों पृष्ठों वाली वेबसाइट, यह काफी उपयोगी है। हम अपनी कंपनी की साइट पर 400 000 पृष्ठों के साथ थे जहाँ URL गतिशील रूप से सामग्री ID द्वारा बनाए गए थे और URL पैरामीटर & के साथ उपयोग किए गए थे, Google वेबमास्टर टूल आपको क्रॉल किए गए पृष्ठों पर प्रतिक्रिया प्रदान करेगा और आपको त्रुटियां दिखाएगा, आप पृष्ठ को डीबग या खोल सकते हैं और अपने आप को देखें कि क्या गलत है। इस तरह से Google ने वास्तव में एक बेहतर वेबसाइट बनाने में हमारी मदद की और हमें कुछ समय के लिए शर्मिंदगी से बचाया।

यह अनुक्रमित पृष्ठों की संख्या बनाम क्रॉल की संख्या को देखने के लिए भी उपयोगी है।

छोटी वेबसाइटों के लिए, यदि वेबसाइट .html पृष्ठों का एक छोटा समूह है, जहां प्रत्येक पृष्ठ मेनू और साइट के माध्यम से जुड़ा हुआ है, तो अक्सर अपडेट नहीं किया जाता है, यदि आप साइटमैप अपलोड करते हैं, तो खोज परिणामों के खिलाफ कुछ भी नहीं बदलेगा। आपके पास साइटमैप अपलोड करने वाले किसी ऐसे व्यक्ति पर कोई लाभ नहीं होगा जिसने साइटमैप अपलोड नहीं किया था।

मेरे पास लगभग 20 छोटी वेबसाइटें भी थीं, जहां मुझे क्रोन स्क्रिप्ट द्वारा उत्पन्न साइटमैप स्वचालित रूप से मिलते थे और मैंने ऐसा करना बंद कर दिया था। एक दिन मुझे पता चला कि XML फाइलें मेरी गलती से लगभग 6 महीने तक सही तरीके से नहीं बनती हैं, लेकिन Google ने शुक्र है कि मेरी गलती को नजरअंदाज कर दिया और जब साइटमैप की त्रुटियां थीं, तब भी इन वेबसाइटों को पूरी तरह से अनुक्रमित किया, Google साइटमैप का उपयोग केवल एक संकेत के रूप में करता है कि कहां जाना है, नहीं बहुत गंभीरता से।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.