यदि डेटा दैनिक रूप से अपडेट नहीं किया जाता है तो क्या Google दैनिक अपडेट में <lastmod> टैग को दंडित करता है?


10

मुझे एक साइटमैप मिला है जो उत्पाद पृष्ठों के बहुत सारे लिंक के साथ दैनिक रूप से उत्पन्न होता है। इन उत्पादों को दैनिक रूप से किसी अन्य डेटा स्रोत से आयात किया जाता है। क्योंकि अद्यतन में सभी मौजूदा उत्पाद जानकारी को फेंकना और नई आयातित जानकारी के साथ अंतिम संशोधित तिथि हमेशा एक दिन कूदना शामिल है। इसका उपयोग साइटमैप में भी किया जाता है। यहां तक ​​कि उन उत्पादों के लिए जो परिवर्तित नहीं हुए हैं। सभी उत्पाद पृष्ठ अपडेट किए जाने का दिखावा करते हैं।

क्या Google उन पृष्ठों को दिखाने के लिए वेबसाइट को दंडित करेगा जो दिन-प्रतिदिन बदल गए हैं, जबकि वे नहीं हैं?

मेरा समाधान केवल प्रविष्टि को बदलने के लिए होगा यदि नया आयातित उत्पाद डेटा पिछले डेटा से भिन्न होता है। मैं सिर्फ यह सुनिश्चित करना चाहता हूं कि यह बनाने के लिए एक उपयोगी अपग्रेड है, जबकि मैं अपना समय अन्य सुधारों पर भी खर्च कर सकता हूं।

जवाबों:


5

मैंने इसके कारण दंड के बारे में कभी नहीं सुना है। कम से कम आप मकड़ी का समय बर्बाद कर रहे हैं, लेकिन इसका एक हिस्सा यह है कि हमारे पास पहले स्थान पर कंप्यूटर क्यों हैं: थकाऊ दोहरावदार चीजें करना। फिर भी, आपको आदर्श रूप से मुद्दे को संबोधित करना चाहिए

इस...

मेरा समाधान केवल प्रविष्टि को बदलने के लिए होगा यदि नया आयातित उत्पाद डेटा पिछले डेटा से भिन्न होता है।

... क्या आप पहली जगह में होना चाहिए, बाहरी विचारों की परवाह किए बिना जैसे साइटमैप, आदि। यदि आपकी सामग्री अलग नहीं है (और मैं उस विवरण में समान जानकारी के साथ हटाने और प्रतिस्थापित करना शामिल करूंगा), तो आपकी lastmodतारीख को कंधा देना चाहिए 'संशोधित नहीं किया जाएगा। यहां आप अपने संसाधनों को बर्बाद कर रहे हैं। आपने यह नहीं कहा है कि कितने उत्पाद शामिल हैं, लेकिन एक बिंदु है जहां यह प्रक्रिया धीमी और कम्प्यूटेशनल रूप से महंगी होने जा रही है।


मैं पूरी तरह सहमत हूँ। हालाँकि, मैं दूसरी कंपनी पर निर्भर हूं जो डेटा डिलीवर करती है। वे हमेशा हर उत्पाद (+200) को अपने डेटा निर्यात में भेजते हैं। इसलिए बहुत कुछ अपडेट करना कुछ साल पहले सबसे अच्छा समाधान था। मेरे ग्राहक के पास इसे ठीक से हल करने के लिए बजट नहीं है। ये पूर्व / आयात रात में होते हैं, इसलिए अतिरिक्त उपयोग किए गए संसाधन इस समय बड़ी समस्या नहीं हैं।
एलिकिट

@ यदि आपके पास अभी भी यह समस्या है, तो बस डेटा निर्यात को उनके मूल, पार्स करने योग्य प्रारूप में एक दिन पहले से संग्रहीत करें और देखें कि उत्पादों में क्या बदलाव हुआ है इसकी तुलना करें। हालाँकि यह अच्छा है, आपको उन्हें केवल परिवर्तित उत्पाद भेजने की आवश्यकता नहीं है; आपको इसका पता लगाने में सक्षम होना चाहिए।
बेनामी पेंगुइन

3

मैंने <lastmod>हर दिन अपडेट करने के विचार को पसंद नहीं किया है क्योंकि यह सिर्फ गलत नहीं है, यह खोज इंजन को भ्रमित कर रहा है।

एक में इतने पर पर पोस्ट , गूगल के गैरी Illyés लिखा है:

Lastmod टैग साइटमैप में वैकल्पिक है और अधिकांश मामलों में इसे खोज इंजन द्वारा अनदेखा किया जाता है, क्योंकि वेबमास्टर इसे सही रखते हुए एक भयानक कार्य कर रहे हैं।

मैंने आमतौर पर या तो <lastmod>सही तरीके से उपयोग करने की वकालत की है, या बिल्कुल नहीं। इसे बंद छोड़कर (और साथ ही <changefreq>और <priority>) भी फ़ाइल स्वयं छोटा होता है और जल्दी खोज इंजन में अच्छी तरह से पढ़ने के लिए।


2

नहीं। Google lastmodएक संकेत के रूप में उपयोग करेगा (सभी साइटमैप मानों के समान) लेकिन यदि यह निर्णय लेता है कि आपकी सामग्री दैनिक अपडेट नहीं हो रही है, तो वह इसे अनदेखा कर देगा और अपने समय पर अपने पृष्ठों को फिर से देखेगा।


2

मैं Google के लिए काम नहीं करता हूं, और यह सुनिश्चित करने के लिए नहीं कह सकता कि वे वास्तव में क्या करते हैं, लेकिन टाइमस्टैम्प के इलाज के लिए उनके लिए समझदार तरीका यह होगा कि वे <lastmod>उन संकेतों को फिर से क्रॉल न करें जो बदल नहीं गए हैं।

इसलिए यदि आप अपने सभी पृष्ठों को प्रतिदिन परिवर्तित किए जाने की रिपोर्ट करते हैं, तो Googlebot आपके सभी पृष्ठों को केवल उसी क्रम में क्रॉल करता रहेगा, जो उसे लगता है कि केवल उन पृष्ठों पर ध्यान केंद्रित करने के बजाय जो बदल गए हैं। वास्तव में, यह ऐसा ही है जैसे आपने किसी अंतिम संशोधन टाइमस्टैम्प की रिपोर्ट नहीं की है।

सही <lastmod>टाइमस्टैम्प प्रदान करने का मुख्य कारण Google की अनुक्रमणिका में आपकी साइट में तेज़ी से बदलाव करना है। यदि आपकी साइट पर सैकड़ों पृष्ठ हैं, तो Google को उन सभी को क्रॉल करने और किसी भी परिवर्तन को खोजने में थोड़ा समय लगेगा। हालाँकि, यदि आप Googlebot को बताते हैं कि हाल ही में कौन से पृष्ठ बदले गए हैं, तो यह उन पृष्ठों को पहले क्रॉल कर सकता है और बाकी पर इतना समय बर्बाद करने से बच सकता है।

बेशक, आप इसके बजाय वेबमास्टर टूल्स में Googlebot की क्रॉल दर से टकरा सकते हैं और सर्वश्रेष्ठ की उम्मीद कर सकते हैं। लेकिन वास्तव में, अपनी अपडेट स्क्रिप्ट को टाइमस्टैम्प को संरक्षित करने के लिए बहुत कठिन नहीं होना चाहिए। उदाहरण के लिए, मुझे लगता है कि आप वर्तमान में ऐसा कुछ कर रहे हैं:

for each product do:
    write new page content into product page file;
end do;

यदि हां, तो बस इसे कुछ इस तरह से बदलें:

for each product do:
    read old page content from product page file into string A;
    write new page content into string B;
    if A is not equal to B then:
        write string B into product page file;
    end if;
end do;

2

नहीं, यह केवल आपके द्वारा दी गई जानकारी को गलत होने पर अनदेखा करता है। इस मामले में, वेब क्रॉलर स्वयं यह पता लगाते हैं कि उन्हें आपके पृष्ठों को कितनी बार क्रॉल करना चाहिए।


लिंक टूट गया है ...
विक्टर श्रोडर

1

इसके लिए Google आपको दंड नहीं देगा। जुर्माना पाने के लिए आपको वास्तव में Google के गधे पर काली टोपी पहनने की आवश्यकता है, इसलिए इसके बारे में चिंता न करें। यदि आपको सामग्री में परिवर्तन हुआ है, तो Google जल्द ही यह पता लगा लेगा (कि पिछले कुछ वर्षों से वे क्या काम कर रहे हैं) और एक संकेत के रूप में अंतिम संपत्ति का उपयोग करें।


1

मेरा सुझाव है कि आप XML साइटमैप और RSS / एटम फ़ीड के लिए इस सर्वोत्तम अभ्यास को पढ़ें

अंतिम संशोधन समय

XML साइटमैप और RSS / Atom फ़ीड में प्रत्येक URL के लिए अंतिम संशोधन समय निर्दिष्ट करें। अंतिम संशोधन समय अंतिम समय होना चाहिए ताकि पृष्ठ की सामग्री सार्थक रूप से बदल जाए। यदि कोई परिवर्तन खोज परिणामों में दिखाई देने वाला है, तो अंतिम संशोधन समय इस परिवर्तन का समय होना चाहिए।

XML sitemap uses  <lastmod>
RSS uses <pubDate>
Atom uses <updated>

अंतिम संशोधन समय को सही ढंग से सेट या अपडेट करना सुनिश्चित करें:

Specify the time in the correct format: W3C Datetime for XML sitemaps, RFC3339 for Atom and RFC822 for RSS.
Only update modification time when the content changed meaningfully.
Don’t set the last modification time to the current time whenever the sitemap or feed is served.

अद्यतन करने के लिए धन्यवाद। उम्मीद है कि डाउनवॉटर इसे देखेंगे और अपने वोट को उलट देंगे।
जॉन कोंडे
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.