मुझे बहुत संदेह है कि किसी पोस्ट या लेख की प्रकाशित तिथि <lastmod>
XML साइटमैप में प्रविष्टि (जैसा कि अन्य लोगों ने सुझाव दिया है) या उस मामले के लिए अंतिम-संशोधित HTTP हेडर पर आधारित है। एक XML साइटमैप केवल सलाहकार है, आधिकारिक नहीं। किसी दस्तावेज़ की अंतिम संशोधित तिथि संभवतः एक लेख की मूल (मूल) प्रकाशित तिथि के समान नहीं है। और, जैसा कि मैंने पृष्ठ के शीर्ष पर अपनी टिप्पणी में उल्लेख किया है, दस्तावेज़ की अंतिम संशोधित तिथि संभवतः कैशिंग के लिए अधिक महत्वपूर्ण है और शायद क्रॉल दरों का निर्धारण करती है। गतिशील रूप से उत्पन्न पृष्ठों के अंतिम-संशोधित HTTP हेडर अक्सर वास्तविक तिथि / समय के करीब होते हैं (जैसा कि यह वर्डप्रेस ब्लॉग के लिए है)।
दूसरी ओर RSS / Atom फ़ीड में सूचना की यह विशिष्ट डली होती है। और वास्तव में, Wordpress साइटों पर जो सामग्री में प्रकाशित तिथि को शामिल नहीं करती है, Google की खोज परिणामों में प्रकाशित तिथि अभी भी दिखाई देती है। और जहां तक मैं बता सकता हूं, यह आरएसएस फ़ीड में तारीख से मेल खाता है।
EDIT # 1: हालाँकि, RSS फ़ीड में सभी पृष्ठ शामिल नहीं हैं। ज्यादातर मामलों में इसमें केवल नवीनतम या सबसे हाल ही में अपडेट किए गए पृष्ठ होने चाहिए। लेकिन ऐसा कोई कारण नहीं है कि Google को यह भूल जाना चाहिए कि उसने पहले से ही क्या पढ़ा है, और उस पेज की सामग्री प्रदान नहीं की गई है और फिर न तो अंतिम संशोधित तिथि होनी चाहिए।
अगर कोई RSS फ़ीड नहीं है, तो मुझे लगता है कि Google पृष्ठ सामग्री का विश्लेषण करने के लिए पर्याप्त चतुर है। विशेष रूप से अगर तारीखों को माइक्रोफ़ॉर्मेट्स की मदद से 'शब्दार्थ' के रूप में चिह्नित किया जाता है । यह पूरी तरह से संभव है कि Google एक लेख के लिए आधिकारिक प्रकाशित तिथि के रूप में निम्नलिखित को देखेगा कि यह भीतर निहित है:
<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>
Google निश्चित रूप से माइक्रोफ़ॉर्मेट्स - hCard, hReview, आदि पढ़ता है
बस जोड़ने के लिए, मुझे नहीं लगता कि Google एक प्रकाशित तिथि बताएगा जब तक कि यह कुछ आधिकारिक नहीं मिल पाएगा जो यह सुझाव देगा। यह सट्टा डेटा पर एक 'प्रकाशित तिथि' को कम करने के लिए नहीं जा रहा है, क्योंकि एक गलत 'प्रकाशित तिथि' किसी के लिए उपयोग नहीं है और Google को इसके लिए बहुत सारी छड़ी मिल जाएगी!
और सिर्फ रिकॉर्ड के लिए (अगर @ टोम सुझाव दे रहा है तो :) मुझे लगता है कि पोस्ट / लेख प्रकाशित तिथि को स्पष्ट रूप से प्रदर्शित करना चाहिए। कई नहीं करते हैं, और यह विशेष रूप से प्रौद्योगिकी के मुद्दों पर शोध करते समय पाठक के लिए निराशाजनक हो सकता है और आप पाते हैं कि लेख के माध्यम से आधा रास्ता पढ़ा है यह तारीख से बाहर है!
EDIT # 2: मैंने तब से इसी तरह की झुंझलाहट का अनुभव किया है कि @mmdanziger ने अपने जवाब में इसका विवरण दिया है। मेरी एक पुरानी साइट पर मेरे पास हर पृष्ठ के शीर्ष पर (जावास्क्रिप्ट के साथ पृष्ठ पर लिखे गए ) के रूप में "साइट अंतिम अपडेट सन 17 जून 2012" (किसी भी विशेष तरीके से चिह्नित नहीं) का पाठ है ! यह वही तिथि Google द्वारा ली गई है और अब SERPS में दिखाई देने वाले कई (लेकिन सभी नहीं) पृष्ठों के साथ दिखाई देती है - यह निश्चित रूप से पृष्ठ की प्रकाशित तिथि नहीं है। ऐसा लगता है कि Google "अंतिम अद्यतन ( डेटास्ट्रीमिंग )" फ़ॉर्म की एक स्ट्रिंग के लिए पृष्ठ को केवल स्क्रैप कर रहा है (जावास्क्रिप्ट संसाधित किया गया है!)। इस विशेष साइट में RSS फ़ीड नहीं है। साइट में साइटमैप। Xml फ़ाइल है, लेकिन दिनांक अलग-अलग हैं।
मैंने अन्य साइटों पर भी इसी तरह का व्यवहार देखा है।