मैंने इस प्रश्न के उत्तर पर इस तरह से शोध किया: Google का उपयोग करना क्योंकि मेरे पास यह उदाहरण है कि Google को सृजन तिथियां और संशोधित तिथियां कैसे प्राप्त होती हैं, और दिनांक स्वरूप जो Google पहचानता है। कृपया समझें कि यह जानकारी केवल कुछ पृष्ठों पर मौजूद नहीं है और मुझे बहुत सारे स्रोतों से डेटा को बाहर निकालना है, जिनमें से कुछ सीधे लागू नहीं होते हैं और इसे एक साथ टुकड़े करना प्रतीत नहीं होता है। कुछ मामलों में, जानकारी कई स्रोतों से प्राप्त होती है और हमेशा उद्धृत करने योग्य नहीं होती है।
Google इस क्रम में पृष्ठ तिथियों की तलाश करता है; URL, शीर्षक टैग, निकाय (सामग्री), मेटा-टैग, HTTP प्रतिक्रिया हेडर कम से कम जहां तक Google खोज उपकरण का संबंध है। अन्य दस्तावेजों में अन्य पैराग्राफ में, किसी भी आदेश का दस्तावेजीकरण नहीं किया गया था, लेकिन सूची पर चर्चा की गई थी और सूची की पुष्टि करने के लिए लग रहा था। यदि आप इसके बारे में सोचते हैं, तो यह उस आदेश को दर्शाता है जो एक खोज इंजन होगा; एक - अपने पृष्ठ (लिंक) की खोज करें, और दो - मेटा-टैग (छोटा विवरण) और HTTP प्रतिसाद शीर्ष लेख के अपवाद के साथ अपने पृष्ठ को ऊपर से नीचे तक (शीर्षक, निकाय और मेटा-टैग) पढ़ें। यहाँ तक की सूची है जहाँ तक उपकरण का संबंध है:https://developers.google.com/search-appliance/documentation/68/admin_crawl/Preparing#docdaterule
नोट: स्थापना की तारीख वह तारीख है जो पहले Google द्वारा अनुरोध की गई थी। निर्माण तिथि की अनुपस्थिति में, स्थापना तिथि का उपयोग किया जाता है।
1] कोई भी खोज इंजन HTTP GET अनुरोध के माध्यम से संसाधन का अनुरोध कर सकता है और वेब सर्वर डेटा पैकेट के भीतर संसाधन के साथ प्रतिक्रिया हैडर के भीतर अंतिम संशोधित तिथि देता है।
2] कोई भी सर्च इंजन HTTP HEAD रिक्वेस्ट के माध्यम से रिसोर्स की हेडर जानकारी की रिक्वेस्ट कर सकता है और वेब सर्वर रिस्पॉन्स हेडर के अंदर रिवाइज्ड डेट को रिसोर्स के बिना डेटा पैकेट के अंदर लौटाता है।
3] कोई भी खोज इंजन अनुरोध कर सकता है कि क्या किसी संसाधन को HTTP GET के साथ संसाधन का अनुरोध करके एक निश्चित तिथि से संशोधित किया गया है, यदि कोई तिथि निर्धारित की गई है। यदि दिनांक सेट के बाद से संसाधन को संशोधित किया गया है, तो वेब सर्वर 200 ओके प्रतिक्रिया के साथ प्रतिक्रिया करता है और संसाधन को लौटाता है या यदि दिनांक सेट के बाद से संसाधन को संशोधित नहीं किया गया है, तो वेब सर्वर संसाधन को वापस किए बिना 304 के साथ संशोधित नहीं है। ।
Google बैंडविड्थ को बचाने के लिए विधि # 3 का उपयोग करके कई अनुरोध करता है। आप इनको अपने वेब सर्वर लॉग फाइल में देखेंगे।
नोट: यह संभव है कि एक सामग्री प्रबंधन प्रणाली (CMS) या अन्य सॉफ़्टवेयर प्रतिक्रिया शीर्षलेख के भीतर उचित रूप से दिनांक प्रदान न कर सके।
ये तिथि उदाहरण Google उपकरण प्रलेखन से भी आते हैं, लेकिन सामान्य खोज से संबंधित अन्य स्थानों में भी मौजूद हैं। मैंने उपकरण के डॉक्यूमेंटेशन से ये डिटेल्स सिर्फ इसलिए ली क्योंकि इसे कट कर एक सूची के रूप में चिपकाया जा सकता था जहाँ अन्य जगहों पर यह उतना साफ-सुथरा नहीं था।
4] Google URL के भीतर एक तारीख की तलाश करता है। यह निम्नलिखित स्वरूपों की तलाश करता है; YYYMMDDHH - YYYY - YYYYMM।
5] Google शीर्षक टैग के भीतर एक तारीख की तलाश करता है। यह निम्नलिखित स्वरूपों की तलाश करता है; YYYMMDDHH - YYYY - YYYYMM यद्यपि मुझे संदेह है कि अन्य प्रारूपों को मान्यता दी जा सकती है। निचे देखो।
6] Google बॉडी टैग (सामग्री) के भीतर एक तारीख की तलाश करता है। यह निम्नलिखित स्वरूपों की तलाश करता है; YYYMMDDHH - YYYYMMDD - YYYYMM - YYYY - DDMMYYYY - YYMMMDD - MMDDYYYY - YYMMDY - DDMMYY - MMDYY हालांकि मुझे संदेह है कि अन्य प्रारूपों को मान्यता दी जा सकती है। निचे देखो।
नोट: यह ज्ञात है कि Google विशेष रूप से पहले H1
टैग के तहत एक तिथि के लिए दिखता है । ऐसा इसलिए है क्योंकि ब्लॉग अक्सर इस स्थान पर तारीखें डालते हैं।
7] Google इस तरह मेटा-टैग की तलाश करता है। <meta http-equiv="last-modified" content="YYYY-MM-DD@hh:mm:ss TMZ" />
Google को निम्न दिनांक स्वरूपों को पहचानने के लिए भी कहा जाता है।
YYYY-MD - YYYY.MD - YYYY / M / D - MD-YYYY - MDYYYY - M / D / YYYY - YY-MM-DD - YY.MMD - YY / MM / DD - WK, D MON, YR - WK, MON D, YR - D MON, YR - MON YYYY - MON D, YR - MON YY - YYYY-DM - YYYY.DM - YYYY / D / M - DM-YYYY - DMYYY - D / M / YYYY - DD-MM-YY - MM-DD-YY - DD / MM / YY - MM / DD / YY - YYYYMMDDHH - YYYYMMDD - YYYYMM - YYYY - DDMMYYYY - MMDDYYY - YYMMDY - DDMMYY
मैंने जो शोध पाया, उसने समय के सवाल का जवाब नहीं दिया।
उदाहरणों का हवाला देते हुए, पृष्ठ एक स्पैन टैग के अलावा तारीख के सुराग प्रदान नहीं करते हैं जिन्हें अनदेखा किया जा सकता है। यह संभव है कि एसई सॉफ्टवेयर / वेब सर्वर किसी भी प्रतिक्रिया हेडर के भीतर निर्माण और संशोधित तिथियों को वापस नहीं कर सकता है।
Google ने इन तिथियों को क्यों और कैसे प्राप्त किया यह एक अच्छा प्रश्न है जिसका समाधान कभी नहीं हो सकता है। मैं हालांकि देखता रहूंगा।