Google द्वारा पहली बार किसी विशेष URL को अनुक्रमित किए जाने पर मुझे कैसे पता चलेगा? मैं एक समाधान चाहता हूं जो प्रतियोगियों के URL के लिए भी काम करता है जो मेरे स्वामित्व में नहीं हैं।
Google द्वारा पहली बार किसी विशेष URL को अनुक्रमित किए जाने पर मुझे कैसे पता चलेगा? मैं एक समाधान चाहता हूं जो प्रतियोगियों के URL के लिए भी काम करता है जो मेरे स्वामित्व में नहीं हैं।
जवाबों:
किसी URL की आयु जानने के लिए आप उस URL के स्थान पर इस लिंक का अनुसरण कर सकते हैं जिसे www.example.com
आप चाहते हैं:
https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl
उदाहरण के लिए, स्टैक ओवरफ्लो की मेटा साइट के लिए Google का परिणाम यहां है :
अन्यथा, वेबैक मशीन भी एक अच्छा समाधान है लेकिन मेरे अनुभव से कम सटीक है।
.fr
के लिए .com
।
www
इस समय भी इसे हटाकर खोज की है यह तारीख के लिए परिणाम दिखा रहा है Dec 1, 2014
जो बहुत हाल की तारीख है जो URL की आयु नहीं हो सकती है। क्या मैं गलत खोज रहा हूं? या कुछ भी याद नहीं है?
Zistoloen ने Google को उस दिनांक को प्रदर्शित करने का एक तरीका पाया जब उसने पृष्ठ की सामग्री को पहली बार अनुक्रमित किया था। मैं इसे अपने उत्तर के साथ भी जोड़ रहा हूं क्योंकि मुझे लगता है कि मैं इसे अधिक स्पष्ट रूप से समझा सकता हूं।
इसके बाद Google उस तिथि को दिखाएगा कि उसने खोज परिणाम में पृष्ठ पर मौजूद सामग्री को खोजा था।
यदि पृष्ठ नई सामग्री से अपडेट हो जाता है, तो Google इस तिथि को भी अपडेट करता है। तो यह "पहली बार इस URL को अनुक्रमित" तारीख के बजाय "इस अनुक्रमित पहली सामग्री" तारीख से अधिक है।
जब पृष्ठ अंतिम बार अनुक्रमित किया गया था तो एक पृष्ठ के लिए Google कैश दिखाता है। आप देख सकते हैं कि स्टैक एक्सचेंज होम पेज को आज अंतिम बार अनुक्रमित किया गया था:
एक अन्य विकल्प इंटरनेट आर्काइव्स वेकबैक मशीन का उपयोग कर रहा है । इससे आपको पता चलता है कि अतीत में एक पृष्ठ कैसा दिखता था। जब पृष्ठ पहली बार प्रकाशित हुए थे, तब आप इसका पता लगा सकते हैं। Google और इंटरनेट आर्काइव दोनों पहले प्रकाशित होने के तुरंत बाद पृष्ठ को क्रॉल और उपयोग करते हैं।
bing.com
। माफ़ करना अगर मैं गलत हूँ?
यह पता लगाने का कोई तरीका नहीं हो सकता है कि जब कोई मनमाना वेब पेज पहली बार Google द्वारा अनुक्रमित किया गया था - निश्चित रूप से मुझे ऐसा करने का कोई तरीका नहीं पता है। यह संभव है कि Google बस उस जानकारी को संग्रहीत नहीं करता है, क्योंकि कोई वास्तविक कारण नहीं है कि उन्हें इसकी आवश्यकता क्यों है। इसके अलावा, भले ही वे इस जानकारी को संग्रहीत करते हैं, लेकिन उनके पास वास्तव में इसे तीसरे पक्ष के लिए स्वतंत्र रूप से उपलब्ध कराने का कोई विशेष कारण नहीं है।
(यदि यह आपका अपना पेज है, और आपके पास अपने पुराने वेबसर्वर एक्सेस लॉग्स हैं, तो यह आसान है - बस उस पेज के लिए Googlebot से पहली यात्रा के लिए लॉग खोजें। लेकिन अन्यथा निश्चित रूप से बताने का कोई तरीका नहीं हो सकता है।)
किसी भी स्थिति में, उनके जवाब में ज़िस्टोलोइन और स्टीफन ओस्टरमिलर द्वारा वर्णित विधि आम तौर पर उस तारीख को प्रकट नहीं करती है जब किसी विशेष URL को पहली बार Google द्वारा अनुक्रमित किया गया था। इसके बजाय, यह उस तारीख को दिखाता है कि Google को लगता है कि URL पर सामग्री प्रकाशित या अंतिम रूप से अपडेट की गई थी, और अक्सर Google की अधिक या कम विश्वसनीय कोशिशों के आधार पर पृष्ठ सामग्री से ही "सूँघने" की कोशिश होती है।
में इस वीडियो , गूगल के मैट कट्स कैसे इन तिथियां चुन पर संक्षेप में छू लेती है। सुविधा के लिए, मैंने वीडियो का प्रासंगिक टुकड़ा (लगभग 2:09 से 2:22 तक) नीचे दिया है:
"... अक्सर आप तारीख को देखेंगे, जैसा कि हम यह अनुमान लगाते हैं, या जब हमने पहली बार इसे देखा था, जब भी हमने उस पृष्ठ को क्रॉल किया था, या यदि हम इसे पृष्ठ पर कहीं पा सकते हैं, और हम उस तिथि को निकाल सकते हैं, तो आप ' स्निपेट की शुरुआत में ही इसे देख लेंगे। "
ब्लॉग पोस्ट, विकी पेज या स्टैक एक्सचेंज प्रश्नों जैसे पृष्ठों के लिए, जहां सॉफ़्टवेयर चल रही साइट स्वचालित रूप से पेज पर एक सटीक निर्माण / संशोधन की तारीख की रिपोर्ट करती है, Google द्वारा रिपोर्ट की गई तारीख से इसका मिलान होने की संभावना है। अन्य प्रकार के पृष्ठों के लिए, हालाँकि, Google की तिथि स्निफ़र को अधिक परिश्रम करना पड़ता है, और यह हमेशा सही नहीं मिलता है (जो भी "सही" इस संदर्भ में मतलब हो सकता है)।
विशेष रूप से, ये तिथियां मूल रूप से यह निर्धारित करने के लिए बेकार हैं कि कितने समय पहले एक पृष्ठ को दो कारणों से अनुक्रमित किया गया था :
यदि किसी पृष्ठ को हाल ही में संशोधित किया गया था, और संशोधन की तारीख को पृष्ठ पर प्रमुखता से प्रदर्शित किया गया है, तो Google इसे पृष्ठ की "तिथि" के रूप में चुन सकता है, भले ही संशोधन पूरी तरह से तुच्छ हो।
उदाहरण के लिए, यह पुराना विकी पेज (जो कि 2003 में पहली बार अनुक्रमित किया गया था। ) वर्तमान में Google द्वारा 10 नवंबर, 2014 से किया जा रहा है - जिस तारीख को इसे सबसे हाल ही में संपादित किया गया था, जैसा कि पृष्ठ के नीचे दिखाया गया है। उस तारीख को हुआ बदलाव? पृष्ठ के नीचे से केवल एक लिंक हटा रहा है।
इसके विपरीत, Google को बहुत पुरानी "प्रकाशन तिथियों" को स्वीकार करने में खुशी होती है यदि यह उन्हें पृष्ठ पर मिलता है - यहां तक कि वे जो वर्ल्ड वाइड वेब के लॉन्च से पहले हैं ।
उदाहरण के लिए, एक पुरानी प्रोग्रामिंग प्रतियोगिता पर यह पृष्ठ Google द्वारा 15 सितंबर, 1986 को दिनांकित है - वास्तव में पृष्ठ पर वर्णित घटना की तारीख है। इसी तरह, 1970 में एक छात्र की हड़ताल का दस्तावेजीकरण Google द्वारा 10 मई, 1970 (पृष्ठ पर स्कैन किए गए दस्तावेजों में से एक की तारीख), और इससे भी अधिक बेतुके तरीके से किया गया है, यह लिनक्स मैनुअल पेज Google द्वारा 4 नवंबर को दिनांकित किया गया है , 1989 (पृष्ठ पर उपयोग किया जाने वाला एक यादृच्छिक उदाहरण)।
आप स्टीफन और ज़िस्टोलोइन द्वारा बताई गई कस्टम डेट रेंज खोज का उपयोग करके इस तरह के बहुत अधिक उदाहरण पा सकते हैं, लेकिन 6 अगस्त, 1991 को सीमा के ऊपरी छोर की स्थापना करें ।