जब कोई URL Google द्वारा पहली बार अनुक्रमित किया गया था, तो मुझे कैसे पता चलेगा?


16

Google द्वारा पहली बार किसी विशेष URL को अनुक्रमित किए जाने पर मुझे कैसे पता चलेगा? मैं एक समाधान चाहता हूं जो प्रतियोगियों के URL के लिए भी काम करता है जो मेरे स्वामित्व में नहीं हैं।


1
यह बहुत संभव है कि उत्तर "नहीं" है। Google इस जानकारी को संग्रहीत भी नहीं कर सकता (क्योंकि कोई विशेष कारण नहीं है कि उन्हें क्यों करना होगा), या, यहां तक ​​कि अगर वे ऐसा करते हैं, तो वे इसे तीसरे पक्ष को उजागर नहीं कर सकते हैं।
इल्मरी करोनें

1
जैसे अन्य लोगों ने उल्लेख किया है, आप यह जानकारी प्राप्त नहीं कर सकते। यदि आपके पास सर्वर लॉग्स तक पहुंच है, तो आप देख सकते हैं कि यह पहली बार कब क्रॉल किया गया था, लेकिन इसका मतलब यह भी नहीं है कि इसे तब अनुक्रमित किया गया था।
जॉन मुएलर

जवाबों:


15

किसी URL की आयु जानने के लिए आप उस URL के स्थान पर इस लिंक का अनुसरण कर सकते हैं जिसे www.example.comआप चाहते हैं:

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

उदाहरण के लिए, स्टैक ओवरफ्लो की मेटा साइट के लिए Google का परिणाम यहां है : यहाँ छवि विवरण दर्ज करें

अन्यथा, वेबैक मशीन भी एक अच्छा समाधान है लेकिन मेरे अनुभव से कम सटीक है।


3
क्या Google की वह सुविधा अंग्रेजी में भी उपलब्ध है? आप फ़्रेंच संस्करण से जुड़े हैं।
स्टीफन Ostermiller

1
@StephenOstermiller बस से टीएलडी बदलने .frके लिए .com
MDMoore313 17

2
@Zistoloen +1 आपके उत्तर के लिए लेकिन मुझे आपकी क्वेरी में संदेह है। जैसा कि आपने कहा कि मैंने आपके उदाहरण क्वेरी का उपयोग करके www.stackexchange.com की खोज की, लेकिन यह कोई परिणाम नहीं दिखा रहा है। मैंने wwwइस समय भी इसे हटाकर खोज की है यह तारीख के लिए परिणाम दिखा रहा है Dec 1, 2014जो बहुत हाल की तारीख है जो URL की आयु नहीं हो सकती है। क्या मैं गलत खोज रहा हूं? या कुछ भी याद नहीं है?
साथिया कुमार

2
मैंने इस उत्तर को "चुराया" है और इसे बेहतर स्पष्टीकरण के साथ मेरे उत्तर में जोड़ा है। यह एक महान चाल है, जिस्टोलोइन।
स्टीफन Ostermiller

6
@Stephen और Zistoloen: यह है नहीं आम तौर पर तिथि जब पेज पहले गूगल द्वारा अनुक्रमित किया गया था। कुछ परीक्षण के आधार पर, इस पद्धति के माध्यम से दिखाई गई तिथि या तो पृष्ठ की सामग्री से खींची गई प्रतीत होती है (यदि Google को लगता है कि यह ऐसा कुछ देखती है जो "प्रकाशित" या "अंतिम तिथि पर संशोधित" जैसा दिखता है), या यदि ऐसा नहीं है सामग्री उस दिनांक में पाई जाती है, जिस तिथि के आधार पर Google ने अंतिम बार पृष्ठ में एक (पर्याप्त?) परिवर्तन देखा था। बेशक, यदि पृष्ठ को उसके पहले प्रकाशन के बाद कभी नहीं बदला गया, तो यह उसकी प्रकाशन तिथि के समान हो सकता है, लेकिन इसकी कोई गारंटी नहीं है।
इल्मरी करोनें

8

Zistoloen ने Google को उस दिनांक को प्रदर्शित करने का एक तरीका पाया जब उसने पृष्ठ की सामग्री को पहली बार अनुक्रमित किया था। मैं इसे अपने उत्तर के साथ भी जोड़ रहा हूं क्योंकि मुझे लगता है कि मैं इसे अधिक स्पष्ट रूप से समझा सकता हूं।

  1. Google को किसी ऐसी चीज़ के लिए खोजें, जिसके परिणामस्वरूप वह पृष्ठ लाया जाए जो आप चाहते हैं
  2. "खोज उपकरण" का उपयोग करें
  3. "किसी भी समय" ड्रॉप डाउन से "कस्टम रेंज ..." का चयन करें
  4. 1/1/1900 से 1/1/2020 तक एक बड़ी तिथि सीमा में रखें

इसके बाद Google उस तिथि को दिखाएगा कि उसने खोज परिणाम में पृष्ठ पर मौजूद सामग्री को खोजा था।

पहले अनुक्रमित

यदि पृष्ठ नई सामग्री से अपडेट हो जाता है, तो Google इस तिथि को भी अपडेट करता है। तो यह "पहली बार इस URL को अनुक्रमित" तारीख के बजाय "इस अनुक्रमित पहली सामग्री" तारीख से अधिक है।


जब पृष्ठ अंतिम बार अनुक्रमित किया गया था तो एक पृष्ठ के लिए Google कैश दिखाता है। आप देख सकते हैं कि स्टैक एक्सचेंज होम पेज को आज अंतिम बार अनुक्रमित किया गया था:

यहाँ छवि विवरण दर्ज करें


एक अन्य विकल्प इंटरनेट आर्काइव्स वेकबैक मशीन का उपयोग कर रहा है । इससे आपको पता चलता है कि अतीत में एक पृष्ठ कैसा दिखता था। जब पृष्ठ पहली बार प्रकाशित हुए थे, तब आप इसका पता लगा सकते हैं। Google और इंटरनेट आर्काइव दोनों पहले प्रकाशित होने के तुरंत बाद पृष्ठ को क्रॉल और उपयोग करते हैं।


1
क्या आपका पहला विकल्प सभी URL के लिए सटीक परिणाम देगा? मैंने bing.com की खोज की, जैसे आपने समझाया, लेकिन पहली बार अनुक्रमित तारीख नहीं मिलीbing.com । माफ़ करना अगर मैं गलत हूँ?
साथिया कुमार

1
यह तब तक सटीक प्रतीत होता है जब तक पृष्ठ पर सामग्री परिवर्तित नहीं हुई है। यदि पृष्ठ ओवरहाल हो जाता है तो Google इस तिथि को रीसेट कर सकता है। मेरे होमपेज पर 1 फ़र, रूप में सूचीबद्ध है, 2002 भले ही एक आंतरिक पेज 1 फरवरी, 2001 के रूप में सूचीबद्ध मुख पृष्ठ के चारों ओर बदल दिया गया उस समय जबकि आंतरिक पृष्ठ 2001 से काफी हद तक बदला नहीं गया है
स्टीफन Ostermiller

@SathiyaKumar Bing.com इस विधि का उपयोग करके मेरे लिए दिनांक 19 मार्च 2014 देता है। ध्यान दें कि कुछ भी Google द्वारा अनुक्रमित नहीं किया गया है (robots.txt या अन्यथा के माध्यम से) स्पष्ट रूप से इस तरह से नहीं दिखाया जाएगा।
Thebluefish

4

यह पता लगाने का कोई तरीका नहीं हो सकता है कि जब कोई मनमाना वेब पेज पहली बार Google द्वारा अनुक्रमित किया गया था - निश्चित रूप से मुझे ऐसा करने का कोई तरीका नहीं पता है। यह संभव है कि Google बस उस जानकारी को संग्रहीत नहीं करता है, क्योंकि कोई वास्तविक कारण नहीं है कि उन्हें इसकी आवश्यकता क्यों है। इसके अलावा, भले ही वे इस जानकारी को संग्रहीत करते हैं, लेकिन उनके पास वास्तव में इसे तीसरे पक्ष के लिए स्वतंत्र रूप से उपलब्ध कराने का कोई विशेष कारण नहीं है।

(यदि यह आपका अपना पेज है, और आपके पास अपने पुराने वेबसर्वर एक्सेस लॉग्स हैं, तो यह आसान है - बस उस पेज के लिए Googlebot से पहली यात्रा के लिए लॉग खोजें। लेकिन अन्यथा निश्चित रूप से बताने का कोई तरीका नहीं हो सकता है।)


किसी भी स्थिति में, उनके जवाब में ज़िस्टोलोइन और स्टीफन ओस्टरमिलर द्वारा वर्णित विधि आम तौर पर उस तारीख को प्रकट नहीं करती है जब किसी विशेष URL को पहली बार Google द्वारा अनुक्रमित किया गया था। इसके बजाय, यह उस तारीख को दिखाता है कि Google को लगता है कि URL पर सामग्री प्रकाशित या अंतिम रूप से अपडेट की गई थी, और अक्सर Google की अधिक या कम विश्वसनीय कोशिशों के आधार पर पृष्ठ सामग्री से ही "सूँघने" की कोशिश होती है।

में इस वीडियो , गूगल के मैट कट्स कैसे इन तिथियां चुन पर संक्षेप में छू लेती है। सुविधा के लिए, मैंने वीडियो का प्रासंगिक टुकड़ा (लगभग 2:09 से 2:22 तक) नीचे दिया है:

"... अक्सर आप तारीख को देखेंगे, जैसा कि हम यह अनुमान लगाते हैं, या जब हमने पहली बार इसे देखा था, जब भी हमने उस पृष्ठ को क्रॉल किया था, या यदि हम इसे पृष्ठ पर कहीं पा सकते हैं, और हम उस तिथि को निकाल सकते हैं, तो आप ' स्निपेट की शुरुआत में ही इसे देख लेंगे। "

ब्लॉग पोस्ट, विकी पेज या स्टैक एक्सचेंज प्रश्नों जैसे पृष्ठों के लिए, जहां सॉफ़्टवेयर चल रही साइट स्वचालित रूप से पेज पर एक सटीक निर्माण / संशोधन की तारीख की रिपोर्ट करती है, Google द्वारा रिपोर्ट की गई तारीख से इसका मिलान होने की संभावना है। अन्य प्रकार के पृष्ठों के लिए, हालाँकि, Google की तिथि स्निफ़र को अधिक परिश्रम करना पड़ता है, और यह हमेशा सही नहीं मिलता है (जो भी "सही" इस संदर्भ में मतलब हो सकता है)।

विशेष रूप से, ये तिथियां मूल रूप से यह निर्धारित करने के लिए बेकार हैं कि कितने समय पहले एक पृष्ठ को दो कारणों से अनुक्रमित किया गया था :

  • यदि किसी पृष्ठ को हाल ही में संशोधित किया गया था, और संशोधन की तारीख को पृष्ठ पर प्रमुखता से प्रदर्शित किया गया है, तो Google इसे पृष्ठ की "तिथि" के रूप में चुन सकता है, भले ही संशोधन पूरी तरह से तुच्छ हो।

    उदाहरण के लिए, यह पुराना विकी पेज (जो कि 2003 में पहली बार अनुक्रमित किया गया था। ) वर्तमान में Google द्वारा 10 नवंबर, 2014 से किया जा रहा है - जिस तारीख को इसे सबसे हाल ही में संपादित किया गया था, जैसा कि पृष्ठ के नीचे दिखाया गया है। उस तारीख को हुआ बदलाव? पृष्ठ के नीचे से केवल एक लिंक हटा रहा है।

  • इसके विपरीत, Google को बहुत पुरानी "प्रकाशन तिथियों" को स्वीकार करने में खुशी होती है यदि यह उन्हें पृष्ठ पर मिलता है - यहां तक ​​कि वे जो वर्ल्ड वाइड वेब के लॉन्च से पहले हैं ।

    उदाहरण के लिए, एक पुरानी प्रोग्रामिंग प्रतियोगिता पर यह पृष्ठ Google द्वारा 15 सितंबर, 1986 को दिनांकित है - वास्तव में पृष्ठ पर वर्णित घटना की तारीख है। इसी तरह, 1970 में एक छात्र की हड़ताल का दस्तावेजीकरण Google द्वारा 10 मई, 1970 (पृष्ठ पर स्कैन किए गए दस्तावेजों में से एक की तारीख), और इससे भी अधिक बेतुके तरीके से किया गया है, यह लिनक्स मैनुअल पेज Google द्वारा 4 नवंबर को दिनांकित किया गया है , 1989 (पृष्ठ पर उपयोग किया जाने वाला एक यादृच्छिक उदाहरण)।

    आप स्टीफन और ज़िस्टोलोइन द्वारा बताई गई कस्टम डेट रेंज खोज का उपयोग करके इस तरह के बहुत अधिक उदाहरण पा सकते हैं, लेकिन 6 अगस्त, 1991 को सीमा के ऊपरी छोर की स्थापना करें ।


वैसे आपके जवाब में आपने मुख्य रूप से स्टीफन और ज़िस्टोलोइन के जवाबों का विरोध किया था, लेकिन मुझे ओपी के सवाल के लिए कोई उचित जवाब नहीं मिला "मुझे Google द्वारा पहली बार अनुक्रमित किए जाने पर कैसे पता चलेगा?" आपके जवाब में !!
साथिया कुमार

कोई उत्तर नहीं हो सकता है , अन्य कि "आप नहीं कर सकते" या "कोई नहीं जानता कि कैसे"। लेकिन आप सही हैं, मुझे अपने उत्तर में संपादित करने दें।
इल्मरी करोनें

@llmariKaronen ओपी के वास्तविक प्रश्न के उत्तर को संपादित करने और जोड़ने के लिए।
साथिया कुमार
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.