Googlebot ऐसे URL कैसे खोज रहा है जो केवल प्रमाणित उपयोगकर्ताओं के लिए दृश्यमान हैं?


12

यहां मेरा एक ग्राहक है, जो अपने खाते में लॉग इन होने के बाद कुछ कार्रवाई कर रहा है। अद्वितीय टोकन केवल एक एन्क्रिप्टेड यूजर आईडी + टाइमस्टैम्प है।

94.254.xxx.xxx - - [02 / Jul / 2011: 22: 25: 46 +0200] "GET / some-action / unique-token-123abc HTTP / 1.1" 200 410 "-" "मोज़िला / 5.0 (संगत); MSIE 9.0; Windows NT 6.1; त्रिशूल / 5.0) "

अब, Googlebot ने किसी तरह इस अनूठे लिंक के बारे में पता लगाया और एक सप्ताह बाद ठीक उसी URL तक पहुंचने का प्रयास किया।

66.249.71.179 - - [10 / जुलाई / 2011: 09: 56 + 01200] "GET / कुछ-कार्रवाई / अद्वितीय-टोकन-123abc HTTP / 1.1" 302 - "-" "मोज़िला / 5.0 (संगत; Googlebot /) 2.1; + http: //www.google.com/bot.html) "

(स्थिति कोड 302 है क्योंकि टोकन समाप्त हो गया था)


मुझे इस बात पर ज़ोर देना चाहिए कि यह एक अनूठा URL है जो केवल 2 सेकंड के लिए, एक बार दिखाई दे रहा था, इससे पहले कि उपयोगकर्ता इसे क्लिक करता और उस पृष्ठ पर जाने के लिए आगे बढ़ता। यह एक ईमेल में नहीं भेजा गया था या कहीं भी सार्वजनिक रूप से प्रकाशित नहीं हुआ था।

यहाँ क्या हो रहा है, यह कैसे संभव है कि Google को यह अनूठा URL मिला?

जवाबों:


6

यह सुनिश्चित करने के लिए कहना मुश्किल है लेकिन यहाँ संभावित परिदृश्य हैं:

  • उपयोगकर्ता के पास एक ब्राउज़र टूलबार या एक्सटेंशन स्थापित है जो उन URL की रिपोर्ट करता है जो वे Google पर जाते हैं।

  • उस URL और Google से जुड़े किसी व्यक्ति ने पृष्ठ को उस लिंक के साथ क्रॉल करके पाया।


यदि आप Google टूलबार के बारे में बात कर रहे हैं तो केवल "PageRank" सुविधा को सक्षम करने के मामले में Google को वापस URL भेजते हैं, लेकिन हमने नए URL खोजने के लिए उस डेटा का उपयोग कभी नहीं किया। अगर हमारे द्वारा जारी किए गए कुछ अन्य टूलबार के बारे में, तो कृपया मुझे बताएं।
मेथोड 20

5

मैंने अभी महसूस किया कि उपयोगकर्ता को इस प्रमाणित पृष्ठ पर एक आउटबाउंड लिंक मिल गया होगा, और फिर Refererकिसी अन्य वेबसाइट पर क्लिक करते ही निजी URL को लीक कर दिया । यह एकमात्र संभव स्पष्टीकरण है, और वास्तव में शुरू से स्पष्ट होना चाहिए।

एक बार लीक होने के बाद, निजी URL Google को कई तरीकों से उजागर हो सकता है, उदाहरण के लिए लक्ष्य साइट ने सार्वजनिक रूप से अपनी पहुंच लॉग प्रकाशित की हो सकती है। नोट: आउटबाउंड लिंक में से कोई भी Google Analytics का उपयोग नहीं कर रहा था, इसलिए यह इंगित नहीं करता है कि Googlebot Analytics से रेफरल URL का उपयोग कर रहा है।

पाठ जारी किया गया: कभी भी URL में संवेदनशील डेटा डालें, जब तक कि आप https का उपयोग नहीं करते हैं, उस स्थिति में ब्राउज़र Refererखाली नहीं रहता।


1
आप सही हैं: URL में संवेदनशील डेटा डालना खतरनाक हो सकता है। जब भी आप कर सकते हैं, आपको POST अनुरोधों का उपयोग करके पृष्ठों के बीच अद्वितीय उपयोगकर्ता आईडी पास करनी चाहिए (जो URL के भाग के रूप में चर नहीं भेजते हैं, जैसे GET अनुरोध), या कुकी / सत्र चर के साथ।
निक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.