मुझे कौन से बॉट और स्पाइडर चाहिए जो मुझे robots.txt में ब्लॉक करने चाहिए?


14

के लिए:

  1. मेरी वेबसाइट की सुरक्षा बढ़ाएं
  2. बैंडविड्थ आवश्यकताओं को कम करें
  3. ईमेल पता कटाई रोकें

जवाबों:


17

कोई बॉट जो ईमेल कटाई नहीं कर रहा है या कमजोरियों के लिए आपकी साइट का परीक्षण कर रहा है, वह आपके robots.txt का सम्मान करेगा। वास्तव में ये दुर्भावनापूर्ण बॉट आपकी साइट को बेहतर मैप करने के लिए robots.txt पर देखते हैं। यदि आपके पास इसका कोई बिंदु है, तो Disallow:इसका उपयोग आपकी साइट पर बेहतर हमला करने के लिए किया जाएगा। एक हैकर जो आपकी साइट को मैन्युअल रूप से देख रहा है, को किसी भी फाइल / निर्देशिका की जांच करने के लिए अतिरिक्त समय बिताना चाहिए जिसे आप अस्वीकार करने का प्रयास कर रहे हैं।


3
दिलचस्प बिंदु। मुझे आश्चर्य है कि अगर डिस्लो सूची में एक नकली पृष्ठ जोड़ने का कोई मतलब है, जिसका एकमात्र उद्देश्य अधिनियम में ऐसे बॉट्स को पकड़ना है ताकि वे स्वचालित रूप से अवरुद्ध हो सकें।
स्टीवन सुदित

5
@ सतीवन सुदित जो बुरा विचार नहीं है। इसे हनी पॉट कहा जाएगा।
रूक

हां, यह बिल्कुल सही है, हालांकि मैं छोटी संख्या में नकली प्रविष्टियों को जोड़ने के लिए निर्देशिका संकलक (फोन किताबें, आदि) के मानक चाल के अधिक सोच रहा था ताकि थोक चोरी का पता लगा सके।
स्टीवन सुदित

यदि आप उस हनीपोट को एक टारपिट के रूप में भी इस्तेमाल करते हैं तो यह गैर-कानूनी सूचकांक को भी परेशान करेगा। यह वास्तव में स्पैमर करने के लिए काफी सामान्य है - एक हनीपोट इंडेक्सेबल ईमेल पते को छोड़ दें जो एक टारपीट ईमेल सर्वर की ओर जाता है।
मार्क हेंडरसन

@Farseeker मुझे नियम तोड़ने वालों को दंडित करने में कोई समस्या नहीं दिखती। हालांकि खराब डेटा के साथ स्पैमर को धोखा देना एक दिलचस्प मोड़ है।
रुके

4

robots.txt आपकी वेबसाइट की सुरक्षा नहीं बढ़ाएगा या ई-मेल एड्रेस कटाई को नहीं रोकेगा। robots.txt आपकी वेबसाइट के अनुभागों को छोड़ने के लिए खोज इंजन के लिए एक गाइड है। इन्हें अनुक्रमित नहीं किया जाएगा और इनका उपयोग उन सभी वर्गों के लिए किया जाना चाहिए जिन्हें आप सार्वजनिक खोज इंजन में दिखाना नहीं चाहते हैं।

हालांकि, यह किसी भी तरह से किसी अन्य बॉट को सुरक्षा बढ़ाने या ई-मेल कटाई को रोकने के लिए आपकी पूरी साइट को डाउनलोड करने से नहीं रोकेगा। सुरक्षा बढ़ाने के लिए आपको प्रमाणीकरण जोड़ने की आवश्यकता है और केवल सुरक्षित उपयोगकर्ताओं को सुरक्षित अनुभागों से परे जाने की अनुमति दें। ई-मेल एड्रेस कटाई को रोकने के लिए एक वेबसाइट पर सादे पाठ (या आसानी से समझने योग्य पाठ) में ई-मेल न डालें।


1

robots.txt सुरक्षा में आपकी सहायता नहीं करेगा। कोई भी बॉट जो कुछ छायादार करना चाहता है, वह इसे वैसे भी अनदेखा कर देगा।


0

Robots.txt फ़ाइल केवल एक अनुरोध के रूप में कार्य करती है जो बॉट्स और स्पाइडर सामग्री के कुछ टुकड़ों को अकेले छोड़ देती है; यह वास्तव में उनकी पहुंच को रोक नहीं सकता है। "अच्छे" बॉट इसका सम्मान करेंगे, लेकिन "बुरे" वाले (शायद आप जिसे ब्लॉक करना चाहते हैं) इसे अनदेखा करेंगे और वैसे भी भविष्यवाणी करेंगे।


-1

Robots.txt के बजाय, शायद आपको कैप्चा कोड का उपयोग करना होगा।


कैप्चा कोड का वेब क्रॉलर (जो कि robots.txt पतों का है) से कोई लेना-देना नहीं है।
user48838

यह एक गलत तरीका था। पूरे बिंदु यह है कि एक क्रॉलर robots.txt को अनदेखा कर सकता है, लेकिन कैप्चा कोड कम से कम इसे धीमा कर देगा, अगर यह बिल्कुल सीधा ब्लॉक नहीं करता है। गलत होने के लिए धन्यवाद।
स्टीवन सुदित
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.