जूमला अनजान बॉट्स को कैसे ब्लॉक करें


9

मैं अज्ञात बॉट्स को कैसे ब्लॉक कर सकता हूं जो मेरे जूमला 3.3.6 साइट के बहुत अधिक बैंडविड्थ ले रहे हैं? मैं याहू, गूगल और एमएसएन बॉट्स, केवल अन्य को ब्लॉक नहीं करना चाहता। मैंने अपने हाल के अज़ात की जाँच की; लगभग 10,720 + 265 हिट आज अज्ञात बॉट्स द्वारा हैं और लगभग 1 जीबी बैंडविड्थ की खपत करते हैं।

मैं सकारात्मक समाधान के लिए तत्पर हूं।

जवाबों:


7

आप User-agentसंपत्ति का उपयोग करके अपनी साइट को क्रॉल करने के लिए केवल याहू, Google और एमएसएन बॉट की अनुमति दे सकते हैं। Disallow:अनुमत क्रॉलर के लिए बस खाली छोड़ दें ।

स्लुरप याहू का बॉट है।

उदाहरण के लिए:

User-agent: Googlebot
Disallow: /administrator
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
User-agent: googlebot-image
 Disallow: /administrator
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/ 
User-agent: googlebot-mobile
Disallow: /administrator
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/ 
User-agent: MSNBot
Disallow: /administrator
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/ 
User-agent: Slurp
Disallow: /administrator
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/ 
User-agent: yahoo-mmcrawler
Disallow: /administrator
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
User-agent: psbot
Disallow: /administrator
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
User-agent: yahoo-blogs/v3.9
Disallow: /administrator
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/ 
User-agent: *
Disallow: /
Disallow: /administrator
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/

बहुत बहुत धन्यवाद, मैं कैसे कर सकता हूँ .htaccess फ़ाइल के माध्यम से? क्या कोई अपडेट की गई खराब बॉट सूची है?
नईम

रूट डायरेक्टरी में टेक्स्ट फाइल robots.txt बनाएं। जूमला पहले से ही एक है। आप देख सकते हैं।
झांकोका

मुझे लगता है कि इसके लिए एक robots.txt फ़ाइल होना हमेशा अच्छा होता है और फिर उन बॉट्स के लिए इनटैक्सेस हो जाता है जो उन्हें आईपी या उपयोगकर्ता एजेंट द्वारा ब्लॉक करने के लिए नहीं सुनते हैं
tristanbailey

4

आप इस निकोटियन के मास्टर Htaccess से इस स्निपेट के साथ कई ज्ञात खराब बॉट्स को ब्लॉक कर सकते हैं :

########## Begin - Common hacking tools and bandwidth hoggers block
## By SigSiu.net and @nikosdion.
# This line also disables Akeeba Remote Control 2.5 and earlier
SetEnvIf user-agent "Indy Library" stayout=1
# WARNING: Disabling wget will also block the most common method for
# running CRON jobs. Remove if you have issues with CRON jobs.
SetEnvIf user-agent "Wget" stayout=1
# The following rules are for bandwidth-hogging download tools
SetEnvIf user-agent "libwww-perl" stayout=1
SetEnvIf user-agent "Download Demon" stayout=1
SetEnvIf user-agent "GetRight" stayout=1
SetEnvIf user-agent "GetWeb!" stayout=1
SetEnvIf user-agent "Go!Zilla" stayout=1
SetEnvIf user-agent "Go-Ahead-Got-It" stayout=1
SetEnvIf user-agent "GrabNet" stayout=1
SetEnvIf user-agent "TurnitinBot" stayout=1
# This line denies access to all of the above tools
deny from env=stayout
########## End - Common hacking tools and bandwidth hoggers block

1

आप इनकैप्सुला जैसी सीडीएन अटैक स्कैनिंग सेवाओं में से एक को भी देख सकते हैं। इसका मतलब आपके डीएनएस को बदलना है लेकिन उनके पास एक अच्छी स्क्रीन और जूमला सपोर्ट है, जिसके लिए मैं उनके पेज पर लॉगइन कर सकता हूं और व्यक्तिगत हमलों और बॉट की अनुमति दे सकता हूं। उनके पास जेसीई और इसी तरह के http://www.incapsula.com/?src=6&subelm=holdingbay.co.uk जैसे हमलों की एक अद्यतन सूची है

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.