Wget मैन पेज द्वारा संदर्भित "स्वचालित पुनर्प्राप्ति कार्यक्रमों" को अवरुद्ध करने के लिए "2001 का लेख" क्या है?


11

wgetआदमी पृष्ठ इस में कहा गया है, के लिए धारा के तहत --random-waitपैरामीटर:

    Some web sites may perform log analysis to identify retrieval
    programs such as Wget by looking for statistically significant
    similarities in the time between requests. [...]

    A 2001 article in a publication devoted to development on a popular
    consumer platform provided code to perform this analysis on the
    fly.  Its author suggested blocking at the class C address level to
    ensure automated retrieval programs were blocked despite changing
    DHCP-supplied addresses.

मैं पढ़ने के लिए इस लेख की एक प्रति प्राप्त करना चाहता हूं, और लेख को निर्धारित करने के लिए इंटरनेट पर कई खोजों की कोशिश की है। हालाँकि, इन सभी खोजों से मैं wgetविभिन्न वेबसाइटों पर होस्ट किए जाने के लिए मैन पेज बना सकता हूं ; और कुछ अन्य शोध पत्रों का इस विषय से कोई संबंध नहीं है।

क्या किसी को पता है कि किस लेख को संदर्भित किया जा रहा है और मैं एक प्रतिलिपि कहां प्राप्त कर सकता हूं?


मैं wget मेलिंग सूची के माध्यम से खुदाई कर रहा था और यह पाया: lists.gnu.org/archive/html/bug-wget/2015-05/msg00029.html
7171u

जवाबों:


15

भले ही कोई सीधा जवाब नहीं है, git blameऔर git logयह पता चलता है कि इस खंड को 2c41d783 में एक कमिटेटर द्वारा पेश किया गया था hniksic, जिसे हिरोवेज निकसिक कहा जाता है। उसका ईमेल पता wget की ChangeLogफ़ाइल में पाया जा सकता है (मैं इसे स्पष्ट कारणों से यहाँ प्रकाशित नहीं करूँगा)। मैं उसे सीधे पूछने का सुझाव दूंगा, क्योंकि वह अधिक पर्याप्त उत्तर देने के लिए सबसे अच्छा हो सकता है। इस समय, आप उससे यह पूछने पर विचार कर सकते हैं कि क्या वह उसके अनुसार मैनपेज को अपडेट करने का मन करेगा। ;)


4

मुझे लगता है कि यह यह लेख हो सकता है:

आधार एसएएस का उपयोग करके वेब लॉग से सार्थक डेटा बनाना

कक्षा C श्रेणियों को अवरुद्ध करने पर चर्चा करने वाला एक पैराग्राफ है:

एक बार आईपी एड्रेस को उसके कंपोनेंट्स में अलग कर देने के बाद आईपी एड्रेस की रेंज को फिल्टर करना सरल होता है। एक क्लास B फ़िल्टर पहले दो ओकटेट्स के विरुद्ध किया जाता है, जैसे 168.126.xx.xx. यह ऊपर कोड उदाहरण में चर Onetwo है। क्लास सी पर्वतमाला का आमतौर पर अधिक उपयोग किया जाता है क्योंकि वे पूरे सर्वर को लक्षित करते हैं और चार ऑक्टेट में से तीन का उपयोग करते हैं, जैसे 168.126.56.xx। ऊपर दिए गए कोड नमूने में, इस फ़ील्ड थ्री ने यह बताया कि Usrhost वेब लॉग की TCP / IP एड्रेस वैल्यू है।

और wgetउपयोगकर्ता एजेंट स्ट्रिंग-आधारित ब्लॉकिंग में एक उल्लेख :

उपयोगकर्ता एजेंट स्ट्रिंग पहचान के लिए हमारा पसंदीदा तरीका सूचकांक पैटर्न मिलान फ़ंक्शन का उपयोग करता है। उदाहरण के लिए:

if index(lowcase(agentstr), 'keynote') or
index(lowcase(agentstr), 'sureseeker') or
index(lowcase(agentstr), 'wget') or

वर्ष 2001 के लिए "लॉग एनालिसिस विंग" के लिए गोग्लिंग में यह पांचवा परिणाम था

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.