मैं ब्राउज़र के बजाय Wget का उपयोग क्यों करूंगा? [बन्द है]


15

किस मामले में मुझे ब्राउज़र के बजाय Wget का उपयोग करना पसंद करना चाहिए ?

मैंने सुना है कि रिचर्ड स्टेलमैन कुछ गुमनाम कारणों के लिए एक ब्राउज़र के बजाय इसका उपयोग करता है। और जब आप Wget का उपयोग करके अपनी फ़ाइलों को प्राप्त करते हैं तो सर्वर क्या देखता है?


3
अगर मुझे केवल एक फ़ाइल डाउनलोड करने, कहने की ज़रूरत है, तो मैं ऐसा करने के लिए पूरे ब्राउज़र को खोलने के लिए संसाधनों को बर्बाद क्यों करूंगा? आपने कहाँ सुना कि स्टैलमैन wget"कुछ सुरक्षा कारणों" के लिए उपयोग करता है ?
edwinksl

3
यहाँ कम से कम चार प्रश्न हैं: 1. एक ब्राउज़र के लिए wget के क्या फायदे हैं; 2. कैसे एक वेबसर्वर के लिए पेश करता है; 3. किसी वेब ब्राउज़र पर wget का कोई गोपनीयता लाभ है; [करता है] [रिचर्ड] स्टेलमैन wget का उपयोग करते हैं, और यदि ऐसा है, तो यह गुमनामी के लिए है।
बेन एवलिंग

4
इस हिसाब से कि मैं अपना कंप्यूटिंग पेज कैसे करता हूं , स्टालमैन कुछ "बहुत पसंद करता है" का उपयोग करता है: प्रति ईमेल में वेब पेज लाना (लेकिन वह जरूरत पड़ने पर भ्रूण के पन्नों को खोलने के लिए ग्राफिकल ब्राउजर का उपयोग करता है); वह एक आलेखीय ब्राउज़र का उपयोग करके वेब को Tor के माध्यम से ब्राउज़ करता है, इसलिए ईमेल के माध्यम से प्राप्त करना एकमात्र तरीका नहीं है।
unor

3
कृपया अपनी सुनवाई
अनवर

3
«और क्या सर्वर सोचता है / देखता है जब आप Wget का उपयोग करके इसकी फाइलें प्राप्त करते हैं?» यह सोचता है कि "ओह, यह स्टैलमैन होना चाहिए! मैं उसके साथ खिलवाड़ करने के लिए सामग्री को निजीकृत करूंगा। ”
JDługosz

जवाबों:


25

आमतौर पर आप इसका उपयोग "ब्राउज़र के बजाय" कभी नहीं करेंगे। ब्राउज़र HTML रेंडर करते हैं, लिंक को क्लिक करने योग्य बनाते हैं (जैसा कि URL को किसी अन्य wget कमांड में मैन्युअल रूप से कॉपी करने के लिए विरोध किया जाता है), आदि। वस्तुतः मानव के रूप में wget का उपयोग करने के लिए कोई उल्टा नहीं है। यदि आप गोपनीयता के बारे में चिंतित हैं, तो ब्राउज़र को साफ करने के लिए एक लाख तरीके हैं (या आप एक कम फीचरफुल ब्राउज़र का उपयोग कर सकते हैं, जैसे कि यदि आप वास्तव में मानव उपयोगकर्ता इंटरफ़ेस के सभी प्रकार को नष्ट किए बिना नंगे हो सकते हैं)।

जब आप फ़ाइलों को डाउनलोड करने का एक त्वरित, सस्ता, स्क्रिप्ट करने योग्य / कमांड-लाइन तरीका चाहते हैं, तो मुख्य रूप से Wget का उपयोग किया जाता है। इसलिए, उदाहरण के लिए, आप एक वेब पेज को डाउनलोड करने के लिए एक स्क्रिप्ट में wget डाल सकते हैं जो अक्सर नए डेटा के साथ अपडेट हो जाता है, जो एक ऐसा ब्राउज़र है जिसे वास्तव में उपयोग नहीं किया जा सकता है। आप किसी वेबसाइट को क्रॉल करने और स्वचालित रूप से सहेजने के लिए wget के विभिन्न विकल्पों का उपयोग कर सकते हैं, जो कि अधिकांश ब्राउज़र कर सकते हैं, कम से कम एक्सटेंशन के बिना नहीं।

संक्षेप में, ब्राउज़र इंटरनेट पर दिखने वाले मनुष्यों के लिए अनुप्रयोग हैं, wget मशीनों और बिजली उपयोगकर्ताओं के लिए एक उपकरण है जो HTTP पर डेटा ले जा रहा है। वे जो करते हैं उसमें बहुत समान हैं (वेबसाइटों से फाइलें खींचते हैं) लेकिन उनके उपयोग में पूरी तरह से अलग हैं।

जब आप wget के साथ चीजें प्राप्त करते हैं तो कौन से सर्वर "देखें" के बारे में: सभी HTTP क्लाइंट (ब्राउज़र, wget, कर्ल, अन्य समान एप्लिकेशन) संचारित करते हैं जिसे "उपयोगकर्ता एजेंट" कहा जाता है, जो कि ब्राउज़र का वर्णन करने वाला एक स्ट्रिंग है (या इन दिनों,) यह बताता है कि ब्राउज़र में यह क्या है)। इसका उपयोग उपयोगकर्ता के ब्राउज़र के आधार पर अलग-अलग सामग्री दिखाने के लिए किया जा सकता है (यानी Google क्रोम का उपयोग करने वाले लोगों के लिए Chrome का विज्ञापन न करने की कोशिश करता है)। कुछ मूर्ख wget के उपयोगकर्ता एजेंट स्ट्रिंग को अवरुद्ध करके बिजली उपयोगकर्ता के शेननिगों को अवरुद्ध करने का प्रयास करते हैं, लेकिन आप इसके लिए क्रोम उपयोगकर्ता एजेंट स्ट्रिंग को नकली कर सकते हैं। अधिक बार यह केवल आँकड़ों के लिए उपयोग किया जाता है ताकि आप जान सकें कि विभिन्न ब्राउज़र्स कितने लोकप्रिय हैं, इसलिए आप जानते हैं कि किन लोगों को सबसे अच्छी तरह से परीक्षण करना है।

यदि आप wget के क्रॉलिंग फ़ंक्शंस का उपयोग करते हैं, तो सर्वर ज्यादातर वर्णमाला क्रम में कई तेज़ी से अनुरोधों को देखेगा। यह एक मृत जीव है जो आप अपनी साइट को स्क्रैप कर रहे हैं। यह एक उपयोगकर्ता के ब्राउज़िंग से पूरी तरह से अलग दिखता है। एक ब्राउज़र में एक मानव उपयोगकर्ता अनुरोध करने के साथ, उस पृष्ठ पर सभी छवियों के बाद हर पेज अनुरोध का पालन किया जाता है, और फिर कुछ देरी होती है, और फिर एक और यादृच्छिक पृष्ठ (या संभवतः स्पष्ट उद्देश्य वाले पृष्ठों की एक स्ट्रिंग) के लिए एक अनुरोध होता है ।


16

जैसा कि दूसरों ने उल्लेख किया है, wgetऐड-ऑन, कुकीज़ और कैश के साथ बंडल नहीं होने का लाभ है, जो इसे संभावित रूप से अधिक स्थिर और सुरक्षित बनाता है। लेकिन ब्राउज़र और wgetवास्तव में बहुत अलग सामान्य है उपयोग हैं।

wgetसामग्री को पुनः प्राप्त करने के लिए एक कमांड-लाइन उपयोगिता है, इसे प्रस्तुत करने के लिए नहीं। इसका उपयोग किसी भी फ़ाइल प्रकार (HTML, चित्र, बायनेरी, आदि) सहित FTP, HTTP और HTTPS के माध्यम से कुछ भी प्राप्त करने और डाउनलोड करने के लिए किया जा सकता है।

सर्वर के लिए, केवल यही अंतर दिखाई देगा, user agentजब तक आप --user-agentकिसी ब्राउज़र को निर्दिष्ट करने के लिए उसके तर्क का उपयोग नहीं करते, तब तक यह एक अंतर है। यदि आप करते हैं, तो सर्वर को कोई अंतर नहीं दिखेगा।


5

1) एक इंसान के बजाय एक स्क्रिप्ट द्वारा शुरू किए गए डाउनलोड

2) अलग-अलग पृष्ठों के बजाय संपूर्ण साइट (या साइटों के टुकड़े) डाउनलोड करना। (Wget स्वचालित रूप से लिंक का अनुसरण कर सकता है।)

पेज को डाउनलोड करने के अनुरोधों के बीच मनमाना विलंब सहित, नियंत्रण के लिए Wget के पास कुछ कमांड-लाइन विकल्प हैं और सोच सकते हैं। लेकिन अगर साइट सर्वर में कुछ विरोधी-बॉट नीति है, तो आप स्वीकार्य परिणाम प्राप्त करने से पहले अक्सर बड़ी मात्रा में समय और यातायात बर्बाद करते हैं।


3) जब कोई ब्राउज़र आसानी से सुलभ (जैसे ssh पर) कोई ब्राउज़र द्वारा शुरू किया गया हो तो डाउनलोड करें
Dezza

4

एक ब्राउज़र का उपयोग करते समय उसके भीतर कुछ भी सक्रिय होता है, जिसमें अवांछनीय एडऑन और यहां तक ​​कि मैलवेयर भी शामिल है, जबकि विग एक साधारण कमांड है जो सामान डाउनलोड करता है और बिल्कुल कुछ नहीं करता है।

ब्राउज़र आवश्यक रूप से कम सुरक्षित नहीं है लेकिन संभावित रूप से ऐसा है।

सर्वर हमेशा की तरह एक डाउनलोड अनुरोध "देखें"।


4

ब्राउज़र आपकी गतिविधियों को इतिहास और कैश फ़ाइलों में रिकॉर्ड कर सकता है।

wget की कोई स्मृति अवधारण नहीं है।

कहा कि एक ब्राउज़र अधिक सुविधाजनक है और मुझे इस बात की कोई परवाह नहीं है कि 4.7.2-040702-genericपिछले सप्ताह डाउनलोड किए गए एनएसए के आंकड़े क्या हैं । मैं अपने ब्राउज़र का उपयोग ऑन-लाइन बैंकिंग और पेपाल के लिए करता हूं जो यकीनन अधिकांश फाइलों की तुलना में अधिक महत्वपूर्ण है जिन्हें मैं wget के साथ डाउनलोड कर सकता हूं।


2

एक डेवलपर जो दूरस्थ उबंटू प्रतिष्ठानों का उपयोग करता है, के रूप में ओएस जीयूआई स्थापित करने में अक्सर बहुत कम बिंदु होता है। इस 'कमांड लाइन' वातावरण में, वेब से फ़ाइलों को डाउनलोड करने के लिए wget एक आवश्यक उपकरण है।

मुझे यह भी निश्चित नहीं है कि यदि कोई हो, तो ब्राउज़र को टर्मिनल से चलाया जा सकता है।


2
w3m एक महान टर्मिनल ब्राउज़र है :) en.wikipedia.org/wiki/W3m
kalenpw

lynx एक और lynx.browser.org है
rviertel
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.