wget में ऐसा विकल्प होता है, -np
जो किसी भी मूल निर्देशिका से फ़ाइलें प्राप्त करने में अक्षम करता है। मुझे कुछ इसी तरह की जरूरत है लेकिन थोड़ा और लचीला। विचार करें:
www.foo.com/bar1/bar2/bar3/index.html
मैं सब कुछ प्राप्त करना चाहूंगा, लेकिन (पेड़ पदानुक्रम में) से अधिक नहीं bar2
(!)। तो bar2
भी मिलना चाहिए लेकिन नहीं bar1
।
क्या वेज को और अधिक चयनात्मक बनाने का एक तरीका है?
पृष्ठभूमि: मैं एक वेबसाइट को एक समान तार्किक संरचना के साथ दर्पण करने की कोशिश कर रहा हूं - शुरुआती बिंदु, फिर ऊपर, फिर नीचे। यदि wget
इस तरह के लेआउट के लिए बेहतर अनुकूल कोई अन्य उपकरण है , तो कृपया मुझे भी बताएं।
अपडेट करें
या संभव गहराई को निर्दिष्ट करने के बजाय, शायद "कोई माता-पिता नहीं है, जब तक कि वे इस या उस URL से मेल नहीं खाते"।
अपडेट २
सर्वर पर कुछ संरचना है, है ना? आप इसे एक पेड़ के रूप में देख सकते हैं। तो आम तौर पर "-नो-पैरेंट" के साथ आप कुछ बिंदु ए से शुरू करते हैं और केवल नीचे जाते हैं।
मेरी इच्छा, ऊपर जाने की क्षमता है - यह कहते हुए, इसे एक्स नोड्स, या (जो कि 100% समतुल्य है) से ऊपर जाने की अनुमति है कि इसे बी नोड (जहाँ दूरी BA = X) तक जाने की अनुमति है।
सभी मामलों में, नीचे जाने के नियम उपयोगकर्ता द्वारा परिभाषित किए गए थे (उदाहरण के लिए - केवल Y स्तर से नीचे जाएं)।
इसे कैसे स्टोर करें? वास्तव में यह वास्तव में सवाल नहीं है - wget
डिफ़ॉल्ट रूप से सर्वर संरचना को फिर से बनाता है, डरने के लिए यहां कुछ भी नहीं है, या कुछ भी ठीक करने की कोई आवश्यकता नहीं है। तो, 2 शब्दों में - हमेशा की तरह।
अपडेट ३
नीचे निर्देशिका संरचना - मान लें कि प्रत्येक निर्देशिका में R - R.html और इतने पर केवल एक फ़ाइल है। यह निश्चित रूप से सरल है क्योंकि आपके पास एक से अधिक पृष्ठ हो सकते हैं।
R
/ \
B G
/ \
C F
/ \
A D
/
E
A (A.html) मेरा शुरुआती बिंदु है, X = 2 (इसलिए B सबसे शीर्ष स्तर का नोड है जिसे मैं लाना चाहूंगा)। इस विशेष उदाहरण में इसका मतलब है कि R.html और G.html को छोड़कर सभी पृष्ठ प्राप्त करना। A.html को "शुरुआती बिंदु" कहा जाता है क्योंकि मुझे इसकी शुरुआत बी से नहीं, बल्कि से करनी है ।
अद्यतन ४
नाम का उपयोग अद्यतन 3 से किया जाता है।
wget के विकल्प www.foo.com/B/C/A/A.html
सवाल यह है कि निर्देशिका बी और नीचे से सभी पृष्ठों को प्राप्त करने के लिए क्या विकल्प हैं (यह जानते हुए कि आपको ए। Html से शुरू करना है)।
bar2
निर्देशिका और इसकी सभी सामग्री चाहते हैं। यदि ऐसा नहीं है, तो कृपया स्पष्ट करें।
bar2
लेकिन नहींbar1
? कहाँbar2
रहने वाला है? क्या होगा यदि दो या दो से अधिक डायर जो आप नहीं चाहते हैं कि उनके नाम से पहचाने जाने वाले उप-अध्यक्ष हैं, क्या उनकी सामग्री को मर्ज किया जाना चाहिए? यह केवल निश्चित रूप से पूरे लानत स्थल को प्राप्त करना आसान है और फिर अपनी इच्छानुसार चीजों को इधर-उधर करना।