wget --content-disposition 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
आपके द्वारा डाउनलोड की जा रही फ़ाइल एक tar
संग्रह (एक बाइनरी फ़ाइल) है, जो एक वेब सर्वर से गतिशील लिंक द्वारा प्रदान की जाती है। wget
सामान्य रूप से आपके द्वारा उपयोग किए जा रहे URL के हिस्से का उपयोग करके फ़ाइल को सहेजा जा सकता है, लेकिन इस मामले में यह केवल एक REST API समापन बिंदु (या कुछ इसी तरह) है, इसलिए नाम के साथ काम करने के लिए अमित्र होगा (यह अभी भी एक मान्य नाम होगा और फ़ाइल सामग्री समान होगी)।
हालांकि, इस मामले में सर्वर एक "सामग्री विवाद" शीर्षक प्रदान करता है जिसमें वास्तविक फ़ाइल नाम होता है, जो विकल्प wget
का उपयोग करने पर उपयोग करने में सक्षम --content-disposition
होता है। इस विकल्प को मेरे मैनुअल में "प्रयोगात्मक" के रूप में चिह्नित किया गया है wget
।
आपको URL को भी उद्धृत करने की आवश्यकता है ताकि शेल इसमें &
और ?
वर्णों की व्याख्या न करे ।
समतुल्य वस्तु का उपयोग curl
:
curl -J -O 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
या, बराबर लंबे विकल्पों का उपयोग करते हुए:
curl --remote-header-name --remote-name 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
एक बार जब आप फ़ाइल डाउनलोड कर लेते हैं, तो आपको इसे अनपैक करना होगा:
tar -xvf GSE48191_RAW.tar
इस विशेष संग्रह को बनाने के तरीके के कारण, यह संग्रह की फ़ाइलों को वर्तमान निर्देशिका में अनपैक कर देगा (इसलिए एक नई निर्देशिका बनाना, संग्रह को वहां ले जाना और वहां एक अच्छा विचार हो सकता है)। यह संग्रहण में फ़ाइलों हैं gzip
-compressed CEL
फ़ाइलें।