Wget का उपयोग करते समय कुकीज़ का प्रारूप?


31

की नेटस्केप प्रारूप है wgetकी cookies.txt? मुझे एक वेबसाइट को मिरर करने की आवश्यकता है जिसमें लॉगिन की आवश्यकता है। मैं एक क्रोम एक्सटेंशन का उपयोग करता हूं जो उस प्रारूप में कुकीज़ लौटाता है, मैं उन्हें सहेजता हूं cookies.txt, wgetकमांड के साथ आयात करता हूं , लेकिन कोई फायदा नहीं है, यह सिर्फ उस सामग्री को डाउनलोड करता है जैसे मैं लॉग इन नहीं हूं।

मैं किसी भी मदद की सराहना करता हूं।

जवाबों:


46

प्रारूप नेटस्केप प्रारूप है जैसा कि मैन पेज में बताया गया है और यह प्रारूप है:

नेटस्केप की कुकीज़.टैक्स फ़ाइल का लेआउट ऐसा है कि प्रत्येक पंक्ति में एक नाम-मूल्य जोड़ी है। एक उदाहरण कुकीज़.टेक्स्ट फ़ाइल में एक प्रविष्टि हो सकती है जो इस तरह दिखती है:

.netscape.com TRUE / FALSE 946684799 NETSCAPE_ID 100103

प्रत्येक पंक्ति संग्रहीत जानकारी के एक टुकड़े का प्रतिनिधित्व करती है। प्रत्येक फ़ील्ड के बीच एक टैब डाला जाता है।

बाएं से दाएं, यहां बताया गया है कि प्रत्येक क्षेत्र क्या दर्शाता है:

डोमेन - वह डोमेन जिसने बनाया और जो चर को पढ़ सकता है।

झंडा - एक TRUE / FALSE मान जो यह दर्शाता है कि किसी दिए गए डोमेन के भीतर सभी मशीनें चर तक पहुंच सकती हैं। यह मान ब्राउज़र द्वारा स्वचालित रूप से सेट किया जाता है, यह आपके द्वारा डोमेन के लिए निर्धारित मूल्य पर निर्भर करता है।

पथ - डोमेन के भीतर वह मार्ग जिसके लिए चर मान्य है।

सुरक्षित - एक TRUE / FALSE मान यह दर्शाता है कि चर तक पहुँचने के लिए डोमेन के साथ एक सुरक्षित कनेक्शन आवश्यक है।

समाप्ति - UNIX समय जो चर पर समाप्त हो जाएगा। 1 जनवरी, 1970 00:00:00 GMT के बाद से UNIX समय को सेकंड की संख्या के रूप में परिभाषित किया गया है।

नाम - चर का नाम।

मूल्य - चर का मूल्य।

(" अनऑफिशियल कुकी एफएक्यू " से, स्पष्टता के लिए संपादित)


3
फ़ाइल टैब या स्पेस अलग है?
फेरीबिग

3
@ferrybig टैब का उपयोग किया जाता है।
जेकॉन

कुछ खास है कुकी एक डोमेन नाम के साथ कुछ के बजाय उदाहरण के लिए 127.0.0.1 से आता है?
PypeBros

4

Wget के लिए कुकी प्राप्त करने का एक तरीका है - wget के -keep-session-कुकी विकल्पों का उपयोग करना।

उदाहरण के लिए :

wget --keep-session-cookies --save-cookies cookies.txt "http://MYSITE/?__login=USER&__password=PASS"

?__login etcवेब साइट आप दर्पण की कोशिश कर रहे पर निर्भर करता है, आप कैसे प्रमाणीकरण रूप में काम करता है को देखने के लिए हो सकता है।

तब आप उपयोग कर सकते हैं:

wget --mirror --load-cookies cookies.txt http://MYSITE/

3
यह इस सवाल का जवाब नहीं देता है कि फ़ाइल प्रारूप क्या है
माइकल

2

नेटस्केप कुकीज़ फ़ाइल प्रारूप प्रत्येक डेटा लाइन के लिए ऊपर के रूप में है, लेकिन आप इसे HTTP::Cookies::Netscapeतब तक नहीं पढ़ पाएंगे जब तक इसमें इस तरह की हेडर लाइन न हो, जिसे पूर्ण फ़ाइल प्रारूप की आवश्यकता है:

# Netscape HTTP Cookie File

या यह:

# HTTP Cookie File
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.