एक वेब ब्राउज़र (IE या क्रोम) का उपयोग करके मैं Ctl-S के साथ एक वेब पेज (.html) को सहेज सकता हूं, किसी भी पाठ संपादक के साथ इसका निरीक्षण कर सकता हूं, और तालिका प्रारूप में डेटा देख सकता हूं। उन संख्याओं में से एक जिन्हें मैं निकालना चाहता हूं, लेकिन कई के लिए, कई वेब पेज, बहुत से मैन्युअल रूप से करने के लिए। इसलिए मैं एक के बाद एक उन वेब पेजों को पाने के लिए WGET का उपयोग करना चाहूंगा, और .html को पार्स करने के लिए एक और प्रोग्राम लिखूंगा और मुझे जो नंबर चाहिए उसे पुनः प्राप्त करेगा। लेकिन .GG द्वारा सहेजी गई .html फ़ाइल उसी URL का उपयोग करते समय होती है जब ब्राउज़र में डेटा तालिका नहीं होती है। क्यों नहीं? यह वैसा ही है जैसे कि सर्वर का पता लगाता है कि अनुरोध WGET से आ रहा है न कि किसी वेब ब्राउज़र से, और डेटा टेबल की कमी से कंकाल वेब पेज को सप्लाई करता है। मैं WGET के साथ सटीक वेब पेज कैसे प्राप्त कर सकता हूं? - धन्यवाद!
और जानकारी:
URL जो मैं लाने का प्रयास कर रहा हूं, उसका एक उदाहरण है: http://performance.morningstar.com/fund/performance-return.action?t=ICENX®ion=usa&culture=en-US जहां स्ट्रिंग ICENX एक म्यूचुअल फंड टिकर प्रतीक है , जो मैं कई अलग-अलग टिकर प्रतीकों में से किसी एक में बदल रहा हूं। यह एक ब्राउज़र में देखे जाने पर डेटा तालिका को डाउनलोड करता है, लेकिन WGET के साथ लाए जाने पर डेटा तालिका अनुपलब्ध है।