मैं एक वेबसाइट से सिंगल इमेज लेना चाहता हूं। वेबसाइट पर तस्वीरें हैं। तस्वीरों पर क्लिक करने से एक और पेज बन जाता है। मैं html में img src टैग से तस्वीरें प्राप्त करना चाहता हूं। मैं पहले से ही मैं चाहता हूँ img src लाइनों को निकालने के लिए यूनिक्स कोड है।
उदाहरण: img src = "http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1z38be1"
जब मैं इस URL को डाउनलोड करने के लिए wget का उपयोग करता हूं, तो मुझे एक अशक्त फ़ाइल मिलती है।
जब मैं मैन्युअल रूप से इस URL को अपने ब्राउज़र में दर्ज करता हूं, तो छवि स्क्रीन के बीच में लोड होती है। जब मैं गुणों पर क्लिक करता हूं, तो यह JPEG फाइल है। जब मैं पृष्ठ के लिए HTML स्रोत को देखता हूं, तो यह निम्नलिखित देता है:
<html><head> … </head><body><img class="decoded" src="http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1t38be1" alt="http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1t38be1"></img></body></html>
केवल एक चीज जो मैं समझ सकता हूं वह यह है कि इसका टैग के साथ क्या करना है:
<img class="decoded"
कोई विचार?