web-scraping पर टैग किए गए जवाब

वेब स्क्रैपिंग उन वेबसाइटों से विशिष्ट जानकारी निकालने की प्रक्रिया है जो आसानी से एक एपीआई या स्वचालित डेटा पुनर्प्राप्ति के अन्य तरीके प्रदान नहीं करते हैं। "कैसे स्क्रैपिंग के साथ शुरू करने के लिए" (जैसे एक्सेल VBA के साथ) के बारे में प्रश्न * कई कार्यात्मक कोड नमूने उपलब्ध हैं के रूप में * पूरी तरह से शोध * होना चाहिए। वेब स्क्रैपिंग विधियों में 3-पार्टी एप्लिकेशन, कस्टम सॉफ़्टवेयर का विकास या मानकीकृत तरीके से मैन्युअल डेटा संग्रह शामिल हैं।

8
मैं कैसे तेजी से परिमार्जन कर सकता हूं
यहां काम एक एपीआई को एक साइट को परिमार्जन करना है, जो शुरू होता https://xxx.xxx.xxx/xxx/1.jsonहै https://xxx.xxx.xxx/xxx/1417749.jsonऔर इसे सही तरीके से लिखना है। उसके लिए मेरे पास निम्नलिखित कोड है: client = pymongo.MongoClient("mongodb://127.0.0.1:27017") db = client["thread1"] com = db["threadcol"] start_time = time.time() write_log = open("logging.log", "a") min = 1 max = …

3
VBA और HTML के साथ स्वत: पूर्ण सूची में किसी आइटम पर क्लिक करें
मैंने एक स्वचालन बनाया है जहाँ यह मुझे एक वेबसाइट पर विवरण दर्ज करने की अनुमति देगा (हालांकि मैं इसे साझा नहीं कर सकता क्योंकि यह आंतरिक है)। नीचे दिया गया मेरा कोड केवल तब तक काम कर रहा है जब तक कि वह "से प्राप्त" पर पाठ दर्ज नहीं …

1
मेरी स्क्रिप्ट को पेलोड के भीतर उपयोग किए जाने के लिए स्वचालित रूप से कुछ मान उत्पन्न करने में असमर्थ
मैंने बाद में दो https अनुरोध भेजकर html तत्वों को लक्ष्य पृष्ठ से प्राप्त करने के लिए एक स्क्रिप्ट बनाई है। मेरी पटकथा बात को त्रुटिपूर्ण रूप से कर सकती है। हालांकि, मुझे payloadलक्ष्य पृष्ठ तक पहुंचने के लिए अंतिम http अनुरोध भेजने के लिए चार देवता से क्रोम देव …

2
यह सुनिश्चित करने के लिए कि मैं किसी वेबसाइट में लॉग इन हूं, यह सुनिश्चित करने के लिए उपयोगकर्ता नाम को पार्स न करें
मैंने एक वेबसाइट में लॉग इन करने के लिए अजगर में एक स्क्रिप्ट लिखी है और उपयोगकर्ता नाम को पार्स करने के लिए सुनिश्चित करें कि मैं वास्तव में लॉग इन करने में सक्षम हूं। नीचे दिए गए तरीके का उपयोग करके मुझे वहां पहुंचने के लिए लगता है। हालाँकि, …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.