scrapy पर टैग किए गए जवाब

3
सिर रहित ब्राउज़र और स्क्रैपिंग - समाधान [बंद]
बन्द है। यह प्रश्न स्टैक ओवरफ्लो दिशानिर्देशों को पूरा नहीं करता है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? सवाल को अपडेट करें ताकि यह स्टैक ओवरफ्लो के लिए विषय पर हो । 5 साल पहले बंद हुआ । मैं ब्राउज़र …

23
Mac OS X 10.9 पर Lxml स्थापित नहीं कर सकता
मैं Lxml स्थापित करना चाहता हूं ताकि मैं फिर स्क्रैपी स्थापित कर सकूं। जब मैंने अपना मैक अपडेट किया तो यह मुझे lxml को फिर से स्थापित करने नहीं देगा, मुझे निम्न त्रुटि मिली: In file included from src/lxml/lxml.etree.c:314: /private/tmp/pip_build_root/lxml/src/lxml/includes/etree_defs.h:9:10: fatal error: 'libxml/xmlversion.h' file not found #include "libxml/xmlversion.h" ^ 1 …
234 python  xcode  macos  scrapy  lxml 

18
"OSError: [Errno 1] OSX 10.11 (El Capitan) (सिस्टम इंटीग्रिटी प्रोटेक्शन) में Scrapy स्थापित करते समय ऑपरेशन की अनुमति नहीं है"
मैं पाइप के माध्यम से OSX 10.11 (एल कैपिटन) में स्क्रेपी पायथन फ्रेमवर्क स्थापित करने की कोशिश कर रहा हूं। स्थापना स्क्रिप्ट आवश्यक मॉड्यूल डाउनलोड करता है और कुछ बिंदु पर निम्न त्रुटि देता है: OSError: [Errno 1] Operation not permitted: '/tmp/pip-nIfswi-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/six-1.4.1-py2.7.egg-info' मैंने OSX 10.11 में रूटलेस फीचर को कमांड …

8
क्या AJAX का उपयोग करने वाली वेबसाइटों से गतिशील सामग्री को स्क्रैप करने के लिए स्क्रैपी का उपयोग किया जा सकता है?
मैं हाल ही में पायथन सीख रहा हूं और एक वेब-स्क्रैपर के निर्माण में अपना हाथ डुबो रहा हूं। यह कुछ भी फैंसी नहीं है; इसका एकमात्र उद्देश्य सट्टेबाजी की वेबसाइट से डेटा प्राप्त करना और यह डेटा एक्सेल में डालना है। अधिकांश मुद्दे हल हैं और मैं चारों ओर …

8
SundSoup और Scrapy क्रॉलर के बीच अंतर?
मैं एक ऐसी वेबसाइट बनाना चाहता हूं, जो अमेज़ॅन और ई-बे उत्पाद की कीमत के बीच तुलना दिखाती है। इनमें से कौन बेहतर काम करेगा और क्यों? मैं BeautifulSoup से कुछ हद तक परिचित हूं लेकिन स्क्रेपी क्रॉलर के साथ ऐसा नहीं है ।

17
स्क्रैपिंग: SSL: CERTIFICATE_VERIFY_FAILED त्रुटि http://en.wikipedia.org के लिए
मैं 'वेब स्क्रेपिंग विथ पायथन' के कोड का अभ्यास कर रहा हूं, और मुझे यह प्रमाणपत्र समस्या रहती है: from urllib.request import urlopen from bs4 import BeautifulSoup import re pages = set() def getLinks(pageUrl): global pages html = urlopen("http://en.wikipedia.org"+pageUrl) bsObj = BeautifulSoup(html) for link in bsObj.findAll("a", href=re.compile("^(/wiki/)")): if 'href' in …

5
स्क्रैपी स्पाइडर में उपयोगकर्ता परिभाषित तर्क कैसे पारित करें
मैं एक उपयोगकर्ता परिभाषित तर्क को एक स्क्रैपर्स मकड़ी को पारित करने की कोशिश कर रहा हूं। क्या कोई सुझाव दे सकता है कि वह कैसे करे? मैंने एक पैरामीटर के बारे में -aकहीं पढ़ा है लेकिन इसका उपयोग करने का कोई तरीका नहीं है।

10
कैसे Scrapy परियोजनाओं को डिबग करने के लिए PyCharm का उपयोग करें
मैं पाइथन 2.7 के साथ स्क्रेपी 0.20 पर काम कर रहा हूं। मैंने पाया कि Pyharm के पास एक अच्छा पायथन डिबगर है। मैं इसका उपयोग करके अपने स्क्रेपी मकड़ियों का परीक्षण करना चाहता हूं। किसी को पता है कि कृपया कैसे करना है? मैंने क्या कोशिश की है वास्तव …

2
गतिशील पृष्ठ के लिए स्क्रैप के साथ सेलेनियम
मैं एक वेबपेज से उत्पाद जानकारी को स्क्रैप करने के लिए उपयोग करने की कोशिश कर रहा हूं। इस तरह दिखता है मेरा-टू-स्क्रेप्ड वेबपेज: 10 उत्पादों के साथ एक product_list पृष्ठ से शुरू होता है "अगला" बटन पर क्लिक करने से अगले 10 उत्पाद लोड हो जाते हैं (दो पृष्ठों …

10
मैं किसी एकल स्क्रेपी परियोजना में विभिन्न मकड़ियों के लिए विभिन्न पाइपलाइनों का उपयोग कैसे कर सकता हूं
मेरे पास एक स्क्रैपी प्रोजेक्ट है जिसमें कई स्पाइडर हैं। क्या कोई तरीका है जो मैं परिभाषित कर सकता हूं कि किस मकड़ी के लिए कौन सी पाइपलाइनों का उपयोग करना है? मेरे द्वारा परिभाषित सभी पाइपलाइन हर मकड़ी के लिए लागू नहीं हैं। धन्यवाद
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.