दिए गए अंतराल में वेब पेज से जानकारी निकालना


1

मुझे एक समस्या है। मुझे 800 रिकॉर्ड की तरह कुछ निकालने की ज़रूरत है और इसे मैन्युअल रूप से करने में कई दिन लगेंगे।

कुछ फ़ील्ड्स को फॉर्म (हमेशा समान) और फिर दिए गए अंतराल में एक चर डालकर जानकारी ली जा सकती है। पृष्ठ सादे पाठ में मापदंडों को पारित नहीं करता है, इसलिए मैं बस एक बहुत ही सरल उपकरण का उपयोग नहीं कर सकता जो पैरामीटर चर को बढ़ाता है।

क्या कोई अच्छा उपकरण है जो मुझे इसमें मदद कर सकता है?


एक उदाहरण बहुत मददगार होगा। आप चर कहां दर्ज करते हैं?
LaLeX

मैं एक बेस स्क्रिप्ट में कर्ल का उपयोग करता हूं, इसके ध्वनियों से। आप कैसे मतलब करते हैं कि डेटा सादे पाठ से पारित नहीं हुआ है? क्या यह एक पोस्ट अनुरोध के साथ पारित किया गया है? आपका OS क्या है?
0x90

संपर्क nahlizenidokn.cuzk.cz/VyberParcelu.aspx - भाषा के लिए खेद है - आप उदाहरण के लिए भरें पहला क्षेत्र ब्रनो दूसरा Zidenice तीसरा यह है कि उदाहरण के लिए मैं 6200 से 6500 तक डेटा प्राप्त करना चाहता हूं
Jarek

आपका फॉर्म इन मूल्यों के साथ काम नहीं करता है। बेहतर है इसे चित्र के रूप में दिखाएं।
harrymc

यदि आप उस HTML को पोस्ट कर सकते हैं जो साइट आपके ब्राउज़र के व्यू सोर्स फ़ंक्शन का उपयोग करके उत्पन्न करती है। अन्य बुद्धिमान साइट व्यवस्थापक से संपर्क करें और पूछें कि क्या वे आपके लिए डेटाबेस डेटा निर्यात कर सकते हैं या आपको पढ़ने के लिए विशेषाधिकार और डेटाबेस तक पहुंच प्रदान कर सकते हैं।
nelaaro

जवाबों:


3

यदि आप प्रोग्रामिंग से डरते नहीं हैं, तो एक शानदार सेलेनियम फ्रेमवर्क है। संक्षेप में, आप किसी पृष्ठ पर इसके व्यवहार की प्रोग्रामिंग करते हुए, एक ब्राउज़र को स्वचालित और नकल कर सकते हैं। http://code.google.com/p/selenium/?redir=1


1

डॉबरी मांद,

अरे, ऐसा लगता है कि उनके पास कुछ SOAP सेवाएँ हैं, शायद आप डेटा तक पहुँचने के लिए किसी भी कंप्यूटर भाषा से xml rpc लाइब्रेरी का उपयोग कर सकते हैं। मुझे यह wsdl मिला https://katastr.cuzk.cz/static/wsdl/sestavy.wsdl लेकिन वे अन्य हो सकता है ...


0

पर्ल मैकेनाइज या रूबी मैकेनाइज का उपयोग करके स्क्रिप्ट लिखने में देखें। शायद AutoHotKey, मैक्रोज़ बनाने के लिए कार्यक्रम, आपके लिए काम करेगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.