html-parsing पर टैग किए गए जवाब

HTML पार्सिंग एक HTML दस्तावेज़ के क्रमांकन का उपभोग करने और एक प्रतिनिधित्व उत्पन्न करने की प्रक्रिया है जिसे आप प्रोग्रामेटिक रूप से काम कर सकते हैं - जैसे, इससे डेटा निकालने के लिए। HTML विनिर्देश HTML को पार्स करने के लिए एक मानक एल्गोरिथ्म को परिभाषित करता है, जिसे सभी प्रमुख ब्राउज़रों में लागू किया जाता है।


30
HTML स्क्रैपिंग के लिए विकल्प? [बन्द है]
बंद हो गया । इस प्रश्न पर अधिक ध्यान देने की आवश्यकता है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह इस पोस्ट को संपादित करके केवल एक समस्या पर केंद्रित हो । 6 साल पहले …

9
जेएस के साथ एक HTML स्ट्रिंग पार्स करें
मैंने एक समाधान के लिए खोज की लेकिन कुछ भी प्रासंगिक नहीं था, इसलिए यहां मेरी समस्या है: मैं एक स्ट्रिंग को पार्स करना चाहता हूं जिसमें HTML टेक्स्ट है। मैं इसे जावास्क्रिप्ट में करना चाहता हूं। मैंने इस लाइब्रेरी की कोशिश की, लेकिन ऐसा लगता है कि यह मेरे …

18
HTML को पार्स करने के लिए नियमित अभिव्यक्तियों का उपयोग करना: क्यों नहीं?
यह स्टैकओवरफ्लो पर हर सवाल की तरह लगता है, जहां पूछने वाला HTML से कुछ जानकारी हड़पने के लिए regex का उपयोग कर रहा है, अनिवार्य रूप से एक "उत्तर" होगा जो HTML को पार्स करने के लिए regex का उपयोग नहीं करने के लिए कहता है। क्यों नहीं? मुझे …

3
कौन सा HTML Parser सबसे अच्छा है? [बन्द है]
जैसा कि वर्तमान में खड़ा है, यह प्रश्न हमारे प्रश्नोत्तर प्रारूप के लिए एक अच्छा फिट नहीं है। हम तथ्यों, संदर्भों या विशेषज्ञता के आधार पर उत्तर देने की अपेक्षा करते हैं, लेकिन इस सवाल पर बहस, बहस, मतदान या विस्तारित चर्चा की संभावना होगी। यदि आपको लगता है कि …

7
पायथन का उपयोग करके HTML को पार्स करना
मैं पायथन के लिए एक HTML पार्सर मॉड्यूल की तलाश कर रहा हूं जो मुझे पायथन सूचियों / शब्दकोशों / वस्तुओं के रूप में टैग प्राप्त करने में मदद कर सकता है। अगर मेरे पास फॉर्म का एक दस्तावेज है: <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div id='class'>Something here</div> <div>Something …


5
यदि वे regexp का उपयोग नहीं कर रहे हैं तो HTML parses कैसे काम करते हैं?
मैं हर दिन कुछ प्रश्न देखता हूं कि कुछ HTML स्ट्रिंग से कुछ कैसे पार्स या निकाला जाता है और पहला उत्तर / टिप्पणी हमेशा होती है "HTML का उपयोग करने के लिए RegEx का उपयोग न करें, ऐसा न हो कि आपको क्रोध महसूस हो!" (वह अंतिम भाग कभी-कभी …

5
मैं Node.js के साथ एक HTML पृष्ठ कैसे पार्स करूं
मुझे बड़ी मात्रा में HTML पृष्ठों को पार्स (सर्वर साइड) करने की आवश्यकता है। हम सभी सहमत हैं कि regexp यहां जाने का तरीका नहीं है। यह मुझे लगता है कि जावास्क्रिप्ट एक HTML पृष्ठ पार्स करने का मूल तरीका है, लेकिन यह धारणा सर्वर साइड कोड पर निर्भर करती …

8
Grep, regex या perl के साथ एक पैटर्न के बाद स्ट्रिंग कैसे निकालें
मेरे पास एक फाइल है जो कुछ इस तरह दिखती है: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" primary-key="id"> <type="global" /> </table> मुझे उद्धरणों के भीतर कुछ भी निकालने की ज़रूरत है name=, अर्थात content_analyzer, content_analyzer2और content_analyzer_items। मैं एक लिनक्स बॉक्स पर ऐसा …

8
जावास्क्रिप्ट या jQuery में HTML को सामान्य कैसे करें?
टैग में कई गुण हो सकते हैं। कोड में विशेषताएँ जिस क्रम में प्रकट होती हैं, वह मायने नहीं रखती है। उदाहरण के लिए: <a href="#" title="#"> <a title="#" href="#"> मैं जावास्क्रिप्ट में HTML को कैसे "सामान्य" कर सकता हूं, इसलिए विशेषताओं का क्रम हमेशा समान होता है? मुझे परवाह …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.