मुझे बड़ी मात्रा में HTML पृष्ठों को पार्स (सर्वर साइड) करने की आवश्यकता है।
हम सभी सहमत हैं कि regexp यहां जाने का तरीका नहीं है।
यह मुझे लगता है कि जावास्क्रिप्ट एक HTML पृष्ठ पार्स करने का मूल तरीका है, लेकिन यह धारणा सर्वर साइड कोड पर निर्भर करती है जिसमें सभी DOM क्षमता जावास्क्रिप्ट एक ब्राउज़र के अंदर है।
क्या Node.js में वह क्षमता है?
क्या इस समस्या का एक बेहतर तरीका है, सर्वर पर HTML को पार्स करना?