आप सॉफ्टवेयर का एक टुकड़ा लिख सकते हैं:
- नियमित अभिव्यक्ति से कीवर्ड लें;
- Google को कीवर्ड करें और परिणामों की एक सूची प्राप्त करें;
- प्रत्येक परिणामी URI को क्रॉल करें और इसे पूरी नियमित अभिव्यक्ति के साथ फ़िल्टर करें।
आइए एक मामले का अध्ययन करें: site:gog.com
उन सभी खेलों को ढूंढें जिनमें स्पैनिश वॉइस-ओवर है।
नियमित अभिव्यक्ति है:
Audio[^:]*:[^.,]*Spanish
उदाहरण के लिए, यह मेल खाएगा:
Audio lanuage: English, German, Spanish, French.
और मेल नहीं खाता:
Audio language: only-English. Text language: Spanish.
चरण 1. Google पर अपने सॉफ़्टवेयर को खोजने दें:
site:gog.com audio Spanish inurl:game
inurl:game
यहाँ केवल खेल विवरण पृष्ठों में खोज का मतलब है
चरण 2. 300 परिणामी लिंक प्राप्त करें और उनमें से हर एक में क्रॉल करें।
चरण 3. दिए गए नियमित अभिव्यक्ति के साथ परिणाम को फ़िल्टर करें:
Audio[^:]*:[^.,]*Spanish
इसे बनाना आसान होना चाहिए। वास्तव में मुझे समझ में नहीं आता है कि मैं कुछ ऐसा क्यों नहीं खोज सका जो पहले से ही इस तरह से बनाया गया है।
चूंकि खोज इंजन नियमित अभिव्यक्ति के साथ अपने डेटा को स्कैन करने के लिए संसाधन का खर्च नहीं उठा सकते हैं, इसलिए यह गंदा काम आपके हिस्से पर पड़ता है, और आपके कंप्यूटर को ऐसा करना चाहिए जो पहले से ही खोज इंजन प्रदान करता है।