हां, यह संभव है, हम उदाहरणों से पाठ उत्पन्न कर सकते हैं (पाठ -> वांछित अर्क)। यह एक काम करने वाला ऑनलाइन टूल है जो काम करता है: http://regex.inginf.units.it/
रेगेक्स जनरेटर ++ ऑनलाइन टूल जीपी खोज एल्गोरिथ्म का उपयोग करके प्रदान किए गए उदाहरणों से एक रेगेक्स उत्पन्न करता है। GP एल्गोरिथ्म एक मल्टीबोजिव फिटनेस द्वारा संचालित होता है जो उच्च प्रदर्शन और सरल समाधान संरचना (ओकोम के रेजर) की ओर जाता है। यह उपकरण मशीन लाइनिंग लैब, ट्राइस्टे यूनीवेरिस्टी (यूनिवर्सिटि डिली स्टडी डि ट्रिएस्ट) द्वारा एक डेमोस्ट्रेटिव एप्लिकेशन है। कृपया यहां वीडियो ट्यूटोरियल देखें ।
यह एक शोध परियोजना है, इसलिए आप यहां उपयोग किए गए एल्गोरिदम के बारे में पढ़ सकते हैं ।
देखो! :-)
उदाहरणों से एक सार्थक रेगेक्स / समाधान खोजना संभव है यदि और केवल प्रदान किए गए उदाहरण समस्या का अच्छी तरह से वर्णन करते हैं। इन उदाहरणों पर विचार करें जो एक निष्कर्षण कार्य का वर्णन करते हैं, हम विशेष आइटम कोड की तलाश कर रहे हैं; उदाहरण पाठ / निष्कर्षण जोड़े हैं:
"The product code is 467-345A" -> "467-345A"
"The item 789-345B is broken" -> "789-345B"
एक (मानव) आदमी, उदाहरणों को देखते हुए, कह सकता है: "आइटम कोड \ d ++ - 345 [AB] जैसी चीजें हैं"
जब आइटम कोड अधिक अनुमेय है, लेकिन हमने अन्य उदाहरण नहीं दिए हैं, तो समस्या को अच्छी तरह से समझने के लिए हमारे पास सबूत नहीं हैं। निम्नलिखित पाठ में मानव जनित समाधान \ d ++ - 345 [AB] को लागू करते समय, यह विफल हो जाता है:
"On the back of the item there is a code: 966-347Z"
एक मैच क्या है और एक वांछित मैच क्या नहीं है, इसका बेहतर वर्णन करने के लिए आपको अन्य उदाहरण प्रदान करने होंगे: --ie:
"My phone is +39-128-3905 , and the phone product id is 966-347Z" -> "966-347Z"
फोन नंबर एक उत्पाद आईडी नहीं है, यह एक महत्वपूर्ण प्रमाण हो सकता है।