जैसा कि हाल ही में XKCD स्ट्रिप और इस हालिया ब्लॉग पोस्ट में देखा गया हैपीटर नॉरविग (और बाद की विशेषता वाली एक स्लैशडॉट स्टोरी) से, "रेगेक्स गोल्फ" (जिसे बेहतर रूप से नियमित अभिव्यक्ति पृथक्करण समस्या कहा जा सकता है) सबसे छोटी संभव नियमित अभिव्यक्ति को परिभाषित करने की पहेली है जो सेट ए में प्रत्येक शब्द को स्वीकार करता है और कोई शब्द नहीं। सेट बी। नॉर्विग के पोस्ट में एक बहुत छोटा उम्मीदवार पैदा करने के लिए एक एल्गोरिथ्म शामिल है, और वह नोट करता है कि उसके दृष्टिकोण में एनपी-पूर्ण सेट कवर समस्या को हल करना शामिल है, लेकिन वह यह भी बताने के लिए सावधान है कि उसका दृष्टिकोण हर संभव नियमित अभिव्यक्ति पर विचार नहीं करता है, और निश्चित रूप से उनका केवल आवश्यक एल्गोरिथ्म नहीं है, इसलिए उनके समाधान इष्टतम होने की गारंटी नहीं है, और यह भी संभव है कि कुछ अन्य अनुमानित बहुपद-समय एल्गोरिथ्म समतुल्य या बेहतर समाधान पा सकते हैं।
समवर्ती प्रश्न के लिए और अनुकूलन प्रश्न को हल करने से बचने के लिए, मुझे लगता है कि नियमित अभिव्यक्ति पृथक्करण का सबसे प्राकृतिक सूत्रीकरण होगा:
यह देखते हुए दो (परिमित) कुछ वर्णमाला पर तार के और सेट करते हैं , क्या लंबाई की एक नियमित अभिव्यक्ति है जो में प्रत्येक स्ट्रिंग को स्वीकार करता है और में प्रत्येक स्ट्रिंग को अस्वीकार करता है ?बी Σ ≤ कश्मीर एक बी
क्या इस विशेष पृथक्करण समस्या की जटिलता के बारे में कुछ पता है? (ध्यान दें कि जब से मैंने और को तार के परिमित सेट के रूप में निर्दिष्ट किया है , समस्या के लिए आकार की प्राकृतिक धारणा और में सभी तारों की कुल लंबाई है ; यह से किसी भी योगदान को दलदल करता है )। यह अत्यधिक संभावना मेरे लिए ऐसा लगता है कि है एन पी-सम्पूर्ण (और वास्तव में, मैं कमी कवर समस्या के कुछ प्रकार के होने की अपेक्षा करेंगे), लेकिन कुछ खोजें विशेष रूप से उपयोगी कुछ भी चालू नहीं किया है।B A B k