क्या "जहाँ वास्तव में कठिन समस्याएं हैं" पकड़? विषय पर वर्तमान विचार क्या हैं?


27

मुझे यह पेपर बहुत दिलचस्प लगा। संक्षेप में: यह चर्चा करता है कि व्यवहार में आप शायद ही कभी एनपी-पूर्ण समस्या का सबसे खराब मामला पाते हैं। लेख में विचार यह है कि उदाहरण आमतौर पर या तो बहुत कम होते हैं या बहुत अधिक असंबंधित होते हैं, दोनों को हल करना आसान होता है। यह तब कुछ समस्याओं के लिए 'अड़चन' का एक उपाय प्रस्तावित करता है। उन समस्याओं के समाधान के लिए 100% संभावना के 0 संभावना से 'चरण संक्रमण' दिखाई देता है। यह तो परिकल्पना करता है:

  1. यह सभी एनपी-पूर्ण (या यहां तक ​​कि सभी एनपी-समस्याएं) समस्याओं में 'विवशता' का एक उपाय है।
  2. प्रत्येक एनपी-पूर्ण समस्या के लिए, आप 'बाधा' के एक समारोह के रूप में मौजूदा समाधान की संभावना का एक ग्राफ बना सकते हैं। इसके अलावा, उस ग्राफ में एक चरण-संक्रमण शामिल होगा जहां वह संभावना जल्दी और नाटकीय रूप से बढ़ जाती है।
  3. एनपी-पूर्ण समस्याओं का सबसे खराब उदाहरण उस चरण-संक्रमण में है।
  4. यह तथ्य कि क्या कोई समस्या उस चरण-संक्रमण पर है, एक एनपी-पूर्ण समस्या को दूसरे में बदलने के तहत अपरिवर्तित बनी हुई है।

यह पत्र १ ९९ १ में प्रकाशित हुआ था। मेरा प्रश्न है कि पिछले २५ वर्षों में इन विचारों पर कोई अनुवर्ती शोध हुआ था? और यदि हां, तो उन पर मौजूदा मुख्यधारा की सोच क्या है? क्या वे सही, गलत, अप्रासंगिक पाए गए?


CSP के यादृच्छिक उदाहरण, k-sat, k-colouring का TCS समुदाय द्वारा बड़े पैमाने पर अध्ययन किया गया है। उदाहरण के लिए, यह तथ्य कि घनत्व / 'अड़चन' जिस पर हम किसी विशेष समस्या को कुशलतापूर्वक हल कर सकते हैं, वह अक्सर उस सीमा से कम होती है जिस पर मौजूदा समाधान की संभावना 1 से 0 तक जाती है, जिसने बहुत अधिक ध्यान आकर्षित किया है।
JWM

किस संभावना पर 'आसान सॉल्वेबिलिटी' झूठ (मोटे तौर पर बोलना) की सीमा होती है? क्या यह 0.2 की तरह है या 0.001 की तरह अधिक है?
डिंपल

1
@ डिंपल में आमतौर पर ऐसी कोई सटीक सीमा निर्धारित नहीं है। बिंदु यह है कि "बाधा" क्या है इनपुट आकार के साथ संभावना 0 या 1 पर जाती है। एक विशिष्ट कथन होगा, "एल्गोरिथ्म ए कम से कम , जहां साथ 1 पर जाता है , चर और खंड के साथ यादृच्छिक 3-SAT उदाहरण को हल करता है ।" थ्रेसहोल्ड का मूल्य है जिसके लिए संभावना 0 से टेंडिंग से 1 तक जाती है।nΔnpnpnnΔ
सैशो निकोलेव

लगता है कि विचार सामान्य रूप से बहुत प्रभावशाली रहे हैं और इस विषय से संबंधित पत्रों का एक बहुत बड़ा समूह है और शोध जारी है। हालाँकि, इसकी एक क्रॉस-कटिंग अवधारणा क्योंकि फेज़ ट्रांज़िशन भौतिकी से अधिक आते हैं और (नीचे MAT उत्तर) शायद कंप्यूटर वैज्ञानिक अपने महत्व के बारे में थोड़ा अधिक संदेह करते हैं, और यह भी संभवतः एक अनुभवजन्य / प्रयोगात्मक अवधारणा है। यदि कुछ लोग इस टिप्पणी से सहमत हैं, तो कुछ pt पर एक उत्तर देने की कोशिश कर सकते हैं, लेकिन अभी के लिए सैद्धांतिक कंप्यूटर साइंस चैट
vzn

1
यह भी देखें कि एनपी पूर्ण समस्याओं में चरण संक्रमण कितना आम है । यह भी सोचें कि वॉल्श 1998 की विवशता चाकू की धार महत्वपूर्ण है और इसे बहुत आगे तक नहीं बढ़ाया गया है, इसका संक्रमण बिंदु से संबंध है, लेकिन शायद बिल्कुल समान अवधारणा नहीं है ... कागज सीधे फ्रैक्टल्स का उल्लेख नहीं करता है, लेकिन इसके संदर्भ में इसके अत्यधिक विचारोत्तेजक आत्म-समानता, पैमाने पर
आक्रमण

जवाबों:


26

यहाँ वर्दी द्वारा फिनिट एंड अल्गोरिथमिक मॉडल थ्योरी (2012) पर एक कार्यशाला में दी गई प्रस्तुति के आधार पर स्थिति का एक संक्षिप्त सारांश है :

यह देखा गया है कि कठिन उदाहरण चरण संक्रमण से अधिक से अधिक विवश क्षेत्र में आते हैं। मौलिक अनुमान यह है कि चरण-संक्रमण और एनपी समस्याओं की कम्प्यूटेशनल जटिलता के बीच मजबूत संबंध है।

अचिलोप्टास-कोजा-ओगलन ने पाया कि संतोषजनक क्षेत्र में एक घनत्व है जहां समाधान स्थान कई छोटे समूहों में बिखर जाता है। विनय देओलीकर को इस धारणा पर प्रचलित करने के अपने प्रसिद्ध प्रयास को आधार बनाया कि बिखरना संगति कठोरता को दर्शाता है। देओलीकर के प्रमाण का इस तथ्य से खंडन किया गया था कि XOR-SAT और यह बिखरता है। इसलिए, कम्प्यूटेशनल कठोरता साबित करने के लिए बिखरने का उपयोग नहीं किया जा सकता है।PNPP

वर्तमान मुख्यधारा की सोच (जैसा कि वर्डी द्वारा कहा गया है) से प्रतीत होता है कि चरण-संक्रमण कम्प्यूटेशनल जटिलता से आंतरिक रूप से जुड़े नहीं हैं।

अंत में, यहां नेचर में प्रकाशित एक लेख है जो चरण-संक्रमण और के-सैट की कम्प्यूटेशनल कठोरता के बीच संबंध की जांच करता है।


अवलोकन के लिए धन्यवाद, अफ़सोस कि यह किसी भी वास्तविक सफलताओं के लिए नेतृत्व नहीं किया।
डिंमोल

1
मुझे लगता है कि जर्जर घटनाओं को स्थानीय खोज आधारित एल्गोरिदम के एक वर्ग को नियंत्रित करने के लिए माना जा सकता है जो एनपी-कठिन समस्याओं के लिए कई अनुमानी एल्गोरिदम का आधार हैं।
केवह


@vzn नाइस, वर्डी द्वारा वीडियो देखना चाहिए।
मोहम्मद अल-तुर्कस्टनी

14

हां, चेसमेन, केनफस्की और टेलर के 1991 के पेपर के बाद से बहुत काम हुआ है।

एनपी-पूर्ण समस्याओं के चरण संक्रमण की समीक्षाओं की खोज करने से आपको बहुत सारे परिणाम मिलेंगे। ऐसी ही एक समीक्षा है हार्टमैन और वीगेट [1]। उच्च स्तर के परिचय के लिए, ब्रायन हेस अमेरिकी वैज्ञानिक लेख [2] [3] देखें।

चेज़मेन, केनफ़्स्की और टेलर का 1991 का पेपर कंप्यूटर वैज्ञानिकों के गणित साहित्य पर ध्यान न देने का एक दुर्भाग्यपूर्ण मामला है। चेसमैन, केनफ़्स्की और टेलर के पेपर में, उन्होंने हैमिल्टनियन चक्र की पहचान की, जो महत्वपूर्ण दहलीज के पास खोज लागत में एक पिकअप के साथ एक चरण संक्रमण था। उनके द्वारा उपयोग किया जाने वाला यादृच्छिक ग्राफ मॉडल Erdos-Renyi यादृच्छिक ग्राफ (निश्चित बढ़त संभावना या समकक्ष गॉसियन डिग्री वितरण) था। इस मामले को अच्छी तरह से अध्ययन किया गया था इससे पहले कि यह निश्चित रूप से ग्राफ के इस वर्ग के लिए लगभग महत्वपूर्ण बहुपद समय एल्गोरिदम के साथ या यहां तक ​​कि महत्वपूर्ण सीमा के पास चेसमेन एट ऑल 1991 पेपर था। बोलोबस का "रैंडम ग्राफ्स" [4] एक अच्छा संदर्भ है। मेरा मानना ​​है कि मूल प्रमाण एंग्लियून और वैलिएंट द्वारा प्रस्तुत किया गया था [5] जिसमें बोलोबस, फेनर और फ्रीज़ [6] द्वारा आगे सुधार किया गया था। चीज़मैन के बाद,

यादृच्छिक एर्दोस-रेनी यादृच्छिक ग्राफ में हैमिल्टनियन चक्रों के लिए चरण संक्रमण इस अर्थ में मौजूद है कि समाधान खोजने की संभावना का तेजी से संक्रमण है, लेकिन यह हैमिल्टन चक्रों को खोजने के "आंतरिक" जटिलता में वृद्धि का अनुवाद नहीं करता है। एर्दोस-रेनी यादृच्छिक ग्राफ़ में हैमिल्टनियन चक्र खोजने के लिए लगभग निश्चित बहुपद समय एल्गोरिदम हैं, यहां तक ​​कि महत्वपूर्ण संक्रमण में, सिद्धांत और व्यवहार में दोनों।

सर्वेक्षण प्रसार [8] को महत्वपूर्ण थ्रेशोल्ड के पास यादृच्छिक 3-सैट के लिए संतोषजनक उदाहरण खोजने में अच्छी सफलता मिली है। मेरा वर्तमान ज्ञान थोड़ा कठोर है, इसलिए मुझे यकीन नहीं है कि महत्वपूर्ण सीमा के पास असंतोषजनक मामलों के लिए "कुशल" एल्गोरिदम खोजने की कोई बड़ी प्रगति हुई है। 3-सैट, जहां तक ​​मुझे पता है, यह उन मामलों में से एक है जहां यह हल करना "आसान" है यदि यह संतोषजनक सीमा के पास है और महत्वपूर्ण सीमा के पास असंतोषजनक मामले में अज्ञात (या कठिन) है।

मेरा ज्ञान अब थोड़ा दिनांकित है, लेकिन पिछली बार जब मैंने इस विषय को गहराई से देखा, तो कुछ चीजें थीं जो मेरे सामने थीं:

  • एर्दोस-रेनी यादृच्छिक रेखांकन के लिए हैमिल्टनियन साइकिल "आसान" है। इसके लिए कठिन समस्याएं कहां हैं?
  • जब तक कि लगभग निश्चित 0 या 1 क्षेत्र में संख्या विभाजन को हल किया जाना चाहिए, लेकिन कोई भी कुशल एल्गोरिदम (मेरी जानकारी के लिए) यहां तक ​​कि मध्यम आवृत्ति के आकारों (प्रत्येक 500 बिट्स के 1000 नंबर) के लिए मौजूद है, जहाँ तक मुझे पता है, पूरी तरह से साथ कला एल्गोरिदम की स्थिति)। [९] [१०]
  • 3-SAT महत्वपूर्ण थ्रेसहोल्ड के पास संतोषजनक उदाहरणों के लिए "आसान" है, यहां तक ​​कि विशाल उदाहरण आकारों (लाखों चर) के लिए, लेकिन महत्वपूर्ण सीमा के पास असंतोषजनक उदाहरणों के लिए कठिन है।

मैं इसे यहां शामिल करने में संकोच करता हूं क्योंकि मैंने इसमें से किसी भी सहकर्मी समीक्षा पत्रों को प्रकाशित नहीं किया है लेकिन मैंने अपनी थीसिस लिखी हैइस विषय पर। मुख्य विचार यह है कि यादृच्छिक एनसेंबल (हैमिल्टनियन चक्र, संख्या विभाजन समस्या, आदि) का एक संभावित वर्ग जो "आंतरिक रूप से कठिन हैं" वे हैं जिनके पास "पैमाने पर आक्रमण" संपत्ति है। लेवी-स्थिर वितरण इस गुणवत्ता के साथ अधिक प्राकृतिक वितरणों में से एक है, जिसमें पावर लॉ टेल होते हैं, और कोई एनपी-पूर्ण एनसेम्बल से यादृच्छिक उदाहरण चुन सकता है जो किसी भी तरह लेवी-स्थिर वितरण को शामिल करता है। मैंने कुछ कमजोर सबूत दिए कि आंतरिक रूप से कठिन हैमिल्टनियन चक्र के उदाहरण पाए जा सकते हैं यदि यादृच्छिक ग्राफ़ को सामान्य वितरण (यानी एर्डोस-रेनी) के बजाय लेवी-स्थिर डिग्री वितरण के साथ चुना जाता है। अगर कुछ और नहीं तो कम से कम आपको कुछ साहित्य समीक्षा के लिए शुरुआती बिंदु देगा।

[१] एके हार्टमैन और एम। वीगेट। कंबाइनटोरियल ऑप्टिमाइज़ेशन प्रॉब्लम्स में फेज़ ट्रांज़िशन: बेसिक्स, एलगोरिदम एंड स्टैटिस्टिकल मैकेनिक्स। विले-वीसीएच, 2005।

[२] बी हेस। सबसे आसान कठिन समस्या। अमेरिकन साइंटिस्ट, 90 (2), 2002।

[३] बी हेस। दहलीज पर। अमेरिकी वैज्ञानिक, 91 (1), 2003।

[४] बी। बोलबम रैंडम रेखांकन, दूसरा संस्करण। कैम्ब्रिज यूनिवर्सिटी प्रेस, न्यूयॉर्क, 2001।

[५] डी। एंग्लुइन और एलजी वैलिएंट। हैमिल्टन सर्किट और मिलान के लिए तेजी से संभाव्य एल्गोरिदम। जे। कंप्यूटर, सिस्ट। विज्ञान।, 18: 155–193, 1979।

[६] बी। बोल्लोबेस, टीआई फेनर, और एएम फ्रेज़। रैंडम रेखांकन में हैमिल्टन पथ और चक्र खोजने के लिए एक एल्गोरिथ्म। कॉम्बिनेटरिका, 7: 327–341, 1987।

[[] बी। वांडेग्रिएंड और जे। कुलबर्सन। जी एन, एम चरण संक्रमण हैमिल्टनियन चक्र की समस्या के लिए कठिन नहीं है। जे। एआई रिसर्च, 9: 219–245, 1998।

[[] ए। ब्रॉनस्टीन, एम। मेज़र्ड, और आर। जेसीना। सर्वेक्षण प्रसार: संतुष्टि के लिए एक एल्गोरिथ्म। रैंडम स्ट्रक्चर्स और एल्गोरिदम, 27: 201-226, 2005।

[९] आई। जेंट और टी। वॉल्श। संख्या विभाजन के लिए सांख्यिकी का विश्लेषण। कम्प्यूटेशनल इंटेलिजेंस, 14: 430-451, 1998।

[१०] सी.पी. जाली आधार में कमी: व्यावहारिक एल्गोरिदम में सुधार और सबसेट समस्याओं को हल करना। संगणना सिद्धांत की बुनियादी बातों की कार्यवाही में '91, एल। बुडैक, एड।, लेक्चर नोट्स इन कंप्यूटर साइंस, खंड 529, पृष्ठ 68-85, 1991।


0

25 साल का अध्ययन, और वर्तमान विचार कहां हैं:

+++ विचार 1:

संतोषजनक समाधान पर मेरे अनुभव में, मैंने अभ्यास में पाया है कि एक सूत्र के लिए एक मान्य k- खंड जोड़ना जो हम हल करने की कोशिश कर रहे हैं वह एक (nk) चर qbf तय करने के समान है।

ऐसा प्रतीत होता है कि एनपी के लिए वर्तमान सॉल्विंग मेथड्स को दर्शाने के लिए एक दृष्टिकोण पेस-हार्ड है!

+++ विचार 2:

एक अन्य विचार यह है कि बूलियन पदानुक्रम में AllQBFs समस्या एक वास्तविक समस्या है। AllQBFs समस्या यह है: एक बूलियन एक्सप्रेशन Q का निर्माण करें जो सभी 2 ^ n सूत्र के R qfs का निर्धारण करता है। मूल सूत्र R मोनोटोन या 2-cnf होने पर AllQBFs आसान होता है।

AllQBFs QBF को प्रदर्शित करने के लिए एक प्रशंसनीय सड़क की तरह लगता है, क्योंकि Q अक्सर घातीय है, इसलिए Q के असाइनमेंट का मूल्यांकन करना (मूल सूत्र R का परिमाणीकरण) घातीय है। तो एनपी को साबित करने की सड़क एक्सप है कम से कम इसमें कुछ ईंटें हैं।

+++ विचार 3: नियमित k-cnfs

Btw, सभी चरण संक्रमण अध्ययनों ने नियमित k-cnfs को याद किया है, जहां एक चर (किसी भी दिशा में) की संख्या तय की जाती है, डिग्री नियमित रेखांकन के समान ... नियमित k-cnfs मानक मॉडल की तुलना में बहुत कठिन हो जाते हैं, क्योंकि सभी चर उन पर बाधाओं के संदर्भ में समान दिखते हैं।

पच्चीस साल पहले, सिर्फ चीज़मैन को पढ़ने के बाद, मैंने डिग्री नियमित ग्राफ रंग पर ध्यान केंद्रित किया, क्योंकि सभी चर समान दिखते हैं। इसलिए मैं यहां अपने उत्तर विशेषाधिकार का दुरुपयोग करूंगा, और नियमित ग्राफ़ पर बीस साल के परिणाम पेश करूंगा!

+++ विचार 4: संतोषप्रद बेंचमार्क अध्ययन के लिए गोल्डन पॉइंट

मैंने डी नियमित एन वर्टेक्स ग्राफ के सी कलरिंग का काफी विस्तार से अध्ययन किया है। निम्न तालिका नियमित रूप से ग्राफ़िक्स के रंग के लिए गोल्डन पॉइंट परिणामों को सारांशित करती है।

उच्च संभावना के लिए, एन यादृच्छिक उदाहरण संतोषजनक थे। वेरी हाई, एन ^ 2 संतोषजनक थे। सुपर हाई के लिए, एन ^ 3 यादृच्छिक उदाहरण संतोषजनक थे।

उच्च संभावना (1 - 1 / एन) सुनहरे रंग के बिंदु हैं:

C3D5N180 C4D6N18 C4D7N35 C4D8N60 C4D9N180? C5D10N25 C5D11N42 C5D12N72

बहुत उच्च संभावना (1 - 1 / (एन ^ 2)) सुनहरे रंग के बिंदु हैं:

C3D5N230? C4D6N18 C4D7N36 C4D8N68 C4D9N ??? C5D10N32 C5D11N50 C5D12N78

सुपर हाई प्रोबेबिलिटी (1 - 1 / (एन ^ 3)) सुनहरे रंग के बिंदु हैं:

C3D5N ??? C4D6N22 C4D7N58 C4D8N72? C4D9N ??? C5D10N38 C5D11N58 C5D12N ??

C4D9 प्रविष्टि नौवें डिग्री रेखांकन के चार रंग दर्शाता है। ये 25 साल के सॉल्विंग सॉल्यूशन में सबसे कठिन 4cnfs हैं। मैंने हाल ही में सीपीयू समय के दस दिनों के बाद 172 शीर्ष नौवें डिग्री ग्राफ को रंगीन किया।

+++ आइडिया 5: C5D16N ???? गोल्डन प्वाइंट अस्तित्व में हल्का है।

धन्यवाद, डैनियल पेहुशेख


4
अप्रकाशित शोध प्रस्तुत करने का यह सही स्थान नहीं है। सब कुछ विस्तार से बताते हुए एक पेपर लिखें, इसे arxiv या कहीं और डाल दें, और एक सारांश के साथ यहां एक लिंक पोस्ट करें।
साशो निकोलेव

प्रश्न में शीर्षक के अनुसार C4D9 नियमित ग्राफ रंग बिंदु एक चरम कठिन स्थान है। इसे थोड़ा संदर्भ की आवश्यकता थी, इस प्रकार बाकी तालिका।
daniel pehoushek
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.