रैंडम के-सैट की सटीक परिभाषा क्या है?


12

रैंडम के-सैट को परिभाषित करते समय हमारे पास 4 अलग-अलग बाधाएं हो सकती हैं।
1) किसी दिए गए क्लॉज़ में कुल शाब्दिक संख्या K या AT सबसे अधिक K
2 है) दिए गए शाब्दिक का उपयोग उसी खंड (A या A या A)
3 में प्रतिस्थापन के साथ या बिना किया जा सकता है ) किसी दिए गए चर का उपयोग किसी अन्य के साथ किया जा सकता है। एक ही खंड (ए या ~ ए या ~ ए)
में प्रतिस्थापन के बिना 4) दिए गए क्लॉज का उपयोग किसी दिए गए सूत्र में या उसके बिना प्रतिस्थापन के लिए किया
जा सकता है। सबसे "सही" परिभाषा क्या होगी? इन विभिन्न परिभाषाओं का उपयोग करने के विपक्ष और नियम क्या हैं?


17
मुझे नहीं लगता कि एक सार्वभौमिक रूप से स्वीकृत परिभाषा है।
त्सुयोशी इटो

5
फिर भी एक और अलग विकल्प आप बना सकते हैं कि क्या एक निश्चित संख्या के क्लॉज़ (प्रतिस्थापन के साथ या बिना) का चयन करना है या एक पॉइसन नमूना चुनना है (प्रत्येक क्लॉज़ को एक निश्चित संभावना के साथ स्वतंत्र रूप से शामिल किया गया है)।
डेविड एप्पस्टीन

4
@Tsuyoshi, Geekster: मैं Tsuyoshi से सहमत हूं, जहां तक ​​मुझे पता है SAT सॉल्वर को रैंडम k-SAT की किसी भी परिभाषा की आवश्यकता नहीं है, जो भी तकनीक वे उपयोग करते हैं (DPLL, स्थानीय खोज, सर्वेक्षण प्रचार)। मुझे 100% यकीन है कि कोई भी गंभीर SAT सॉल्वर खोज शुरू करने से पहले डुप्लिकेट किए गए क्लॉज़, टॉटोलॉजिकल क्लॉज़ और डुप्लिकेट किए गए शाब्दिक को हटा देगा। कुछ सॉल्वर भी सब्सक्राइब्ड क्लॉज को हटा देते हैं।
जियोर्जियो कैमरानी

4
मुझे नहीं लगता कि वर्तमान रूप में प्रश्न का उत्तर है क्योंकि कोई भी परिभाषा दूसरों की तुलना में "अधिक सही" नहीं लगती है और "विपक्ष और पेशेवरों" पर निर्भर करता है कि आप यादृच्छिक के-सैट के लिए परिणामों का उपयोग करना चाहते हैं। मैंने इसे एक वास्तविक प्रश्न के रूप में बंद करने के लिए मतदान किया।
त्सुयोशी इतो

4
मुझे लगता है कि प्रश्न को बहाल किया जा सकता है, "सबसे सही" भाग को हटा दिया, और कुछ विशिष्ट परिणामों के तहत विपक्ष और पेशेवरों पर ध्यान केंद्रित किया। (या उत्तर प्रत्येक संभावित परिणाम से गुजर सकता है।) क्योंकि यह प्रश्न किसी तरह से विरल कटौती के बारे में एक प्रश्न के समान है, जो बिना किसी तर्क के दायरे में आता है, व्यक्तिगत रूप से मैं चाहूंगा कि प्रश्न खुला रहे।
Hsien-Chih चांग 張顯 '

जवाबों:


15

जैसा कि टिप्पणियों में इस चर्चा की शुरुआत में बताया गया था, यादृच्छिक -सैट के लिए जरूरी एक भी "सही" परिभाषा नहीं है ।

उस ने कहा, यादृच्छिक -सैट के दो सबसे आम वेरिएंट दोनों निश्चित खंड लंबाई (एफसीएल) मॉडल हैं, जिसका अर्थ है कि प्रत्येक खंड में वास्तव में k शाब्दिक दिखाई देते हैं। ये वैरिएंट एक खंड के भीतर दोहराए गए चर और शाब्दिक दोनों को नापसंद करते हैं, लेकिन इस बात में भिन्न होते हैं कि क्या वे एक सूत्र के भीतर दोहराया खंडों की अनुमति देते हैं। फिर भी, वे अनिवार्य रूप से वही हैं जो नीचे चर्चा की जाएगी।

दो मुख्य मॉडल:

सेलमेन यादृच्छिक मॉडल - बार-बार खंड कर रहे हैं की अनुमति दी । काइल ने अपने जवाब में टिप्पणियों में यह अच्छा संदर्भ दिया, लेकिन गलत तरीके से माना गया कि मॉडल ने दोहराया खंडों को अस्वीकार कर दिया। पेपर के लिंक किए गए (थोड़ा अलग) संस्करण में धारा 3 में यादृच्छिक मॉडल की अधिक विस्तृत चर्चा शामिल है: "पीढ़ी की यह विधि एक सूत्र में डुप्लिकेट क्लॉज़ की अनुमति देती है ... हालांकि, जैसा कि एन बड़े डुप्लिकेट मिलते हैं, दुर्लभ हो जाएगा क्योंकि हम आम तौर पर केवल खंडों की एक रैखिक संख्या का चयन करें। ”

Achlioptas रैंडम मॉडल - बार-बार क्लॉस को रोक दिया जाता है । हम 2 k ( n) से clauses uar का चयन करते हुए एक यादृच्छिक सूत्र उत्पन्न करने का इलाज करते हैं प्रतिस्थापन के बिना कुल संभव खंड। एक संदर्भ के रूपमें संतुष्टिकीहैंडबुक[1] (रैंडम सैट द्वारा अच्युतोपस) के Ch.8 देखें। यह मॉडल सैद्धांतिक साहित्य में अधिक प्रचलित है, संभवत: इसलिए कि इसमें से बहुत कुछ अचिलोपोटास ने खुद लिखा था।2(n)

चरण संक्रमण स्थानों की समानता :

हालांकि, चरण संक्रमण (50% संतोषजनक परिवर्तन सीमा) समान खंड-से-चर अनुपात पर होता है, भले ही इनमें से कोई भी मॉडल अनिवार्य रूप से इस कारण से चुना गया हो कि सेलमैन एट अल। उनके पेपर में नोट किया।

चलो सेलमैन रैंडम ( एन , एम , के ) में समान खंडों के समान जोड़े की अपेक्षित संख्या को दर्शाता है । दिए गए खंडों की जोड़ी की संभावना समरूप है p = 1 / ( 2 k ( n)(n,,)(n,,), जबकि क्लॉज़ के जोड़े की कुल संख्याN= ( m) हैपी=1/(2(n)) । उम्मीद की linearity करके,एक(एन,मीटर,कश्मीर)=पीएन= ( मीटरएन=(2)(n,,)=पीएन=(2)/2(n)

तक में प्रमेय 3 [1], साध्य ऊपरी के स्थान पर बाध्य , -SAT चरण संक्रमण Achlioptas मॉडल का उपयोग तब होता है जब मीटर = हे ( 2 कश्मीर एन ) । फिक्सिंग कश्मीर 3 और सेटिंग मीटर = हे ( 2 कश्मीर एन ) पर हम पाते हैं=हे(2n)3=हे(2n)

(n,,)=(2)/2(n)=हे(2)/हे(n)=हे(n2)/हे(n)

फिर, क्योंकि , लिम n हे ( एन 2 ) / हे ( एन कश्मीर ) = 0 , जिसका अर्थ है कि उम्मीद में वहाँ चारों ओर शून्य दोहराया खंड हो जाएगा कश्मीर जब यादृच्छिक सैट सूत्रों पैदा सेलमेन का उपयोग कर -SAT चरण संक्रमण नमूना।3लिमnहे(n2)/हे(n)=0

बेशर्म आत्म प्रचार - मैं अपने स्वामी की थीसिस की धारा 4.1 में इन विषयों पर संक्षेप में चर्चा करता हूं ।

रैंडम QBF

जैसा कि यह पता चला है, यादृच्छिक QBF के लिए स्थिति अधिक दिलचस्प है। क्या हैं AFAIK यादृच्छिक QBF पर पहले तीन पेपरों में से प्रत्येक ने एक नया यादृच्छिक मॉडल प्रस्तावित किया, जो उनके पूर्ववर्ती को समेटता है।

निम्नलिखित कागजात देखें:

  • कडोली एट अल। "प्रायोगिक विश्लेषण की कम्प्यूटेशनल लागत का मूल्यांकन मात्रात्मक बूलियन फार्मूले।" एआई * आईए 1997
  • Gent + वाल्श "एनपी से परे: QSAT चरण संक्रमण।" AAAI / IAAI 1999
  • चेन + इंटरियन "रैंडम क्वांटिफाइड बुलियन फॉर्मूले बनाने के लिए एक मॉडल।" IJCAI 2005

14

[स्पष्टता के लिए संपादित]

शोध साहित्य में सबसे व्यापक रूप से इस्तेमाल की जाने वाली परिभाषा वह है जिसमें क्लॉज़ के लिए बिल्कुल अलग चर की आवश्यकता होती है, और कोई डुप्लिकेट खंड नहीं। यदि आप अलग-अलग चर प्रतिबंधों को शिथिल करते हैं, तो मौजूदा शोध का अधिकांश हिस्सा आपके लिए मायने नहीं रखेगा क्योंकि आपके परिणाम उनके परिणामों से मेल नहीं खाएंगे। अच्छी तरह से ज्ञात संतृप्त / असंतत चरण संक्रमण एक भिन्न खंड-से-चर अनुपात (यदि संक्रमण सभी में मौजूद है) पर होगा और आपको कठिन SAT उदाहरण नहीं मिलेंगे, जहाँ आप साहित्य से उम्मीद करेंगे।


3
मिशेल, सेलमैन और लेवेस्क द्वारा हार्ड संतुष्टि की समस्या उत्पन्न करना । धारा 4 का वर्णन है कि वे क्या कहते हैं "रैंडम के-सैट।" कागज प्रतिबंधों को शिथिल करने की बात नहीं करता है; जो एक यादृच्छिक 3SAT जनरेटर को संशोधित करने और एक विशिष्ट डीपीएलएल-आधारित एसएटी सॉल्वर में कई उदाहरणों को खिलाने से आता है।
काइल जोन्स

5
"सबसे सही परिभाषा वह है जो यादृच्छिक 3AAT के लिए प्रति चर 4.26 खंडों पर संतृप्त / असंतत चरण संक्रमण पैदा करता है।" आप मजाक कर रहे हैं।
त्सुयोशी इतो

1
@Tsuyoshi: जबकि "सबसे सही" निश्चित रूप से एक खिंचाव है, मुझे लगता है कि तर्क यह है कि यह संस्करण मानक है और सबसे अच्छा अध्ययन किया गया है।
हक बेनेट

2
आप एक विचित्र दावा कर रहे हैं कि 4.26 जादू की संख्या है जो "यादृच्छिक के-सैट" शब्द की एक विशेष परिभाषा को सबसे सही के रूप में अलग करती है। यदि यह मजाक नहीं है, तो मुझे नहीं पता कि क्या कहना है।
त्सुकोशी इटो

4
नहीं, मैं यह दावा कर रहा हूं कि चरण संक्रमण की खोज और उसके बाद के सभी शोध और कागजात जो यादृच्छिक k-SAT की डिफ़ॉल्ट परिभाषा पर सहमत हैं, जो कि मैंने दी गई परिभाषा है। यदि आप एक अलग परिभाषा का उपयोग करते हैं तो बहुत सारे कागजात आपके लिए समझ में नहीं आने वाले हैं क्योंकि आपके परिणाम उनके परिणामों से मेल नहीं खाएंगे। यदि आप एक सैट सॉल्वर पर काम कर रहे हैं, तो आपको आसानी से ऐसे उदाहरण मिलेंगे, जहाँ मैंने पढ़ा हुआ प्रत्येक संबंधित कागज यह कहता है कि आपको कठिन चीजें मिलनी चाहिए। इसके बारे में कुछ भी जादुई नहीं है, बस इस बिंदु पर सम्मेलन की स्थापना की। यदि आप प्रतिपक्षों का हवाला देना चाहते हैं, तो ऐसा करें।
काइल जोन्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.