L_k-different के लिए सबसे छोटे NFA के आकार पर सीमाएं


18

भाषा पर विचार करें एल कश्मीर - d मैं रों टी मैं n टीLkdistinct सभी से मिलकर कश्मीरk -letter तार से अधिक ΣΣ ऐसी है कि कोई दो पत्र के बराबर हैं:

एल कश्मीर - d मैं रों टी मैं n टी : = { w = σ 1 σ 2σ कश्मीर | मैं [ कश्मीर ] : σ मैंΣ  और  जे मैं : σ jσ मैं }  

Lkdistinct:={w=σ1σ2...σki[k]:σiΣ  and  ji:σjσi}

यह भाषा परिमित है और इसलिए नियमित है। विशेष रूप से, यदि | Σ | = एन|Σ|=n , फिर | L k - d i s t i n c t | = ( एनk ) के! |Lkdistinct|=(nk)k!

इस भाषा को स्वीकार करने वाला सबसे छोटा गैर-निर्धारक परिमित ऑटोमोटन क्या है?

वर्तमान में मेरे पास निम्न ढीले ऊपरी और निचले सीमा हैं:

  • छोटी से छोटी NFA मैं निर्माण कर सकते हैं है 4 कश्मीर ( 1 + ( 1 ) )पी एल वाई एल जी ( एन )4k(1+o(1))polylog(n) राज्यों।

  • निम्नांकित लेम्मा का अर्थ है 2 k2k राज्यों का निचला भाग :

चलो एक नियमित रूप से भाषा हो। मान लीजिए कि जोड़े that जैसे कि अगर और केवल । तब L को स्वीकार करने वाले किसी भी NFA में कम से कम n राज्य होते हैं।LΣLΣnnP={(xi,wi)1in}P={(xi,wi)1in}xiwjLxiwjLi=ji=j

  • एक और (तुच्छ) निचला बाउंड , जो भाषा के लिए सबसे छोटे DFA के आकार का लॉग है।loglog(nk)(nk)

मुझे NFA में भी दिलचस्पी है जो केवल एक निश्चित अंश ( ) को स्वीकार करते हैं , अगर का आकार ।0<ϵ<10<ϵ<1LkdistinctLkdistinctϵ4k(1+o(1))polylog(n)ϵ4k(1+o(1))polylog(n)


संपादित करें: मैंने सिर्फ एक इनाम शुरू किया है जिसमें पाठ में गलती थी।

मेरा मतलब है कि हम मान सकते हैं जबकि मैंने लिखा था ।k=polylog(n)k=polylog(n)k=O(log(n))k=O(log(n))

EDIT2:

इनाम जल्द ही समाप्त होने वाला है, इसलिए अगर किसी को इसमें दिलचस्पी है कि इसे अर्जित करने का एक आसान तरीका क्या है, तो निम्न भाषा पर विचार करें:

L(r,k)distinct:={w:wL(r,k)distinct:={w:w में अलग चिह्न होते हैं और कोई चिन्ह टाइम्स से अधिक नहीं दिखाई देते हैं ।kkrr}}

(अर्थात )।L(1,k)distinct=LkdistinctL(1,k)distinct=Lkdistinct

टिप्पणियों में से एक के रूप में एक समान निर्माण लिए आकार का ।O(ek2klog(1+r)poly(n))O(ek2klog(1+r)poly(n))L(r,k)distinctL(r,k)distinct

क्या इसमें सुधार किया जा सकता है? इस भाषा के लिए सबसे अच्छी निचली सीमा क्या है?


2
क्या आप अपनी ऊपरी बाध्य एनएफए का वर्णन कर सकते हैं?
mjqxxxx

मैं इसके बारे में अभी तक नहीं लिख सकता क्योंकि हम अभी भी इस पर काम कर रहे हैं, और सबूत पूरा नहीं किया है। इसके बजाय, मैं आकार का एक बहुत सरल automaton व्याख्या करेंगे कि हे ( ( 2 ) कश्मीर * 2 हे ( एल जी ( कश्मीर ) ) * एल जी ( एन ) )O((2e)k2O(log(k))log(n)) : एक लो ( एन , कश्मीर )(n,k) -perfect हैश परिवार H । हर ऐसा हैश फंक्शन h होता है : [ n ] [ k ]h:[n][k]। इसका मतलब है कि के हर सबसेट के लिए [ एन ] अधिक से अधिक आकार के कश्मीर , एक समारोह में मौजूद है एच यह अलग संख्या के सबसेट के हर आइटम नक्शे ऐसी है कि। हैशिंग के बाद, परिणामी वर्णमाला में k अक्षर होते हैं, इसलिए 2 k आकार का एक ऑटमटोन L k - d i s t i n c t भाषा स्वीकार कर सकता है । [n]khHk2kLkdistinct
RB

4
निचली सीमा देता है ( 2 - o ( 1 ) ) k सिर्फ उन राज्यों की संख्या की गिनती करता है जो NFA वास्तव में k / 2 चरणों के बाद हो सकते हैं । मुझे नहीं लगता कि मैं किसी भी सबूत विधि से अवगत हूं जो कुल आकार के लिए काफी बेहतर सीमा देता है , जो कुछ चरणों के लिए टी चरणों के बाद क्या होता है, यह देखने की तुलना में प्राप्त किया जा सकता है । लेकिन यहाँ, हर t के लिए एक NFA है जो वास्तव में t राज्यों के बाद ( 2 + o ( 1 ) ) k राज्यों में से केवल एक में हो सकता है।(2o(1))kk/2ttt(2+o(1))kt
नोम

3
प्रमाण (मेरे पिछले दावे का): सबसे कठिन मामला t = k / 2 है ; चुनें 2 कश्मीरपी एल y ( कश्मीर , लॉग n ) विभिन्न यादृच्छिक सबसेट एस मैं (के एन वर्णमाला प्रतीक) आकार के बिल्कुल टी प्रत्येक और एक NFA है कि प्रत्येक के लिए एक राज्य है निर्माण मैं कुछ पथ iff यह करने के लिए अग्रणी के साथ पहले टी प्रतीक सभी अलग हैं और एस i में निहित हैं , और इसमें से एक स्वीकार पथ है अगर निम्नलिखित k - tt=k/22kpoly(k,logn)SintitSiktप्रतीक सभी अलग हैं और S i के पूरक में निहित हैं । एक गिनती तर्क यह दिखाएगा कि व्हिप ( S i की यादृच्छिक पसंद पर ) यह NFA वास्तव में सभी वांछित भाषा को स्वीकार करेगा। SiSi
नोम

3
पिछले निर्माण में, एनएफए के निर्माण का सबसे सरल तरीका लंबाई j < t के प्रत्येक संभावित उपसर्ग के लिए एक राज्य होगा और लंबाई j > k - t के प्रत्येक संभव प्रत्यय के लिए । इसके बजाय, NFA के उपसर्ग भाग और प्रत्यय भाग को एक ही यादृच्छिक निर्माण (लेकिन अब केवल S i और इसके पूरक के भीतर क्रमशः) का उपयोग करके पुन: निर्मित किया जा सकता है और यह एक ( 4 + o ( 1 ) ) k कुल आकार देगा। j<tj>ktSi(4+o(1))k
नोम

जवाबों:


2

यह एक उत्तर नहीं है, लेकिन एक विधि है जो मेरा मानना ​​है कि एक बेहतर निचले बाउंड को छोड़ देगा। हमें एक पत्र पढ़ने के बाद समस्या में कटौती करते हैं। के परिवार को निरूपित एक के तत्व सेट [ एन ] से एक और की परिवार = कश्मीर - एक तत्व के सेट [ एन ] द्वारा बी । के तत्वों को पढ़ने के बाद कहा गया है कि पहुंच के किया जा सकता है निरूपित एक से (किसी भी क्रम में) एस के तत्वों को पढ़ने के बाद और राज्यों जिसमें से एक को स्वीकार राज्य पहुँचा जा सकता है बी द्वारा (किसी भी क्रम में) टी बीaa[n]Ab=ka[n]BASABTB। हम की जरूरत है कि एस टी बी यदि और केवल यदि एक बी = । यह पहले से ही राज्यों की आवश्यक संख्या के लिए एक कम बाध्य है और मुझे लगता है कि यह कुछ गैर-तुच्छ दे सकता है।SATBAB=

यह समस्या अनिवार्य रूप से एक हाइपरग्राफ के कोने की संख्या पर कम बाध्य के लिए पूछती है जिसका रेखा ग्राफ (आंशिक रूप से) ज्ञात है। इसी तरह की समस्याओं का अध्ययन किया गया था, उदाहरण के लिए, बोलोबस द्वारा और कई ज्ञात सबूत विधियां हैं जो उपयोगी हो सकती हैं।

अपडेट 2014/03/24: वास्तव में ऊपर hypergraph पर महसूस किया जा सकता है, तो रों कोने, तो हम भी लंबाई के एक गैर नियतात्मक संचार जटिलता प्रोटोकॉल प्राप्त लॉग रों आकार के आदानों सेट के साथ सेट disjointness के लिए एक और (वास्तव में दोनों समस्याओं बराबर हैं)। टोंटी निश्चित रूप से तब होता है जब एक = = कश्मीर / 2 , इस के लिए मैं केवल ईयाल और नोम की पुस्तक में निम्नलिखित मिल सकता है: एन 1 ( डी मैं एस जे एक ) लॉग ( 2 कश्मीर लॉग (slogsaba=b=k/2na ) )मानक संभाव्य तर्क द्वारा सिद्ध किया गया। दुर्भाग्य से मैं (अभी तक) इस समस्या पर काफी अच्छा कम सीमा मिल सकता है, लेकिन इसके बाद के संस्करण संभालने तेज है, यह एक लोअर बाउंड देना होगाΩ(2कश्मीरलॉगएन)दो निचले सीमा आपने उल्लेख किया है एकीकृत।N1(DISJa)log(2kloge(na))Ω(2klogn)


1
आपके उत्तर के लिए धन्यवाद @domotorp। यह लगता है लेम्मा मैं मूल प्रश्न में कम बाध्य के लिए उपयोग किया है के सबूत की तरह एक बहुत कुछ है, लेकिन वास्तविक निर्दिष्ट किए बिना एक्स मैं की और y मैं की, और एक गणनीय बाध्य इस प्रकार नहीं। ऊपर दिए गए प्रश्न पर आपकी टिप्पणी से पता चलता है कि 2 k बाउंड को उस पद्धति से नहीं सुधारा जा सकता है, क्या आपको लगता है कि यह बेहतर कर सकता है? xiyi2k
आरबी

3
ऊपर मेरी टिप्पणी का पूरा बिंदु यह था कि ये तकनीकें ऊपर दी गई निचली सीमा ( 2 + o ( 1 ) ) k नहीं दे सकती हैं । यह वास्तव में इस समस्या को मेरे लिए दिलचस्प बनाता है। (2+o(1))k
नोआम

@ नोम: लेट के = २, ए = बी = १। पहले से ही हमें एक लॉग एन लोअर बाउंड मिलता है क्योंकि हर एस को अलग होना चाहिए। lognSA
डोमटॉर्प

1
@domotorp: ( 1 ) को छुपा देती हे ( कश्मीर लॉग एन ) कारक: यहाँ सबसे खराब स्थिति है, जहां के लिए विश्लेषण है एक = = कश्मीर / 2 : एक निश्चित के साथ शुरू एक और बी और यादृच्छिक एक सबसेट पर लेने एस के n पत्र तो हमारे पास पी आर [ एक एसo(1)O(klogn)a=b=k/2ABSnएक एन डीBSc]=2kPr[ASandBSc]=2k. Now pick r2kr2k such sets at random then the probability that for at least one of them this happens is 1exp(r)1exp(r). If we choose r=O(log(nk ) )=O(klogn)तब हमें पता चलता है कि यह सबए-असॉल्ट सेटAऔरB के लिए है(आकारk/2 का)। इस निर्माण मेंऐसेSकी कुल संख्याO(2kklogn) है
नोम

2
@Noam: I am sorry but I have never seen a logn hidden in an o(1), especially as the problem is also interesting imho for k<<logn. But you are right that R B asked about k=polylogn.
domotorp

0

Some work in progress:

I'm trying to prove a lower bound of 4k. Here is a question that I'm pretty sure would give such a lower bound: find the minimum t such that there exists a function f:{S[n],|S|=k/2}{0,1}t that preserves disjointness, i.e. that S1S2= iff f(S1)f(S2)=. I'm pretty sure a lower bound of t2k would almost immediately imply a lower bound of 22k=4k for our problem. f(S) roughly corresponds to the set of nodes the NFA can get to after reading the first k/2 symbols of the input, when the set of these k/2 symbols is S.

I think the solution to this question might already be known, either in the communication complexity literature (especially in papers dealing with the disjointness problem; maybe some matrix rank arguments will help), or in literature about encodings (e.g. like this).


2
My comments above show that this approach cannot beat (2+o(1))n
Noam
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.