लैटिन हाइपरक्यूब सैम्पलिंग एसिम्पोटिक्स


11

मैं उस समस्या के लिए एक प्रमाण का निर्माण करने की कोशिश कर रहा हूं, जिस पर मैं काम कर रहा हूं और एक धारणा जो मैं बना रहा हूं, वह यह है कि जिन बिंदुओं का मैं नमूना ले रहा हूं, वे पूरे स्थान पर घने हैं। व्यावहारिक रूप से, मैं पूरे नमूना स्थान पर अपने अंक प्राप्त करने के लिए लैटिन हाइपरक्यूब नमूने का उपयोग कर रहा हूं। क्या मैं जानना चाहूंगा कि क्या लैटिन हाइपरक्यूब नमूने पूरे स्थान पर घने हैं यदि आप अपने नमूना आकार को करते हैं ? यदि हां, तो इस तथ्य के लिए एक प्रशस्ति पत्र की बहुत सराहना की जाएगी।


4
हां, एक निरंतर वितरण को मानते हुए, क्योंकि किसी भी आप विभाजनों की संख्या को इस तरह निर्धारित कर सकते हैं कि सभी प्रति-चर अंतराल की चौड़ाई । इस प्रकार आपके द्वारा चुने गए किसी भी बिंदु के चारों ओर एक चौड़ाई हाइपरक्यूब द्वारा कम से कम एक हाइपरएन्थेवल (यानी नमूना मात्रा) सख्ती से निहित है । (टिप्पणी, उत्तर नहीं, जैसा कि मुझे पता है कि एलएचएस के बारे में दस मिनट पहले तक एलएचएस आता है ...)ϵ>0<ϵ/2ϵ
क्रोसोसोट

यह सच है, लेकिन मुझे नहीं लगता कि यह आसानी से बड़े लैटिन हाइपरक्यूब के नमूनों की घनत्व दिखाने के लिए इस्तेमाल किया जा सकता है। इसका कारण यह है कि एलएचएस में सैंपल पॉइंट स्वतंत्र नहीं हैं: एक विशिष्ट हाइपरएंड्रावल के अंदर एक नमूना बिंदु का अस्तित्व किसी भी अन्य नमूना बिंदुओं को एक ही पंक्ति / कॉलम (या जो भी इसके लिए बहुआयामी शब्द है) में दिखाई देने से रोकता है। ।
एस। कैटरल मोनिका

क्या आपको लगता है कि आप अपने उत्तर को और अधिक औपचारिक बना सकते हैं?

@RustyStatistician, कृपया अपने प्रमाण द्वारा आवश्यक रूप से, औपचारिक तरीके से, समझाने के लिए अपनी शुरुआती पोस्ट का विस्तार करें, "आप जिस बिंदु से मैं नमूना ले रहा हूँ, उसका पूरा स्थान घना है"। धन्यवाद।
Creosote

यदि मैं एक प्रारंभिक लैटिन हाइपरक्यूब नमूना लेता हूं जहां इतना बड़ा है, तो हम इसे निष्क्रियता मानते हैं, क्या यह 'नमूना' है? ' n

जवाबों:


6

संक्षिप्त उत्तर: हां, एक संभाव्य तरीके से। यह दिखाना संभव है कि, किसी भी दूरी , किसी भी परिमित सबसेट का नमूना स्थान और किसी भी निर्धारित 'सहिष्णुता' , को देखते हुए संभव है कि हम बड़े आकार के आकार के लिए संभव हो। सुनिश्चित करें कि की दूरी के भीतर एक नमूना बिंदु होने की संभावना है सभी लिए ।{ x 1 , ... , एक्स मीटर } δ > 0 ε एक्स मैं > 1 - δ मैं = 1 , ... , मीटरϵ>0{x1,,xm}δ>0ϵxi>1δi=1,,m

लंबे उत्तर: मुझे किसी भी सीधे प्रासंगिक उद्धरण के बारे में पता नहीं है (लेकिन नीचे देखें)। लैटिन हाइपरक्यूब नमूनाकरण (एलएचएस) पर अधिकांश साहित्य इसके विचरण में कमी के गुणों से संबंधित है। दूसरा मुद्दा यह है कि, यह कहने का क्या मतलब है कि नमूना आकार को ? सरल आईआईडी यादृच्छिक नमूने के लिए, आकार एक नमूना एक और स्वतंत्र नमूना जोड़कर आकार नमूने से प्राप्त किया जा सकता है । LHS के लिए मुझे नहीं लगता कि आप इसे कर सकते हैं क्योंकि प्रक्रिया के भाग के रूप में नमूनों की संख्या अग्रिम में निर्दिष्ट की गई है। तो यह लगता है कि आप का एक उत्तराधिकार लेने के लिए होता है कि स्वतंत्र आकार के एलएचएस नमूने ।n n - 1 1 , 2 , 3 , nn11,2,3,...

सीमा में 'घने' की व्याख्या करने का भी कुछ तरीका होना चाहिए क्योंकि नमूना आकार को । घनत्व एलएचएस के लिए नियतात्मक तरीके से धारण करने के लिए प्रतीत नहीं होता है। दो आयामों में, आप आकार के एलएचएस नमूनों का एक क्रम चुन सकते हैं जैसे कि वे सभी के विकर्ण से चिपके रहते हैं। । तो किसी प्रकार की संभाव्य परिभाषा आवश्यक लगती है। प्रत्येक , कुछ स्टोकेस्टिक तंत्र के अनुसार उत्पन्न का एक नमूना हो । मान लें कि, विभिन्न , ये नमूने स्वतंत्र हैं। तब एसिम्प्टोटिक घनत्व को परिभाषित करने के लिए हमें प्रत्येक , और प्रत्येक के लिए आवश्यकता हो सकती है1,2,3,...[0,1)2nXn=(Xn1,Xn2,...,Xnn)nnϵ>0xनमूना स्थान में (माना जाता है ), हमारे पास (है के रूप में )।[0,1)dP(min1knXnkxϵ)0n

यदि नमूना वितरण ('IID यादृच्छिक नमूना') से स्वतंत्र नमूने लेकर प्राप्त किया जाता है, तो जहां त्रिज्या की -dimensional गेंद की मात्रा है । तो निश्चित रूप से IID यादृच्छिक नमूना स्पर्शोन्मुख रूप से घना है।XnnU([0,1)d)

P(min1knXnkxϵ)=k=1nP(Xnkxϵ)(1vϵ2d)n0
vϵdϵ

अब इस मामले पर विचार करें कि नमूने LHS द्वारा प्राप्त किए गए हैं। इन नोटों में प्रमेय 10.1 में कहा गया है कि नमूना के सदस्यों को रूप में वितरित किया जाता है । हालांकि, LHS (हालांकि विभिन्न आयामों के लिए स्वतंत्र) की परिभाषा में उपयोग किए गए क्रमांकन नमूना के सदस्यों ( ) के बीच कुछ निर्भरता को प्रेरित करते हैं , इसलिए यह कम स्पष्ट है कि स्पर्शोन्मुख घनत्व संपत्ति रखता है।XnXnU([0,1)d)Xnk,kn

फिक्स [ और । परिभाषित करें । हम उस दिखाना चाहते हैं । ऐसा करने के लिए, हम उन नोटों में प्रस्ताव 10.3 का उपयोग कर सकते हैं , जो लैटिन हाइपरक्यूब नमूनाकरण के लिए केंद्रीय सीमा प्रमेय का एक प्रकार है। परिभाषित द्वारा यदि त्रिज्या के गेंद में है चारों ओर , अन्यथा। तब प्रस्ताव 10.3 हमें बताता है कि जहां औरϵ>0x[0,1)dPn=P(min1knXnkxϵ)Pn0f:[0,1]dRf(z)=1zϵxf(z)=0Yn:=n(μ^LHSμ)dN(0,Σ)μ=[0,1]df(z)dzμ^LHS=1ni=1nf(Xni)

लो । आखिरकार, बड़े पर्याप्त , हमारे पास । इसलिए अंततः हमारे पास । इसलिए , जहां मानक सामान्य cdf है। चूंकि मनमाना था, इसलिए यह आवश्यक रूप अनुसरण करता है।L>0nnμ<LPn=P(Yn=nμ)P(Yn<L)lim supPnlim supP(Yn<L)=Φ(LΣ)ΦLPn0

यह दोनों बेतरतीब नमूनाकरण और LHS के लिए एसिम्प्टोटिक घनत्व (जैसा कि ऊपर बताया गया है) साबित होता है। अनौपचारिक रूप से, इस का मतलब है कि किसी भी और किसी भी नमूना अंतरिक्ष में, संभावना है कि नमूना भीतर करने के लिए हो जाता है की 1 के करीब के रूप में के रूप में आप नमूने का आकार चुनने पर्याप्त रूप से बड़े से खुश किया जा सकता है। नमूना स्थान के परिमित सबसेट पर लागू होने के लिए, जैसा कि हम पहले से ही परिमित सबसे पहले प्रत्येक बिंदु को जानते हैं, को लागू करना आसान है। औपचारिक रूप से, इसका मतलब है कि हम दिखा सकते हैं: नमूना स्थान के किसी भी और किसी भी परिमित सबसेट के लिए;ϵxϵxϵ>0{x1,...,xm}min1jmP(min1knXnkxj<ϵ)1 (as )।n


मेरे दो प्रश्न हैं: 1) यदि आपके पास सिर्फ आकार का नमूना है जहां बड़ा है, तो क्या यह तर्क बदलता है? और 2) लैटिन हाइपरक्यूब्स नमूने किसी भी श्रेणी के मानों पर हो सकते हैं (जरूरी नहीं कि सिर्फ (0,1)) तो क्या इससे तीखे उत्तर भी बदल सकते हैं? nn

इसके अलावा, आप यह समझाने के लिए तैयार होंगे कि बड़े , हमारे पास क्यों होगा? मुझे लगता है कि इसका मतलब है कि बड़े , शून्य हो जाता है, क्योंकि वितरण में यह ? nnμnμ^LHSN(0,Σ)

@RustyStatistician सब कुछ परिमित नमूनों यानी लेकिन बड़े के रूप में परिभाषित किया गया है । मैंने जो कुछ हो रहा है उसे स्पष्ट करने के लिए अंत में कुछ अतिरिक्त स्पष्टीकरण जोड़ा है। मूल्यों की अन्य श्रेणियों को आसानी से समायोजित किया जा सकता है ((0,1) विशेष नहीं है), जब तक कि नमूना स्थान का आयतन परिमित नहीं हो जाता। n<
एस। कैटरल ने मोनिका

क्या आप अपने संक्षिप्त उत्तर के बारे में विस्तार से बता सकते हैं?

@RustyStatistician संक्षिप्त उत्तर मेरे लंबे उत्तर का एक अनौपचारिक सारांश है, जो मुझे लगता है कि आप सहमत होंगे, पहले से ही काफी विस्तृत है! इसलिए, जैसा कि ऊपर सुझाव दिया गया है, यह अच्छा होगा यदि आप अपने प्रश्न को अधिक औपचारिक शब्दों में लिख सकते हैं ताकि मुझे पता चले कि मेरा प्रयास सही उत्तर पर है (आपके इच्छित प्रश्न का उत्तर देने के संदर्भ में) या नहीं।
एस। कैटरल ने मोनिका

3

मुझे यकीन नहीं है कि यह काफी है जो आप चाहते हैं, लेकिन यहाँ जाता है।

आप एलएचएस-नमूनाकरण बिंदुओं से , कहते हैं। हम बहुत अनौपचारिक रूप से तर्क देंगे कि, किसी भी , प्रत्येक आयाम में आकार ( ) के खाली (हाइपर) क्यूबॉयड की अपेक्षित संख्या शून्य हो जाती है ।n[0,1)dϵ>0ϵn

बता दें कि ताकि यदि हम विभाजित करें समान रूप से छोटे घनाकार - microcuboids , का कहना है - चौड़ाई तो हर चौड़ाई घनाभ समाहित है। कम से कम एक माइक्रोक्रबॉयड। इसलिए यदि हम यह दिखा सकते हैं कि अनमैप्लेटेड माइक्रोकोबॉइड्स की अपेक्षित संख्या शून्य है, इस सीमा में _ , तो हम कर रहे हैं। (ध्यान दें कि हमारे microcuboids को एक नियमित ग्रिड पर व्यवस्थित किया जाता है, लेकिन -cuboids किसी भी स्थिति में हो सकता है।)m=2/ϵ[0,1)dmd1/mϵnϵ

पहले नमूने बिंदु के साथ दिए गए माइक्रोकैबॉइड को पूरी तरह से गायब करने का मौका , स्वतंत्र है , नमूना निर्देशांक (पहला नमूना बिंदु) के पहले सेट को स्वतंत्र रूप से चुना जा सकता है। यह देखते हुए कि पहले कुछ सैंपल पॉइंट्स में वह सब छूट गया था, माइक्रोकैबॉइड, बाद के सैंपल पॉइंट्स को मिस करने में मुश्किल होगी (औसतन), इसलिए सभी पॉइंट्स के गुम होने की संभावना इससे कम है ।1mdndn(1md)n

हैं में microcuboids , इसलिए अपेक्षित संख्या में याद किया जाता है कि द्वारा ऊपर घिरा है - क्योंकि उम्मीदों को जोड़ने - जो है शून्य सीमा में ।md[0,1)dmd(1md)nn


अपडेट ...

(1) यहाँ एक चित्र दिखाया गया है कि, दिए गए , आप पर्याप्त रूप से चुन सकते हैं ताकि "microcuboids" का एक ग्रिड (इस 2-आयामी चित्रण में वर्ग) को कम से कम माइक्रो-कुबोइड होने की गारंटी हो किसी भी आकार का क्षेत्र। मैंने दो "बेतरतीब ढंग से"-चुना क्षेत्रों को दिखाया है और दो माइक्रोकैबॉइड्स को बैंगनी रंग में रंग दिया है।ϵmm×m ϵ×ϵϵ×ϵ

यहाँ छवि विवरण दर्ज करें

(२) किसी विशेष माइक्रोक्यूबॉयड पर विचार करें। इसमें पूरे स्थान का आयतन , एक अंश है। तो पहला एलएचएस नमूना - जो केवल एक ही पूरी तरह से स्वतंत्र रूप से चुना गया है - यह संभावना । केवल महत्वपूर्ण तथ्य यह है कि यह एक निश्चित मान है (हम छोड़ देंगे , लेकिन स्थिर रखें ) जो से कम है ।(1/m)dmd1mdnm1

(३) अब नमूना अंक की संख्या के बारे में सोचें । मैंने चित्र में चित्रण किया है । LHS इन सुपर-नन्हे महीन जाल में "नैनोक्यूइड्स" (यदि आप करेंगे) का आकार काम करता है, न कि बड़े "microcuboids" आकार का है, लेकिन वास्तव में यह सबूत में महत्वपूर्ण नहीं है। प्रमाण को केवल थोड़े से हाथ से लहराते हुए बयान की आवश्यकता होती है कि यह किसी दिए गए माइक्रोकैबॉइड को गायब करने के लिए औसत रूप से कठिन हो जाता है, क्योंकि आप अधिक अंक फेंकते हैं। तो यह पहली LHS बिंदु के लापता होने के लिए की संभावना थी , लेकिन उनमें से सभी गायब होने के लिए से कम : कि सीमा के रूप में शून्य हैn>mn=6mn1×n1m1×m11md(1md)n nn

(४) ये सभी एप्सिलॉन एक प्रमाण के लिए ठीक हैं लेकिन आपके अंतर्ज्ञान के लिए महान नहीं हैं। तो यहाँ चित्र और नमूना बिंदुओं की एक जोड़ी है , जिसमें सबसे बड़ा खाली आयताकार क्षेत्र हाइलाइट किया गया है। (ग्रिड ग्रिड नमूना एलएचएस है - "nanocuboids" पहले कहा जाता है।) यह "स्पष्ट" (कुछ अस्पष्ट सहज अर्थ में) है कि सबसे बड़ी खाली क्षेत्र नमूना अंकों की संख्या के रूप में करने के लिए मनमाने ढंग से छोटे आकार हटना होगा होना चाहिए ।n=10n=50n

यहाँ छवि विवरण दर्ज करें


क्या यह तर्क किसी सामान्य अंतराल के लिए है? इसके बजाय ? [0,1)

हाँ, किसी भी परिमित आयामों के लिए। अब यह स्पष्ट होना चाहिए कि मैंने प्रमाण तय कर दिया है।
Creosote

क्या इस प्रमाण की 1-डी या 2-डी तस्वीर देना संभव है? मैं इसमें बहुत खोया हुआ हूं।

किया हुआ। जरूरत पड़ने पर और सवाल करने की खुशी।
Creosote

बहुत अच्छे धन्यवाद! यह निश्चित रूप से अंतर्ज्ञान के साथ अब मदद करता है।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.