क्या कोई परिणाम है जो बूटस्ट्रैप प्रदान करता है मान्य है यदि और केवल अगर आंकड़ा सुचारू है?


25

हम मान लेते हैं कि हमारा आँकड़ा कुछ डेटा का एक कार्य है जो वितरण फ़ंक्शन से खींचा गया है ; हमारे नमूने के अनुभवजन्य वितरण समारोह । So एक यादृच्छिक चर के रूप में देखा जाने वाला आँकड़ा है और सांख्यिकी का बूटस्ट्रैप संस्करण है। हम दूरी के रूप में उपयोग करते हैंθ()X1,Xnएफ θ ( एफ ) θ ( एफ ) FF^θ(F)θ(F^)d

बूटस्ट्रैप की वैधता के लिए "यदि और केवल अगर" परिणाम हैं तो सांख्यिकीय एक सरल रैखिक सांख्यिकीय है। उदाहरण के लिए मैममेन से प्रमेय 1 "बूटस्ट्रैप कब काम करता है?"

यदि कुछ अनियंत्रित फ़ंक्शन लिए तो बूटस्ट्रैप इस अर्थ में काम करता है कि if और केवल तभी मौजूद है जब और ऐसा है कि जहाँ हम अपने नमूने के कुछ फंक्शन के रूप में को परिभाषित कर सकते हैं औरn[एल(θ( एफ ) - टी एन),एल(θ(एफ)-टीएन)]पी0σएनटीएनडी[एल(θ(एफ)-टीएन)θ(F)=1ni1nhn(Xi)hn

d[L(θ(F^)t^n),L(θ(F)tn)]p0
σntn^ टी एन टी एन = ( टी एन )
d[L(θ(F)tn),N(0,σn2)]p0
tn^tn=E(t^n)

ऐसे और भी सामान्य परिणाम हैं जो बूटस्ट्रैप सामान्य आँकड़ों के लिए काम करता है, उदाहरण के लिए थिओरेम 1.6.3 पॉलिसाइटिस रोमानो और वुल्फ द्वारा सब्स्क्रिप्शनिंग से:

मान लें कि परिमित समर्थन के साथ सभी वितरणों के वर्ग से निकाला गया है। मान लें कि आँकड़ा फ़्रेचेट के लिए से अलग है, वर्चस्व के मानदंड और व्युत्पन्न g_F को संतुष्ट करता है 0 <\ textrm {Var} _F [g_F (x]] <\ infty । तब \ Theta (F) असमान रूप से सामान्य है और बूटस्ट्रैप पिछले प्रमेय के अर्थ में काम करता है।θ ( ) एफ जी एफ 0 < वार एफ [ जी एफ ( एक्स ) ] < θ ( एफ )Fθ()FgF0<VarF[gF(x)]<θ(F)

मैं एक 'अगर और केवल अगर' दूसरे प्रमेय का संस्करण चाहूंगा। इसके लिए फ्रीचेट की विभिन्नता से अलग सहजता की धारणा की आवश्यकता होगी क्योंकि पोलिटिस, रोमानो और वुल्फ (1999) बताते हैं कि सैंपल माध्य फ्रीचेट अलग नहीं है लेकिन बूटस्ट्रैप अभी भी काम करता है। हालाँकि नमूना माध्यिका अभी भी डेटा का एक चिकनी कार्य है।

मामेन में कुछ अनौपचारिक टिप्पणियां हैं कि चिकनाई आवश्यक है:

आमतौर पर स्थानीय विषमता लयबद्धता बूटस्ट्रैप की स्थिरता के लिए आवश्यक लगती है

उद्धरण है:

वैन ज़्वेट, डब्ल्यू (1989)। ओलबरवॉल्फ में "आंकड़ों में कंप्यूटर गहन प्रक्रियाओं के लिए असममित तरीके" पर सम्मेलन में दी गई बात।

लेकिन मैं एक मुट्ठी भर उद्धरणों के अलावा इस बात का कोई पता नहीं लगा सकता।


1
बहुत बढ़िया विषय। क्या यह सही है कि सभी उद्धृत परिणाम अनन्तता के लिए जाने वाले नमूना आकारों के लिए विषम हैं?
माइकल एम

3
@ मिचेल आपको धन्यवाद और हाँ, सब कुछ रूप में । संयोग से परिमित नमूनों के परिणामों के साथ कुछ हालिया काम है (जैसे arxiv.org/pdf/1212.6906.pdf ) लेकिन यह बहुत तकनीकी है। n
orizon

1
जटिल विषय। कुछ लोग कहते हैं कि बूटस्ट्रैप सामान्य रूप से काम नहीं करता है । वैन Zwer एट अल। कहता है कि एक को सावधान रहना होगा कि बूटस्ट्रैप क्या है । मुझे लगता है कि किसी को बूटस्ट्रैप को स्थापित करना होगा और आगे की जांच से पहले बूटस्ट्रैप को नहीं करना चाहिए।
कार्ल

अब मैंने माममेन की टिप्पणी के जवाब में उत्तर को अपडेट किया, आशा है कि आपकी उलझन को और स्पष्ट करेगा। और यदि आप चाहें, तो आप उस एप्लिकेशन के बारे में थोड़ा समझा सकते हैं जो आपको आवश्यकता के बारे में पूछने के लिए प्रेरित करता है। इससे मुझे अपना उत्तर सुधारने में मदद मिलेगी।
हेनरी।

जवाबों:


12

(1) क्यों नहीं हैं लेकिन उनके बूटस्ट्रैप अनुमानक अभी भी सुसंगत हैं?

आपको उस स्थिति में बूटस्ट्रैप कार्य करने के लिए एक पर्याप्त स्थिति के रूप में हैडामर्ड डिस्टेंबेलिटी (या आपके संदर्भ स्रोत के आधार पर कॉम्पैक्ट भिन्नता) की आवश्यकता होती है, माध्यिका और किसी भी मात्रात्मक हैडैमर्ड को अलग-अलग किया जाता है। ज्यादातर अनुप्रयोगों में फ्रीचेट की भिन्नता बहुत मजबूत है।

चूंकि आमतौर पर यह पोलिश स्पेस पर चर्चा करने के लिए पर्याप्त है, इसलिए आप वैश्विक स्थिति के लिए अपनी स्थिरता परिणाम का विस्तार करने के लिए एक विशिष्ट कॉम्पैक्टनेस तर्क लागू करने के लिए स्थानीय रूप से रैखिक कार्यात्मक चाहते हैं। नीचे दिए गए रेखीय टिप्पणी को भी देखें।

[Wasserman] के सिद्धांत 2.27 आपको एक अंतर्ज्ञान देंगे कि कैसे Hadamard व्युत्पन्न एक कमजोर धारणा है। और [शाओ एंड तू] के थ्योरम 3.6 और 3.7 अवलोकन आकार साथ सांख्यिकीय कार्यात्मक के -हैडमर्ड भिन्नता के संदर्भ में कमजोर संगतता के लिए पर्याप्त स्थिति देंगे ।टी एन एनρTnn

(2) बूटस्ट्रैप की संगति को क्या प्रभावित करेगा?

[शाओ और तू] pp.85-86 सचित्र परिस्थितियाँ जहाँ बूटस्ट्रैप अनुमानकों की असंगतता हो सकती है।

(1) बूटस्ट्रैप जनसंख्या के पूंछ व्यवहार के प्रति संवेदनशील है । की संगति को उन परिस्थितियों की आवश्यकता होती है जो की सीमा के अस्तित्व के लिए आवश्यक से अधिक कठोर हैं ।एच बी टी एच एच FHBOOTH0

(2) बूटस्ट्रैप अनुमानक की स्थिरता के लिए दिए गए सांख्यिकीय (कार्यात्मक) से कुछ हद तक चिकनाई की आवश्यकता होती है ।Tn

(3) बूटस्ट्रैप अनुमानक का व्यवहार कभी-कभी बूटस्ट्रैप डेटा प्राप्त करने के लिए उपयोग की जाने वाली विधि पर निर्भर करता है।

और [शाओ & तू] के 3.5.2 सेकंड में, उन्होंने एक स्मूदिंग कर्नेल का उपयोग करके मात्रात्मक उदाहरण पर दोबारा गौर किया । ध्यान दें कि क्षण लीनियर फंक्शंस हैं, आपके प्रश्न में उद्धरण "आमतौर पर स्थानीय विषमता लयबद्धता बूटस्ट्रैप की निरंतरता के लिए आवश्यक प्रतीत होती है", कार्यात्मक के कुछ स्तर की आवश्यकता होती है, जो आवश्यक हो सकता है क्योंकि यदि आप विफल हो जाते हैं तो आप कुछ रोग संबंधी मामला बना सकते हैं Weierstrass फ़ंक्शन की तरह (जो कि अभी तक कहीं भी भिन्न नहीं है)।K

(3) बूटस्ट्रैप अनुमानक की स्थिरता सुनिश्चित करने में स्थानीय रैखिकता क्यों आवश्यक है?

जैसा कि आपने उल्लेख किया है, "टिप्पणी के लिए आम तौर पर स्थानीय विषमता लयबद्धता बूटस्ट्रैप की निरंतरता के लिए आवश्यक लगती है"। [शाओ और तू] p.78 की एक टिप्पणी इस प्रकार है, क्योंकि उन्होंने टिप्पणी की थी (वैश्विक) रेखीयकरण केवल एक टेकनीक है जो स्थिरता के प्रमाण की सुविधा देता है और किसी भी आवश्यकता को इंगित नहीं करता है:

रेखीयकरण बूटस्ट्रैप अनुमानकों की स्थिरता साबित करने में एक और महत्वपूर्ण तकनीक है, क्योंकि रैखिक आँकड़े के लिए परिणाम अक्सर उपलब्ध होते हैं या पहले शुरू की गई तकनीकों का उपयोग करके स्थापित किए जा सकते हैं। मान लीजिए कि किसी दिए गए आंकड़े Tn को एक रैखिक यादृच्छिक चर (जहां द्वारा अनुमानित किया जा सकता है में एक रेखीय आंकड़ा है ), यानी, (3.19) Let और बूटस्ट्रैप नमूना के आधार पर, क्रमशः और के बूटस्ट्रैप एनालॉग होZn¯=1ni=1nϕ(Xn)ϕ(X)X

Tn=θ+Zn¯+oP(1n)
TnZn¯TnZn¯{X1,,Xn} । यदि हम समान (3.19), अर्थात (3.20) ) के लिए कोई परिणाम स्थापित कर सकते हैं फिर की सीमा (जहाँ मान का मान है) की तरह ही है हम इस तरह एक समस्या को शामिल करने के लिए समस्या को कम कर दिया "नमूना मतलब" , जिसका बूटस्ट्रैप वितरण अनुमानक अनुभाग 3.1.2-3.1.4 में विधियों का उपयोग करते हुए सुसंगत दिखाया जा सकता है।Tn
Tn=θ+Zn¯+oP(1n)
HBOOT(x)xपी{=P{n(TnTn)x} ¯ जेड एनP{n(Zn¯Zn¯)x}Zn¯

और उन्होंने MLE प्रकार बूटस्ट्रैपिंग के लिए बूटस्ट्रैप स्थिरता प्राप्त करने का एक उदाहरण 3.3 दिया। हालांकि अगर वैश्विक रैखिकता उस तरह से प्रभावी है, तो यह कल्पना करना मुश्किल है कि स्थानीय रैखिकता के बिना कोई कैसे स्थिरता साबित करेगा। इसलिए मुझे लगता है कि मैममेन यही कहना चाहते थे।

(4) आगे की टिप्पणी

उपरोक्त [शाओ और तू] द्वारा प्रदान की गई चर्चा से परे, मुझे लगता है कि आप जो चाहते हैं वह बूटस्टाइल अनुमानकों की निरंतरता की एक विशेषता स्थिति है।

दयनीय रूप से, मुझे में वितरण के एक सामान्य वर्ग के लिए बूटस्ट्रैप अनुमानक की संगति का एक लक्षण नहीं पता है । M(X)यहां तक ​​कि अगर वहाँ एक है मुझे लगता है कि यह केवलचिकनाई की आवश्यकता नहीं है। लेकिनक्लासजैसे[गाइन एंड ज़िन] मेंसांख्यिकीय मॉडल के एक निश्चित वर्ग के लिए लक्षण वर्णन मौजूद है; या आमतौर पर एक कॉम्पैक्ट जगह पर परिभाषित (ऊपर चर्चा से सीधे) वर्ग का समर्थन किया।सीएलटीTCLT

इसके अलावा, कोलमोगोरोव-स्मिर्नोव दूरी, मेरे स्वाद के अनुसार गलत दूरी है यदि हमारा ध्यान क्लासिक एसिम्पोटिक्स (अनुभवजन्य प्रक्रियाओं के लिए "वर्दी" विषमता के विपरीत) है। क्योंकि केएस-दूरी कमजोर टोपोलॉजी को प्रेरित नहीं करती है जो कि स्पर्शोन्मुख व्यवहार के अध्ययन के लिए एक प्राकृतिक आधार है, अंतरिक्ष पर कमजोर टोपोलॉजी बंधी हुई लिप्सात्ज़ दूरी (या प्रोहोरोव-लेवी दूरी के रूप में प्रेरित है] और कई अन्य लेखक जब फोकस अनुभवजन्य प्रक्रिया नहीं है। कभी-कभी अनुभवजन्य प्रक्रिया के व्यवहार को सीमित करने की चर्चा में बीएल-दूरी भी शामिल होती है जैसे [जिन और ज़िन]।M(X)

मुझे निंदक होने से नफरत है फिर भी मुझे लगता है कि यह एकमात्र सांख्यिकीय लेखन नहीं है जो "शून्य से उद्धृत" है। यह कहकर मैं बस वैन Zwet की बात करने के लिए प्रशस्ति पत्र लगता है बहुत गैर जिम्मेदार है, हालांकि वैन Zwet एक महान विद्वान है।

संदर्भ

[वासरमैन] वासरमैन, लैरी। नॉनपामेट्रिक स्टैटिस्टिक्स, स्प्रिंगर, 2010 के सभी।

[शाओ और तू] शाओ, जून और डोंगशेंग तू। कटहल और बूटस्ट्रैप। स्प्रिंगर, 1995।

[जिन और ज़िन] गिने, एवरिस्ट और जोएल ज़िन। "बूटस्ट्रैपिंग सामान्य अनुभवजन्य उपाय।" एनल्स ऑफ प्रोबेबिलिटी (1990): 851-869।

[ह्यूबर] ह्यूबर, पीटर जे। रोबस्ट आँकड़े। विली, 1985।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.