क्या मानक त्रुटियों और विश्वास अंतरालों को उन रजिस्टरों में उचित है जहां समलैंगिकता धारणा का उल्लंघन किया गया है?


13

यदि मानक OLS प्रतिगमन में दो मान्यताओं का उल्लंघन किया जाता है (त्रुटियों, समरूपता का सामान्य वितरण), तो मानक त्रुटियों को दूर करने के लिए मानक त्रुटियों पर विश्वास करने के लिए मानक त्रुटियों को बूटस्ट्रैप करना और आत्मविश्वास अंतराल एक उपयुक्त विकल्प है?

क्या बूटस्ट्रैप्ड मानक त्रुटियों और आत्मविश्वास अंतराल के साथ महत्व परीक्षण अभी भी विषमलैंगिकता के साथ "काम" करते हैं?

यदि हाँ, तो इस परिदृश्य (प्रतिशत, ईसा पूर्व, बीसीए) में उपयोग किए जा सकने वाले आत्मविश्वास अंतराल क्या लागू होंगे?

अंत में, अगर बूटस्ट्रैपिंग इस परिदृश्य में उचित है, तो इस निष्कर्ष पर पहुंचने के लिए प्रासंगिक साहित्य क्या होगा जिसे पढ़ने और उद्धृत करने की आवश्यकता है? किसी भी संकेत बहुत सराहना की जाएगी!


1
अगर ऐसा कोई उल्लंघन है, तो मुझे नहीं लगता कि बूटस्ट्रैपिंग इसे ठीक करता है। इसके बजाय डेटा को सामान्यता के करीब लाने के लिए (लॉग) को बदलने की कोशिश क्यों न करें और एक मजबूत मानक त्रुटि का उपयोग करें जैसे कि सैंडविच पैकेज से आर?
B_Miner

बूटस्ट्रैप ठीक काम करता है यदि आप उस स्थिति के लिए पुन: नमूनाकरण योजना को अनुकूलित करते हैं जिसमें आप हैं।
Glen_b -Reinstate Monica

जवाबों:


20

स्वतंत्र के साथ रैखिक प्रतिगमन के लिए बूटस्ट्रैप प्रदर्शन करने के लिए कम से कम तीन (अधिक हो सकते हैं) दृष्टिकोण हैं, लेकिन पहचान नहीं की गई डेटा। (यदि आपके पास "मानक" मान्यताओं के अन्य उल्लंघन हैं, उदाहरण के लिए, समय श्रृंखला डेटा के साथ autocorrelations के कारण, या नमूने के डिजाइन के कारण क्लस्टरिंग, चीजें और भी जटिल हो जाती हैं)।

  1. आप अवलोकन को एक पूरे के रूप में कर सकते हैं, अर्थात, मूल डेटा से प्रतिस्थापन के साथ एक नमूना लें । यह हुबर्ट-व्हाइट हेटेरोसेडसिटी सुधार करने के लिए समान रूप से समान होगा ।(yj,xj){(yi,xi)}
  2. आप अपने मॉडल को फिट कर सकते हैं, अवशेषों को प्राप्त कर सकते हैं , और स्वतंत्र रूप से और अपने संबंधित अनुभवजन्य वितरण से प्रतिस्थापन के साथ, लेकिन यह यदि कोई हो, तो हेटेरोसेडासिटी पैटर्न टूट जाता है, इसलिए मुझे संदेह है कि यह बूटस्ट्रैप सुसंगत है।ei=yixiβ^xjej
  3. आप जंगली बूटस्ट्रैप का प्रदर्शन कर सकते हैं जिसमें आप अवशिष्ट के संकेत को फिर से खोलते हैं, जो सशर्त दूसरे पल के लिए नियंत्रित करता है (और, कुछ अतिरिक्त मोड़ के साथ, सशर्त तीसरे क्षण के लिए भी)। यह वह प्रक्रिया होगी जो मैं सुझाऊंगा (बशर्ते कि आप इसे समझ सकें और यह पूछने पर दूसरों का बचाव कर सकें कि, "आपने विषमलैंगिकता के नियंत्रण के लिए क्या किया? आपको कैसे पता चलेगा कि यह काम करता है?")।

अंतिम संदर्भ वू (1986) है , लेकिन एनल्स वास्तव में चित्र पुस्तक पढ़ने के लिए नहीं हैं।

टिप्पणियों में पूछे गए ओपी के अनुवर्ती प्रश्नों पर आधारित अद्यतन :

प्रतिकृतियों की संख्या मुझे बड़ी लगती थी; इस बूटस्ट्रैप पैरामीटर की एकमात्र अच्छी चर्चा जो मुझे पता है कि Efron & Tibshirani's Intro से बूटस्ट्रैप पुस्तक में है

मेरा मानना ​​है कि आम तौर पर वितरण संबंधी मान्यताओं की कमी के लिए समान सुधार ह्यूबर / व्हाइट मानक त्रुटियों के साथ प्राप्त किए जा सकते हैं। कैमरन और त्रिवेदी की पाठ्यपुस्तक में बूटस्ट्रैप और व्हाइट के हेट्रोसेकेडसिटी सुधार के जोड़े की समानता पर चर्चा की गई है। -estimates के लिए सामान्य मजबूती सिद्धांत से समानता का पालन होता है : दोनों सुधारों का उद्देश्य वितरण संबंधी मान्यताओं को सही करना है, जो कुछ भी हो, अवशेषों के परिमित दूसरे क्षणों की न्यूनतम धारणा और टिप्पणियों के बीच स्वतंत्रता के साथ। हौसमैन और पामर (2012) को परिमित नमूनों में अधिक विशिष्ट तुलनाओं पर देखें (इस पत्र का एक संस्करण लेखकों की वेबसाइटों में से एक पर उपलब्ध है )M) बूटस्ट्रैप और विषमलैंगिकता सुधारों के बीच तुलना पर।


आपकी सहायता के लिए धन्यवाद! कृपया मुझे एक अनुवर्ती प्रश्न की अनुमति दें: मैं केवल जिन मान्यताओं का उल्लंघन करता हूं वे त्रुटियों का सामान्य वितरण और समरूपता संबंधी धारणाएं हैं। इसके अलावा, मुझे केवल यह देखने में दिलचस्पी है कि मेरे प्रतिगमन गुणांक शिगूफा हैं या नहीं। अपेक्षित दिशा में या नहीं। प्रभाव की भयावहता महत्वपूर्ण नहीं है। मुझे लगता है कि मैंने अब तक जो किया है वह आपका विकल्प है। मैंने मानक त्रुटियों को बूटस्ट्रैप किया और अतिरिक्त बूटस्ट्रैप्ड आत्मविश्वास अंतराल उत्पन्न किया। मैंने यह किया है कि स्टैटा का उपयोग करके: vce (बूटस्ट्रैप, रेप्स (2500) bca), एस्टैट बूटस्ट्रैप। क्या यह मेरी धारणा के उल्लंघन को ठीक करता है?
डेविड

मैं केवल आपके सिंटैक्स पर आधारित डेटा का निदान नहीं करता, और कोई भी नहीं करेगा। आपके डेटा सेट का आकार क्या है? reps(2500)शायद एक ओवरकिल है, कम से कम मानक त्रुटियों के लिए; मुझे लगता reps(500)है कि अधिकांश व्यावहारिक उद्देश्यों के लिए ठीक है। एफ्रॉन और टिब्शिरानी की इंट्रो बूटस्ट्रैप बुक में प्रतिकृति की संख्या पर एक खंड है। उनके पास प्रतिगमन पर एक पूरा अध्याय है, इसलिए, ताकि आपको देखने के लिए एक और अच्छा संदर्भ हो सके।
StasK

आपके त्वरित उत्तर के लिए धन्यवाद। डेटासेट ~ 250 है। एक तरफ प्रतिकृति की संख्या पर सवाल (लिंक के लिए धन्यवाद!), क्या आप सहमत होंगे कि बूटस्ट्रैप्ड मानक त्रुटियां (एक पूरे के रूप में टिप्पणियों को पुनः प्राप्त करने के तरीके से) और / या बूटस्ट्रैप्ड आत्मविश्वास अंतराल (जैसे, प्रतिशत या पूर्वाग्रह को सही किया गया) होगा। एक प्रतिगमन गुणांक के महत्व (या उसके अभाव) को निर्धारित करने का एक उपयुक्त तरीका है, जो समरूपता के उल्लंघन और त्रुटियों के सामान्य वितरण का उल्लंघन है? आपके इनपुट के लिए बहुत बहुत धन्यवाद!
डेविड

हां, मैं कहूंगा कि यह बेहतर है। यदि आप स्टैटा का उपयोग करते हैं, तो आपको robustअपने प्रतिगमन के विकल्प का उपयोग करके एक समान जवाब मिल सकता है । est storeपरिणाम और est tab, seउनके साथ-साथ तुलना करने के लिए दोनों ।
StasK

धन्यवाद StasK मैंने निम्नलिखित टिप्पणी भी देखी है जो आपने इस साइट पर कहीं और की है: "सरल बूटस्ट्रैप विद रेसमलिंग os व्हाइट की हेट्रोसेकेडिसिटी मजबूत अनुमानक"। ऊपर उल्लिखित मेरे प्रश्नों के संदर्भ में: क्या इस लेख को प्रकाशित करने वाले जर्नल लेख प्रकाशित हुए हैं?
डेविड
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.