बड़ा नमूना स्पर्शोन्मुख / सिद्धांत - देखभाल करने के लिए क्यों?


13

मुझे उम्मीद है कि इस प्रश्न को "बहुत सामान्य" के रूप में चिह्नित नहीं किया गया है और आशा है कि एक चर्चा शुरू हो जाती है जो सभी को लाभ देती है।

आंकड़ों में, हम बड़े नमूना सिद्धांतों को सीखने में बहुत समय बिताते हैं। हम अपने आकलनकर्ताओं की विषमता संबंधी संपत्तियों का आकलन करने में गहराई से रुचि रखते हैं, जिसमें यह भी शामिल है कि वे विषम, निष्पक्ष, विषम रूप से कुशल, उनके विषम वितरण और इतने पर हैं। एसिम्प्टोटिक शब्द दृढ़ता से इस धारणा के साथ जुड़ा हुआ है कि ।n

वास्तव में, हालांकि, हम हमेशा परिमित निपटते हैं । मेरे प्रश्न हैं:n

1) बड़े नमूने का क्या मतलब है? हम छोटे और बड़े नमूनों के बीच अंतर कैसे कर सकते हैं?

2) जब हम कहते हैं कि , क्या हमारा शाब्दिक अर्थ है कि को जाना चाहिए ?nn

एक्सोमियाल डिस्ट्रीब्यूशन के लिए, को CLT के तहत सामान्य वितरण में कनवर्ट करने के लिए n = 30 की आवश्यकता होती है। क्या हमें होना चाहिए या इस मामले में हमारा मतलब 30 या अधिक होगा ?!X¯n

3) मान लीजिए कि हमारे पास एक परिमित नमूना है और मान लीजिए कि हम अपने अनुमानकों के स्पर्शोन्मुख व्यवहार के बारे में सब कुछ जानते हैं। तो क्या? मान लें कि हमारे अनुमानक विषम रूप से निष्पक्ष हैं, तो क्या हमारे पास हमारे परिमित नमूने में हमारी रुचि के पैरामीटर के लिए एक निष्पक्ष अनुमान है या इसका मतलब है कि अगर हमारे पास , तो हमारे पास एक निष्पक्ष होगा?n

जैसा कि आप ऊपर दिए गए प्रश्नों से देख सकते हैं, मैं "लार्ज सैंपल एसिम्पोटिक्स" के पीछे के दर्शन को समझने की कोशिश कर रहा हूं और यह जानने के लिए कि हम क्यों परवाह करते हैं? मैं जो प्रमेय सीख रहा हूँ उसके लिए मुझे कुछ अंतर्ज्ञान प्राप्त करने की आवश्यकता है।


5
लार्ज-सैंपल व्यवहार यह दिखाने का एक तरीका है कि एक दिया गया अनुमानक काम करता है, या जो भी हो, अनंत डेटा की सीमा में। आप सही कह रहे हैं कि यह जरूरी नहीं है कि हम इस बारे में कुछ भी बताएं कि एक अनुमानक व्यवहार में कितना अच्छा है, लेकिन यह एक पहला कदम है: आप एक अनुमानक का उपयोग करने की संभावना नहीं रखेंगे जो कि asymptotically अनुरूप नहीं है (या जो भी)। स्पर्शोन्मुख विश्लेषण का लाभ यह है कि अक्सर परिमित-नमूना की तुलना में पता लगाना आसान होता है।
डगल

आपको उच्चतर आदेश स्पर्शोन्मुखता पर पढ़ना शुरू करना चाहिए, जैसा कि आप स्पष्ट रूप से केवल पहले क्रम स्पर्शोन्मुख सामान्यता और इस तरह से परिचित हैं; उस के साथ, आप नहीं है अभी तक asymptotic व्यवहार के बारे में सब कुछ पता है। यह कहना पसंद है, "मुझे पता है कि ; हर कोई क्यों कहता है कि साइन आवधिक है ???"। sinx=x
StasK

1
द्विपद वितरण के लिए, एक खराब मानदंड है। यदि आपके पास और , तो माध्य = 0.03 और sd = 0.173 है, इसलिए अंकित मूल्य पर, द्विपद चर शून्य से सामान्य अनुमान के नीचे शून्य से 43% है, जो शून्य के लिए शायद ही कोई स्वीकार्य विवरण है। । बेहतर नियम सुझाव देते हैं , और वे इन उच्च आदेश मुद्दों के लिए खाते हैं। n>30p=0.001n=30nmin(p,1p)>15
StasK

जवाबों:


6

देर आए दुरुस्त आए। आइए पहले तीन (मैं महत्वपूर्ण सोचता हूं) कारणों की सूची देता हूं कि हम अनुमान लगाने वालों की असममित निष्पक्षता (स्थिरता) पर ध्यान केंद्रित क्यों करते हैं।

a) संगति एक न्यूनतम मानदंड है। यदि कोई अनुमानक बहुत से आंकड़ों के साथ भी सही अनुमान नहीं लगाता है, तो यह कितना अच्छा है? यह वोल्ड्रिज: इंट्रोडक्टरी इकोनोमेट्रिक्स में दिया गया औचित्य है।

बी) परिमित नमूना गुण साबित करने के लिए बहुत कठिन हैं (या बल्कि, स्पर्शोन्मुख कथन आसान हैं)। मैं वर्तमान में स्वयं कुछ शोध कर रहा हूं, और जब भी आप बड़े नमूना उपकरणों पर भरोसा कर सकते हैं, चीजें बहुत आसान हो जाती हैं। बड़ी संख्या में कानून, मार्टिंगेल अभिसरण प्रमेय इत्यादि, विषम परिणाम प्राप्त करने के लिए अच्छे उपकरण हैं, लेकिन परिमित नमूनों के साथ मदद नहीं करते हैं। मेरा मानना ​​है कि हयाशी (2000): इकोनोमेट्रिक्स में इन पंक्तियों का उल्लेख किया गया है।

ग) यदि अनुमानक छोटे नमूनों के लिए पक्षपाती हैं, तो कोई तथाकथित छोटे नमूने सुधारों के साथ संभावित रूप से सही या कम से कम सुधार कर सकता है। ये अक्सर सैद्धांतिक रूप से जटिल होते हैं (यह साबित करने के लिए कि वे सुधारक के बिना अनुमानक पर सुधार करते हैं)। साथ ही, अधिकांश लोग बड़े नमूनों पर भरोसा करने के साथ ठीक होते हैं, इसलिए छोटे नमूने सुधार अक्सर मानक आँकड़ों के सॉफ़्टवेयर में लागू नहीं होते हैं, क्योंकि केवल कुछ लोगों को उनकी आवश्यकता होती है (जो कि अधिक डेटा प्राप्त नहीं कर सकते हैं और निष्पक्षता के बारे में परवाह नहीं करते हैं)। इस प्रकार, उन असामान्य सुधारों का उपयोग करने के लिए कुछ बाधाएं हैं।

आपके सवालों पर "बड़े नमूने" से हमारा क्या तात्पर्य है? यह संदर्भ पर भारी निर्भर करता है, और विशिष्ट उपकरणों के लिए इसका अनुकरण अनुकरण के माध्यम से किया जा सकता है। यही है, आप कृत्रिम रूप से डेटा उत्पन्न करते हैं, और देखते हैं कि कैसे, कहते हैं, अस्वीकृति दर नमूना आकार के कार्य के रूप में व्यवहार करती है, या पूर्वाग्रह नमूना आकार के कार्य के रूप में व्यवहार करता है। एक विशिष्ट उदाहरण यहां है , जहां लेखक देखते हैं कि अच्छे प्रदर्शन के लिए ओएलएस क्लस्टर मानक त्रुटियों, ब्लॉक बूटस्ट्रैप्ड मानक त्रुटियों आदि के लिए कितने क्लस्टर लगते हैं। कुछ सिद्धांतकारों ने अभिसरण की दर पर भी बयान दिए हैं, लेकिन व्यावहारिक उद्देश्यों के लिए सिमुलेशन अधिक जानकारीपूर्ण दिखाई देते हैं।

क्या यह वास्तव में लेता है ? यदि ऐसा है तो सिद्धांत कहता है, हां, लेकिन आवेदन में हम छोटे, नगण्य पूर्वाग्रह को स्वीकार कर सकते हैं, जो हमारे पास उच्च संभावना वाले पर्याप्त बड़े नमूना आकार हैं। पर्याप्त रूप से क्या अर्थ संदर्भ पर निर्भर करता है, ऊपर देखें।n

प्रश्न 3 पर: आमतौर पर, निष्पक्षता (सभी नमूना आकारों के लिए) और स्थिरता (बड़े नमूनों के लिए निष्पक्षता) के प्रश्न को अलग से माना जाता है। एक अनुमानक पक्षपाती हो सकता है, लेकिन सुसंगत, जिस स्थिति में वास्तव में केवल बड़े नमूना अनुमान निष्पक्ष होते हैं। लेकिन ऐसे अनुमानक भी हैं जो निष्पक्ष और सुसंगत हैं, जो सैद्धांतिक रूप से किसी भी नमूना आकार के लिए लागू होते हैं। ( एक अनुमानक निष्पक्ष भी हो सकता है लेकिन तकनीकी कारणों से असंगत है। )

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.