पर्याप्त सांख्यिकीय, बारीकियों / अंतर्ज्ञान समस्याएं


16

मैं खुद को मज़े के लिए कुछ आँकड़े सिखा रहा हूँ और मुझे पर्याप्त आँकड़ों के बारे में कुछ भ्रम है । मैं सूची प्रारूप में अपना भ्रम लिखूंगा:

  1. एक वितरण है, तो मानकों तो यह होगा पर्याप्त आंकड़े?nn

  2. क्या पर्याप्त आँकड़ों और मापदंडों के बीच कोई सीधा पत्राचार है? या पर्याप्त आंकड़े सिर्फ "सूचना" के एक पूल के रूप में काम करते हैं ताकि हम सेटिंग को फिर से बना सकें ताकि हम अंतर्निहित वितरण के मापदंडों के लिए समान अनुमानों की गणना कर सकें।

  3. क्या सभी वितरणों के पास पर्याप्त आँकड़े हैं? अर्थात। क्या कारक प्रमेय कभी विफल हो सकता है?

  4. डेटा के हमारे नमूने का उपयोग करते हुए, हम एक वितरण को मानते हैं कि डेटा सबसे अधिक होने की संभावना है और फिर वितरण के लिए मापदंडों के लिए अनुमान (जैसे एमएलई) की गणना कर सकता है। पर्याप्त आँकड़े एक तरीका है जो स्वयं डेटा पर भरोसा किए बिना मापदंडों के लिए समान अनुमानों की गणना करने में सक्षम है?

  5. क्या पर्याप्त आँकड़ों के सभी सेटों में न्यूनतम पर्याप्त आँकड़ा होगा?

यह वह सामग्री है जिसका उपयोग मैं विषय वस्तु को समझने की कोशिश करने के लिए कर रहा हूं: https://onlinecourses.science.psu.edu/stat414/node/283

जो मैं समझता हूं कि हमारे पास एक फैक्टराइजेशन प्रमेय है जो संयुक्त वितरण को दो कार्यों में अलग करता है, लेकिन मुझे यह समझ में नहीं आता है कि हम अपने कार्यों में वितरण को लागू करने के बाद पर्याप्त आंकड़े कैसे निकाल सकते हैं।

  1. इस उदाहरण में दिए गए पोइसन प्रश्न का एक स्पष्ट कारक था, लेकिन तब यह कहा गया था कि पर्याप्त आँकड़े नमूना माध्य और नमूना राशि थे। हमें यह कैसे पता चला कि पहले समीकरण के रूप को देखकर वे पर्याप्त आँकड़े थे?

  2. कैसे यह पर्याप्त आंकड़ों का उपयोग कर एक ही MLE अनुमान संचालन करने के लिए करता है, तो गुणन परिणाम के दूसरे समीकरण डेटा मूल्यों पर निर्भर कभी कभी संभव है खुद को? उदाहरण के लिए, पोइसन मामले में डेटा के factorials के उत्पाद के व्युत्क्रम पर निर्भर दूसरा फ़ंक्शन, और हमारे पास अब डेटा नहीं होगा!Xi

  3. वेबपेज पर पोइसन उदाहरण के संबंध में नमूना आकार एक पर्याप्त आंकड़ा क्यों नहीं होगा ? हमें पहले फ़ंक्शन के कुछ हिस्सों को फिर से बनाने के लिए n की आवश्यकता होगी, इसलिए यह एक पर्याप्त आंकड़ा भी नहीं है?nn


बस एक त्वरित स्पष्ट प्रश्न - आप किस "कोण" से पर्याप्तता में आ रहे हैं? अधिकतम संभाव्यता? बायेसियन? अधिकतम एन्ट्रापी? नमूनाकरण सिद्धांत? कुछ और?
probabilityislogic

मैं MLE के दृष्टिकोण से आ रहा था, क्षमा करें यदि मेरी पोस्टिंग सबसे बड़ी नहीं थी, तो यह इस मंच पर मेरी पहली पोस्ट है!
किम्ची

जवाबों:


12

आप संभवतः सैद्धांतिक आंकड़ों पर किसी भी पाठ्यपुस्तक में पर्याप्तता के बारे में पढ़ने से लाभान्वित होंगे, जहां इन प्रश्नों में से अधिकांश को विस्तार से कवर किया जाएगा। संक्षेप में ...

  1. जरुरी नहीं। वे विशेष मामले हैं: उन वितरणों में जहां समर्थन (मूल्यों की श्रेणी जो डेटा ले सकते हैं) अज्ञात पैरामीटर (एस) पर निर्भर नहीं करता है, केवल घातीय परिवार में उन लोगों की संख्या के रूप में एक ही आयाम का एक पर्याप्त आंकड़ा है मापदंडों। इसलिए वीबुल वितरण के आकार और पैमाने या स्वतंत्र टिप्पणियों से लॉजिस्टिक वितरण के स्थान और पैमाने का अनुमान लगाने के लिए, ऑर्डर स्टेटिस्टिक (उनके अनुक्रम की उपेक्षा करने वाले टिप्पणियों का पूरा सेट) न्यूनतम पर्याप्त है - आप इसे खोए बिना इसे और कम नहीं कर सकते मापदंडों के बारे में जानकारी। कहाँ समर्थन अज्ञात पैरामीटर पर निर्भर करता है (रों) यह बदलता रहता है: पर एक समान वितरण के लिए , नमूना अधिकतम के लिए पर्याप्त है θ(0,θ)θ; पर एक समान वितरण के लिए नमूना न्यूनतम और अधिकतम एक साथ पर्याप्त हैं।(θ1,θ+1)

  2. मुझे नहीं पता कि आप "प्रत्यक्ष पत्राचार" से क्या मतलब है; आपके द्वारा दिया गया विकल्प पर्याप्त आँकड़ों का वर्णन करने का एक उचित तरीका लगता है।

  3. हां: संपूर्ण रूप से डेटा पर्याप्त हैं। (यदि आप किसी को कहते हैं कि कोई पर्याप्त आंकड़ा नहीं है, तो उनका मतलब है कि कोई कम आयामी नहीं है।)

  4. हां, यही विचार है। (डेटा को सशर्त रूप से वितरित करने के लिए पर्याप्त स्टेटिस्टिक पर - अज्ञात पैरामीटर (ओं) के स्वतंत्र रूप से वितरण धारणा की जांच के लिए इस्तेमाल किया जा सकता है।)

  5. जाहिरा तौर पर नहीं, हालांकि मैं काउंटर-उदाहरण इकट्ठा करता हूं वे वितरण नहीं हैं जो आप व्यवहार में उपयोग करना चाहते हैं। [यह बहुत अच्छा होगा अगर कोई भी इसे माप सिद्धांत में भारी पड़ने के बिना समझा सकता है।]

आगे के सवालों के जवाब में ...

  1. पहला कारक, , पर निर्भर करता है λ केवल के माध्यम से Σ x मैं । तो किसी भी में से एक-से-एक समारोह Σ x मैंenλλxiλxixixixi/n(xi)2

  2. 1x1!x2!xn!λλf(x;λ)

  3. n

xi

‡ जब है यादृच्छिक चर के एक प्राप्त महत्व एन , तो यह पर्याप्त आंकड़ा का हिस्सा है, हो जाएगा (n N(xi,n)nθxi


1
मैं पलटवार देखना पसंद करूँगा 5. मैंने ज़ोर्न के लेम्मा के साथ थोड़ी देर के लिए विपरीत साबित करने की कोशिश की लेकिन यह एक बिंदु पर टूट गया। लेकिन जो मैंने काउंटरएक्सप्ले इकट्ठा किया है उससे वास्तव में अजीब होना चाहिए। क्या आपके पास कोई संदर्भ बिंदु है जहां मैं इसे पा सकता हूं? मुझे नहीं लगता कि यह माप सिद्धांत पर भारी है।
sjm.majewski

@ sjm.majewski: लेहमैन पिचर (1957), "आवश्यक और पर्याप्त आँकड़ों या उप-क्षेत्रों को स्वीकार नहीं करने के उपायों के समूह", एन। गणित। सांख्यिकीविद। , 28 , p267-268; और लैंडर्स एंड रोजेज (1973)। "पर्याप्तता और आक्रमण पर", एन। सांख्यिकीविद। , 1 , पी 543-544।
Scortchi - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.