जनसंख्या विचरण की गणना में N और N-1 में क्या अंतर है?


50

मुझे वहाँ क्यों नहीं मिला Nऔर N-1जनसंख्या विचरण की गणना करते समय। हम कब इस्तेमाल करते हैं Nऔर कब इस्तेमाल करते हैं N-1?

यहाँ छवि विवरण दर्ज करें
एक बड़े संस्करण के लिए यहां क्लिक करें

यह कहता है कि जब जनसंख्या बहुत बड़ी है तो N और N-1 के बीच कोई अंतर नहीं है लेकिन यह नहीं बताता है कि शुरुआत में N-1 क्यों है।

संपादित करें: कृपया साथ भ्रमित न करें nऔर n-1जो अनुमान लगाने में उपयोग किए जाते हैं।

Edit2: मैं जनसंख्या आकलन के बारे में बात नहीं कर रहा हूँ।


5
आप वहां एक उत्तर पा सकते हैं: आंकड़े . stackexchange.com/questions/16008/… । मूल रूप से, आप एन 1 का उपयोग करके ऐसी चाहिए अनुमान है एक विचरण, और एन जब आप गणना यह बिल्कुल।
ओशम

@ocram, जहां तक ​​मुझे पता है कि जब हम एक विचरण का अनुमान लगाते हैं तो हम n या n-1 का उपयोग करते हैं।
इलहान

यदि आप चाहते हैं कि आपका अनुमानक निष्पक्ष हो, तो आपको n-1 का उपयोग करना चाहिए। ध्यान दें कि जब n बड़ा है, तो यह कोई मामला नहीं है।
ओकराम

2
N1N11/Ny
StasK

2
यह वास्तव में अन्य उत्तरों को नहीं जोड़ता है। कि अलग-अलग भाजक अलग-अलग उत्तर देते हैं, या यह भी कि अंतर एन के साथ कम हो जाता है, मुद्दे पर नहीं है। सवाल यह है कि विभाजक का उपयोग कब और क्यों किया जाए।
निक कॉक्स

जवाबों:


26

Nn(N1)/N=1(1/N)12/N117/Nexp(1/N)

(n1)/nn11/N

NN

NN1NNn


24

मैं गणित में जाने के बजाय इसे सीधे शब्दों में रखने की कोशिश करूँगा। यदि आपके पास अपने निपटान में पूरी आबादी है तो इसके विचरण ( जनसंख्या विचरण ) की गणना भाजक के साथ की जाती है N। इसी तरह, यदि आपके पास केवल नमूना है और इस नमूने के विचरण की गणना करना चाहते हैं , तो आप हर N(इस मामले में नमूने के एन) का उपयोग करते हैं। दोनों मामलों में, ध्यान दें, आप किसी भी चीज़ का अनुमान नहीं लगाते हैं : आपके द्वारा मापा गया मतलब सही मतलब है और उस मतलब से आपके द्वारा गणना किया गया संस्करण सही संस्करण है।

अब, आपके पास केवल नमूना है और आबादी में अज्ञात माध्य और विचरण के बारे में अनुमान लगाना चाहते हैं। दूसरे शब्दों में, आप अनुमान चाहते हैं । आप जनसंख्या के माध्य के अनुमान के लिए अपना नमूना माध्य लेते हैं (क्योंकि आपका नमूना प्रतिनिधि है), ठीक है। जनसंख्या विचरण का अनुमान प्राप्त करने के लिए, आपको यह दिखावा करना होगा कि इसका मतलब वास्तव में जनसंख्या का मतलब है और इसलिए यह आपके नमूने पर अब निर्भर नहीं है जब से आपने इसकी गणना की है। माध्य मान को "समर्थन" करने के लिए अपने नमूने में से किसी एक (किसी भी) अवलोकन को नियत करने के लिए निर्धारित किए गए "शो" को दिखाने के लिए, जो आपके नमूने का हो सकता है "समर्थन" करने के लिए: एक आरक्षित अवलोकन हमेशा उस मूल्य के माध्य को ला सकता है जिसे आप ' ve मिल गया है और जो मानता है कि आकस्मिकताओं के नमूने के लिए असंवेदनशील है। एक आरक्षित अवलोकन "-1" हैN-1 कंप्यूटिंग विचरण अनुमान में।

कल्पना करें कि आप किसी भी तरह से वास्तविक आबादी का मतलब जानते हैं, लेकिन नमूने से विचरण का अनुमान लगाना चाहते हैं। तब आप उस सही अर्थ को विचरण के लिए सूत्र में बदल देंगे और हर को लागू कर सकते हैं N: कोई "-1" यहाँ आवश्यक नहीं है क्योंकि आपको सही अर्थ पता है, आपने इसका अनुमान इसी नमूने से नहीं लगाया।


लेकिन मेरे सवाल का अनुमान से कोई लेना-देना नहीं है। यह जनसंख्या परिवर्तन की गणना के बारे में है; एन और एन -1 के साथ। मैं n और n-1 की बात नहीं कर रहा हूँ।
इलहान

1
@ilhan, मेरे जवाब में, मैंने Nएन और एन दोनों के लिए उपयोग किया । Nजनसंख्या या नमूने में, हाथ में समग्रता का एक आकार है। जनसंख्या भिन्नता की गणना करने के लिए , आपके पास अपने निपटान में जनसंख्या होनी चाहिए । यदि आपके पास केवल नमूना है तो आप इस नमूने के विचरण की गणना कर सकते हैं या जनसंख्या अनुमान के विचरण की गणना कर सकते हैं । कोई दूसरा रास्ता नहीं।
tnnphns

मुझे अपनी जनसंख्या के बारे में पूरी जानकारी है; सभी मूल्यों को जानते हैं। मुझे अनुमान में कोई दिलचस्पी नहीं है।
इलहान

1
यदि आपकी आबादी है तो N. N-1 का उपयोग करना अतार्किक होगा।
tnnphns

1
@ilhan - अपनी टिप्पणी पर सीधे ttnphns पोस्ट पर टिप्पणी नहीं कर सकता है, लेकिन यहां एक स्पष्टीकरण दिया गया है कि आप पुस्तक में क्या देखते हैं और आपको इसे कैसे समझना चाहिए। 'S' का प्रतीक जब विचरण करता था तो हमेशा नमूना विचरण को संदर्भित करता है। ग्रीक अक्षर सिग्मा का उपयोग जनसंख्या विचरण को संदर्भित करने के लिए किया जाता है। यही कारण है कि आप पुस्तक का उल्लेख एस = एन * सिग्मा / (एन - 1) देखें
अरविंद

9

आम तौर पर, जब किसी के पास आबादी का केवल एक हिस्सा होता है, यानी एक नमूना, आपको n-1 से विभाजित करना चाहिए। ऐसा करने का एक अच्छा कारण है, हम जानते हैं कि नमूना विचरण, जो नमूने के माध्य वर्ग से विचलन को गुणा करता है (n ared 1) / n, जनसंख्या विचरण का एक निष्पक्ष अनुमानक है।

आप एक प्रमाण पा सकते हैं कि नमूना विचरण का अनुमानक निष्पक्ष है: https://economictheoryblog.com/2012/06/28/latexlatexs2/

इसके अलावा, यदि कोई जनसंख्या विचरण के अनुमानक को लागू करता है, जो कि विचरण अनुमानक का वह संस्करण है जो n के द्वारा विभाजित होता है, तो जनसंख्या के बजाय नमूने पर, प्राप्त अनुमान पक्षपाती होगा।


यह जनसंख्या भिन्नता के आकलन के विषय में एक अलग प्रश्न का उत्तर देता है। यह परिपत्र दिखता है: क्या यह जवाब पहले स्थान पर जनसंख्या के विचलन को परिभाषित करने के लिए एक विशिष्ट सम्मेलन मानने पर पूर्व निर्धारित नहीं है?
whuber

7

अतीत में, एक तर्क दिया गया है कि आपको एन-हीन विचरण के लिए एन का उपयोग करना चाहिए, लेकिन मैं अब और सिफारिश नहीं करूंगा। आपको हमेशा एन -1 का उपयोग करना चाहिए। जैसा कि नमूना आकार घटता है एन -1 इस तथ्य के लिए एक बहुत अच्छा सुधार है कि नमूना विचरण कम हो जाता है (आप वितरण के चरम के पास नमूना लेने की अधिक संभावना रखते हैं --- आंकड़ा देखें)। यदि नमूना आकार वास्तव में बड़ा है तो यह कोई सार्थक राशि नहीं है।

एक वैकल्पिक व्याख्या यह है कि जनसंख्या एक सैद्धांतिक निर्माण है जिसे प्राप्त करना असंभव है। इसलिए, हमेशा N-1 का उपयोग करें क्योंकि आप जो भी कर रहे हैं, वह सबसे अच्छा है, जनसंख्या भिन्नता का अनुमान लगाते हुए।

इसके अलावा, आप यहाँ से विचरण के अनुमानों के लिए N-1 देख रहे हैं। आप संभवतः कभी भी इस मुद्दे का सामना नहीं करेंगे ... एक परीक्षण को छोड़कर जब आपका शिक्षक आपसे एक हीनता के बीच भेद करने के लिए कह सकता है गैर-विभेदक विचरण उपाय। उस स्थिति में व्हीबर के जवाब या खदान का उपयोग न करें, ttnphns के उत्तर का संदर्भ लें।

आकृति 1

ध्यान दें, इस आकृति में विचरण 1 के करीब होना चाहिए। यह देखें कि नमूना आकार के साथ यह कितना भिन्न होता है जब आप विचरण का अनुमान लगाने के लिए एन का उपयोग करते हैं। (यह "पूर्वाग्रह" है जिसे अन्यत्र कहा गया है)


1
कृपया, मुझे बताएं कि हाथ में असली आबादी के साथ एन को "अब और अनुशंसित नहीं" क्यों किया गया है? जनसंख्या हमेशा एक सैद्धांतिक निर्माण नहीं है। कभी-कभी आपका नमूना आपके लिए एक शालीन आबादी वाला होता है।
ttnphns

1
इल्हान, एन का उपयोग आपके नमूने के लिए किया जा सकता है, या इसका उपयोग जनसंख्या के आकार के लिए किया जा सकता है, यदि कोई मौजूद है। ज्यादातर मामलों में बड़े एन और छोटे एन के बीच का अंतर विषय पर निर्भर है। उदाहरण के लिए, n प्रयोग में प्रत्येक स्थिति में मामलों की संख्या हो सकती है, जबकि N प्रयोग के लिए संख्या हो सकती है। वे दोनों नमूने हैं। कोई वैश्विक नियम नहीं है।
जॉन

1
ttnphns, यह इस बात पर निर्भर करता है कि आपका जनसंख्या से क्या तात्पर्य है। मेरा तर्क है कि यदि आपकी पूरी आबादी इतनी छोटी है कि N-1 मायने रखता है, तो यह संदेहास्पद है कि क्या एक मतलब चुकता विचलन की गणना करना दूरस्थ रूप से उपयोगी है। सभी मान, उनका आकार और सीमा दिखाएं। इसके अलावा, पूरे पुराने तर्क कि वास्तव में आपके पास स्वतंत्रता की एन डिग्री है यदि आप एक अनुमान नहीं लगा रहे हैं तो यह संदिग्ध है। जब आप माध्य की गणना करते हैं तो आप एक खो देते हैं, जिसे आपको विचरण की गणना करने की आवश्यकता होती है।
जॉन

1
@ जॉन, यदि आप जनसंख्या के भीतर मतलब की गणना तुम सिर्फ राज्य पैरामीटर के बारे में तथ्य यह है, तो आप स्वतंत्रता का कोई डिग्री खर्च करते हैं। यदि आप इसे नमूने में गणना करते हैं और आबादी के बारे में अनुमान लगाना चाहते हैं , तो आप एक खर्च करते हैं। इसके अलावा, मैं N = 1 के साथ जनसंख्या रख सकता हूं। भाजक N-1 के साथ, यह प्रकट होता है कि इस तरह के पैरामीटर के रूप में इसके लिए मौजूद नहीं है । यह बकवास है।
tnnphns

3
@ilhan कृपया, अपने प्रश्न को अपडेट करने पर विचार करें (जैसा कि आपने किया था) और ऐसे गैर-रचनात्मक टिप्पणियों को छोड़ने के बजाय अपडेट किए गए संस्करण को इंगित करें। सब कुछ बहस का मुद्दा है, खासकर जब सवाल ही कुछ संदर्भ का अभाव है। यहाँ ऐसा लगता है कि समस्या यह परिभाषित करने से है कि वास्तव में जनसंख्या क्या है।
CHL

4

जनसंख्या भिन्नता जनसंख्या में सभी मूल्यों के वर्ग विचलन का योग है जो जनसंख्या में मूल्यों की संख्या से विभाजित है। जब हम किसी नमूने से किसी जनसंख्या के विचरण का अनुमान लगा रहे होते हैं, हालांकि, हम इस समस्या का सामना करते हैं कि नमूने के माध्यम से नमूना मूल्यों के विचलन औसतन, उन नमूना मूल्यों के विचलन की तुलना में थोड़ा कम हैं: अज्ञात) सच्ची आबादी का मतलब है। यह उस नमूने से गणना किए गए विचरण में परिणत होता है जो वास्तविक जनसंख्या विचरण से थोड़ा कम होता है। उस कम आंकलन के लिए n सही के बजाय n-1 विभाजक का उपयोग करना।


@ बन्ननबर्ग, अगर आपको अपने सवाल का जवाब मिल गया। कृपया मुझे अभी स्पष्ट करें, आपको क्या मिला? यह मेरे लिए भी एक बड़ा भ्रम है।
बिलाल पैरा

उस थोड़े कम विचरण की भरपाई करने के लिए , हम n-2, n-3 आदि का उपयोग क्यों नहीं कर सकते? क्यों n-1 विशेष रूप से? क्यों नहीं एक निरंतर ... ???
सर्वनाबलि रामचंद्रन

@SaravanabalagiRamachandran विसंगति नमूना आकार के साथ बदलती है और इसलिए एक निरंतर सेवा नहीं देगी। एन -1 का उपयोग करने वाला सुधार आपके द्वारा उल्लेखित अन्य लोगों की तुलना में बेहतर काम करता है।
माइकल ल्यू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.