वैज्ञानिकों ने सामान्य वितरण संभावना घनत्व फ़ंक्शन के आकार का कैसे पता लगाया?


36

यह शायद एक शौकिया सवाल है, लेकिन मुझे इस बात में दिलचस्पी है कि वैज्ञानिकों ने सामान्य वितरण संभावना घनत्व समारोह के आकार के साथ कैसे किया? मूल रूप से मुझे जो कीड़े हैं, किसी के लिए यह शायद अधिक सहज होगा कि सामान्य रूप से वितरित डेटा की संभावना फ़ंक्शन में घंटी वक्र के बजाय एक समद्विबाहु त्रिकोण का आकार होता है, और आप ऐसे व्यक्ति को कैसे साबित करेंगे कि संभावना घनत्व घनत्व कार्य करता है सभी सामान्य रूप से वितरित डेटा की घंटी की आकृति है? प्रयोग करके? या कुछ गणितीय व्युत्पत्ति द्वारा?

आखिरकार, हम वास्तव में सामान्य रूप से वितरित डेटा पर क्या विचार करते हैं? डेटा जो सामान्य वितरण की संभाव्यता पैटर्न का अनुसरण करता है, या कुछ और?

मूल रूप से मेरा सवाल यह है कि सामान्य वितरण संभाव्यता घनत्व फ़ंक्शन की घंटी की आकृति क्यों है और कोई अन्य नहीं है? और वैज्ञानिकों ने यह कैसे पता लगाया कि किस वास्तविक जीवन परिदृश्य पर सामान्य वितरण लागू किया जा सकता है, प्रयोग द्वारा या स्वयं विभिन्न डेटा की प्रकृति का अध्ययन करके?


इसलिए मैंने इस लिंक को सामान्य वितरण वक्र के कार्यात्मक रूप की व्युत्पत्ति को समझाने में वास्तव में मददगार पाया है, और इस प्रकार इस प्रश्न का उत्तर दिया "सामान्य वितरण ऐसा क्यों दिखता है और कुछ नहीं?"। सचमुच मनमौजी तर्क, कम से कम मेरे लिए।


2
की जाँच करें इस सवाल - यह दावा है कि केवल सामान्य वितरण "घंटी के आकार का" है करने के लिए सही नहीं है।
सिल्वरफिश

11
सामान्य वितरण में कुछ महत्वपूर्ण रूप से महत्वपूर्ण सांख्यिकीय गुण होते हैं, जो इसे अध्ययन की एक विशेष वस्तु बनाते हैं और इसका अर्थ यह भी है कि यह अक्सर "स्वाभाविक रूप से" उत्पन्न होता है, जैसे कि अन्य वितरण का सीमित मामला। विशेष रूप से केंद्रीय सीमा प्रमेय देखें । हालाँकि, यह केवल एकमात्र वितरण नहीं है जो बीच में चोटियों और दोनों ओर पूंछ है। लोग अक्सर इस तरह के डेटा को सामान्य मानते हैं क्योंकि हिस्टोग्राम "घंटी के आकार का दिखता है", लेकिन मेरा जुड़ा हुआ जवाब दिखाता है कि ऐसे डेटा सेट के लिए कई अन्य उम्मीदवार वितरण कैसे हैं।
सिल्वरफिश

4
ध्यान दें कि सांख्यिकीविदों ने कई डेटासेटों को देखकर सामान्य वितरण की खोज नहीं की थी और इस घनत्व फ़ंक्शन को महसूस करना उनमें से कई लोगों के लिए अनुभवजन्य रूप से अच्छा था। जैसा कि आप अपने प्रश्न में आश्चर्य करते हैं, संभावना सिद्धांत में कुछ समस्याओं की गणितीय जांच की एक प्रक्रिया थी, जिसके जवाब में सामान्य वितरण "पॉप्स आउट" होता है। यह यहाँ इस उत्तर में अच्छी तरह से समझाया गया है
सिल्वरफिश

3
और मूल रूप से अगर कोई मुझे यह समझाने के लिए कहता है कि सामान्य वितरण "सामान्य" क्यों है, तो मुझे उन्हें सामान्य वितरण के इतिहास की व्याख्या करने की आवश्यकता होगी जो अपने आप में द्विपद वितरण और उसके बाद से शुरू होने तक लंबा और जटिल है, और फिर शायद केंद्रीय सीमा प्रमेय साबित करें, और दिखाएं कि वास्तविक जीवन में कई स्थितियों का अध्ययन करने में सामान्य वितरण लागू है।
आराघर

5
आप गैलन बोर्डों नामक इन निफ्टी उपकरणों में से एक का उपयोग करके एक सामान्य वितरण के आकार की कल्पना कर सकते हैं । वास्तव में यह एक द्विपद वितरण है, लेकिन, आप जानते हैं, केंद्रीय सीमा प्रमेय।
फेडरिको पोलोनी

जवाबों:


21

SAUL STAHL द्वारा " द इवोल्यूशन ऑफ द नॉर्मल डिस्ट्रिब्यूशन " जानकारी का सबसे अच्छा स्रोत है, जो आपकी पोस्ट के सभी प्रश्नों का उत्तर देता है। मैं केवल आपकी सुविधा के लिए कुछ बिंदुओं का पाठ करूँगा, क्योंकि आपको पेपर के अंदर विस्तृत चर्चा मिलेगी।

यह शायद एक शौकिया सवाल है

नहीं, यह आँकड़ों का उपयोग करने वाले किसी भी व्यक्ति के लिए एक दिलचस्प सवाल है, क्योंकि यह मानक पाठ्यक्रमों में कहीं भी विस्तार से कवर नहीं किया गया है।

मूल रूप से मुझे जो कीड़े हैं, किसी के लिए यह शायद अधिक सहज होगा कि सामान्य रूप से वितरित डेटा की संभावना फ़ंक्शन में घंटी वक्र के बजाय एक समद्विबाहु त्रिकोण का आकार होता है, और आप ऐसे व्यक्ति को कैसे साबित करेंगे कि संभावना घनत्व घनत्व कार्य करता है सभी सामान्य रूप से वितरित डेटा की घंटी की आकृति है?

इस तस्वीर को कागज से देखो। यह त्रुटि को दर्शाता है कि प्रयोगात्मक डेटा का विश्लेषण करने के लिए सिम्पसन गौसियन (सामान्य) की खोज से पहले आया था। तो, अपने अंतर्ज्ञान पर हाजिर है।

यहाँ छवि विवरण दर्ज करें

प्रयोग करके?

हां, इसीलिए उन्हें "एरर कर्व्स" कहा गया। प्रयोग खगोलीय माप था। खगोलविद सदियों तक माप की त्रुटियों से जूझते रहे।

या कुछ गणितीय व्युत्पत्ति द्वारा?

फिर, हाँ! लंबी कहानी छोटी: खगोलीय डेटा में त्रुटियों के विश्लेषण ने गॉस को उनके (उर्फ सामान्य) वितरण के लिए प्रेरित किया। इन मान्यताओं का उन्होंने उपयोग किया है:

यहाँ छवि विवरण दर्ज करें

वैसे, लाप्लास ने कुछ अलग तरीकों का इस्तेमाल किया, और खगोलीय डेटा के साथ काम करते हुए अपने वितरण के साथ भी आया:

यहाँ छवि विवरण दर्ज करें

माप वितरण त्रुटियों के रूप में प्रयोग में सामान्य वितरण क्यों दिखाता है, यहां एक विशिष्ट "हाथ से लहराती" स्पष्टीकरण भौतिक विज्ञानी को देने के लिए उपयोग किया जाता है (गेरहार्ड बोहम, गुंटर ज़ेक का एक उद्धरण, भौतिकविदों के लिए परिचय और डेटा विश्लेषण p85 के लिए):

कई प्रयोगात्मक संकेत एक बहुत अच्छे सन्निकटन के लिए एक सामान्य वितरण का अनुसरण करते हैं। यह इस तथ्य के कारण है कि वे कई योगदानों और केंद्रीय सीमा प्रमेय के परिणाम में शामिल हैं।


2
Stahl संदर्भ मूल प्रश्न को उस कोण से बहुत अधिक संबोधित करता है जिसे वह से लिया गया था - यह एक बहुत अच्छा खोज है।
सिल्वरफिश

44

आप अपने प्रश्न में मानते हैं कि वितरण की पहचान होने से पहले सामान्य वितरण की अवधारणा आसपास थी, और लोगों ने यह पता लगाने की कोशिश की कि यह क्या था। यह मेरे लिए स्पष्ट नहीं है कि यह कैसे काम करेगा। [संपादित करें: कम से कम एक अर्थ यह है जिसे हम "वितरण के लिए खोज" होने पर विचार कर सकते हैं लेकिन यह "वितरण के लिए एक खोज नहीं है जो बहुत सारी और बहुत सारी घटनाओं का वर्णन करता है"]

यह मामला नहीं है; सामान्य वितरण कहे जाने से पहले वितरण के बारे में जाना जाता था।

आप ऐसे व्यक्ति को कैसे साबित करेंगे कि सामान्य रूप से वितरित किए गए डेटा की प्रायिकता घनत्व फ़ंक्शन में घंटी का आकार होता है

सामान्य वितरण फ़ंक्शन वह चीज है जिसे आमतौर पर "घंटी का आकार" कहा जाता है - सभी सामान्य वितरणों में समान "आकार" होता है (इस अर्थ में कि वे केवल पैमाने और स्थान में भिन्न होते हैं)।

वितरण में डेटा अधिक या कम "घंटी के आकार का" दिख सकता है लेकिन यह सामान्य नहीं बनाता है। गैर-सामान्य वितरण के बहुत सारे समान "घंटी के आकार" के दिखते हैं।

वास्तविक जनसंख्या वितरण जो डेटा से खींचे जाते हैं , वे वास्तव में कभी सामान्य नहीं होते हैं , हालांकि यह कभी-कभी काफी उचित अनुमान होता है।

यह आम तौर पर वास्तविक दुनिया में चीजों पर लागू होने वाले लगभग सभी वितरणों के लिए सही है - वे मॉडल हैं , दुनिया के बारे में तथ्य नहीं। [एक उदाहरण के रूप में, यदि हम कुछ धारणाएँ बनाते हैं (जो एक पॉइसन प्रक्रिया के लिए हैं), तो हम पॉइसन वितरण को प्राप्त कर सकते हैं - एक व्यापक रूप से उपयोग किया जाने वाला वितरण। लेकिन क्या वे धारणाएँ कभी पूरी तरह से संतुष्ट हैं? आम तौर पर सबसे अच्छा हम (सही स्थितियों में) कह सकते हैं कि वे बहुत ही सही हैं।]

हम वास्तव में सामान्य रूप से वितरित डेटा पर क्या विचार करते हैं? डेटा जो सामान्य वितरण की संभाव्यता पैटर्न का अनुसरण करता है, या कुछ और?

हां, वास्तव में सामान्य रूप से वितरित होने के लिए, जिस जनसंख्या से नमूना तैयार किया गया था, उसका वितरण एक सामान्य वितरण के सटीक कार्यात्मक रूप में होना चाहिए। परिणामस्वरूप, कोई भी परिमित जनसंख्या सामान्य नहीं हो सकती है। आवश्यक रूप से बंधे चर सामान्य नहीं हो सकते हैं (उदाहरण के लिए, किसी विशेष कार्य के लिए लिया गया समय, विशेष चीजों की लंबाई नकारात्मक नहीं हो सकती है, इसलिए उन्हें वास्तव में वितरित नहीं किया जा सकता है)।

यह शायद अधिक सहज होगा कि सामान्य रूप से वितरित डेटा की संभाव्यता फ़ंक्शन में एक समद्विबाहु त्रिभुज का आकार होता है

मैं यह नहीं देखता कि यह क्यों जरूरी है कि यह अधिक सहज हो। यह निश्चित रूप से सरल है।

जब त्रुटि वितरण के लिए पहले विकासशील मॉडल (विशेष रूप से शुरुआती समय में खगोल विज्ञान के लिए), गणितज्ञों ने त्रुटि वितरण (एक प्रारंभिक बिंदु एक त्रिकोणीय वितरण सहित) के संबंध में कई प्रकार के आकृतियों पर विचार किया, लेकिन इस काम में बहुत गणित था (बल्कि अंतर्ज्ञान से) जिसका उपयोग किया गया था। उदाहरण के लिए लाप्लास ने डबल घातीय और सामान्य वितरण (कई अन्य के बीच) को देखा। इसी तरह गॉस ने गणित को एक ही समय में इसे प्राप्त करने के लिए इस्तेमाल किया, लेकिन लाप्लास की तुलना में विचार के एक अलग सेट के संबंध में।

संकीर्ण अर्थों में कि लाप्लास और गॉस "त्रुटियों के वितरण" पर विचार कर रहे थे, हम कम से कम एक समय के लिए "वितरण के लिए खोज" होने के रूप में वहां संबंध कर सकते थे। दोनों ने त्रुटियों के वितरण के लिए कुछ गुणों को पोस्ट किया, जिन्हें उन्होंने महत्वपूर्ण माना (लाप्लास ने समय के साथ कुछ अलग मानदंडों का अनुक्रम माना) विभिन्न वितरणों के लिए नेतृत्व किया।

मूल रूप से मेरा सवाल यह है कि सामान्य वितरण संभाव्यता घनत्व फ़ंक्शन की घंटी की आकृति क्यों है और कोई अन्य नहीं है?

चीज़ का कार्यात्मक रूप जिसे सामान्य घनत्व फ़ंक्शन कहा जाता है, उसे वह आकार देता है। मानक सामान्य पर विचार करें (सादगी के लिए; हर दूसरे सामान्य का आकार समान होता है, केवल पैमाने और स्थान में भिन्न होता है):

fZ(z)=ke12z2;<z<

(जहां कुल क्षेत्र बनाने के लिए बस एक स्थिर चुना गया है)k

यह हर मान पर घनत्व के मान को परिभाषित करता है , इसलिए यह पूरी तरह से घनत्व के आकार का वर्णन करता है। वह गणितीय वस्तु वह चीज है जिसे हम "सामान्य वितरण" लेबल देते हैं। नाम के बारे में कुछ खास नहीं है ; यह सिर्फ एक लेबल है जिसे हम वितरण से जोड़ते हैं। इसके कई नाम थे (और अभी भी अलग-अलग लोगों द्वारा अलग-अलग चीजों को कहा जाता है)।x

हालांकि कुछ लोगों ने सामान्य वितरण को किसी भी तरह से "सामान्य" माना है, यह वास्तव में केवल विशेष परिस्थितियों में सेट होता है जिसे आप इसे एक सन्निकटन के रूप में भी देखते हैं।


वितरण की खोज को आमतौर पर डी मोइवर (द्विपद के लिए एक सन्निकटन के रूप में) का श्रेय दिया जाता है। जब उन्होंने द्विपद गुणांक (/ द्विपद संभाव्यता) को अनुमानित रूप से थकाऊ गणनाओं में लाने की कोशिश की, तो उन्होंने क्रियात्मक रूप प्राप्त कर लिया, लेकिन जब वे सामान्य वितरण के रूप को प्रभावी रूप से प्राप्त करते हैं - तो उन्हें अपने सन्निकटन के बारे में नहीं लगता है। संभावना वितरण, हालांकि कुछ लेखकों का सुझाव है कि उन्होंने किया था। व्याख्या की एक निश्चित मात्रा की आवश्यकता होती है, इसलिए उस व्याख्या में अंतर की गुंजाइश होती है।

1800 के शुरुआती दिनों में गॉस एंड लाप्लास ने इस पर काम किया; गॉस ने इसके बारे में 1809 में लिखा था (इसके वितरण के संबंध में जिसके लिए माध्य केंद्र का MLE है) और 1810 में लाप्लास, सममित यादृच्छिक चर के योगों के वितरण के रूप में। एक दशक बाद लाप्लास केंद्रीय सीमा प्रमेय का एक प्रारंभिक रूप देता है, असतत और निरंतर चर के लिए।

वितरण के प्रारंभिक नामों में त्रुटि का कानून , त्रुटियों की आवृत्ति का कानून शामिल है , और इसे लाप्लास और गॉस दोनों के नाम पर भी रखा गया था, कभी-कभी संयुक्त रूप से।

"सामान्य" शब्द का इस्तेमाल 1870 के दशक में तीन अलग-अलग लेखकों (Peirce, Lexis and Galton) द्वारा स्वतंत्र रूप से वितरण का वर्णन करने के लिए किया गया था, 1873 में पहला और 1877 में अन्य दो। यह गॉस और इस काम के साठ साल से अधिक समय बाद है लाप्लास और दो बार से अधिक है कि डी मोइवर के सन्निकटन के बाद से। गेल्टन का इसका उपयोग संभवतः सबसे प्रभावशाली था, लेकिन उन्होंने "सामान्य" शब्द का इस्तेमाल केवल 1877 में उस काम के संबंध में किया था (ज्यादातर इसे "विचलन का कानून") कहा जाता है।

हालांकि, 1880 के दशक में गैल्टन ने कई बार वितरण के संबंध में विशेषण "सामान्य" का इस्तेमाल किया (उदाहरण के लिए 1889 में "सामान्य वक्र"), और उन्होंने बाद में यूके में सांख्यिकीविदों (विशेष रूप से पर्ल पीयरसन) पर बहुत प्रभाव डाला। )। उन्होंने यह नहीं कहा कि उन्होंने इस तरह से "सामान्य" शब्द का इस्तेमाल क्यों किया, लेकिन संभवतः इसका अर्थ "सामान्य" या "सामान्य" के अर्थ में था।

"सामान्य वितरण" वाक्यांश का पहला स्पष्ट उपयोग कार्ल पियर्सन द्वारा प्रतीत होता है; वह निश्चित रूप से 1894 में इसका उपयोग करता है, हालांकि वह दावा करता है कि इसका उपयोग बहुत पहले किया गया था (एक दावा जिसे मैं थोड़ी सावधानी के साथ देखूंगा)।


संदर्भ:

मिलर, जेफ़
"गणित के कुछ शब्दों के शुरुआती ज्ञात उपयोग:"
सामान्य वितरण (जॉन एल्डरिक द्वारा प्रवेश)
http://jeff560.tripod.com/n.html

स्टाल, शाऊल (2006),
"द इवॉल्यूशन ऑफ द नॉर्मल डिस्ट्रीब्यूशन",
मैथमेटिक्स मैगज़ीन , वॉल्यूम। 79, नंबर 2 (अप्रैल), पीपी 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf

सामान्य वितरण, (2016, 1 अगस्त)।
विकिपीडिया में, फ्री विश्वकोश।
12:02, 3 अगस्त, 2016 को https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History से पुनर्प्राप्त किया गया

हल्द, ए (2007),
"डी मोइवर की सामान्य स्वीकृति द्विपद, 1733, और इसके सामान्यीकरण के लिए",
इन: ए हिस्ट्री ऑफ़ पैरामीट्रिक स्टैटिस्टिकल इन्वेंशन इन बर्नौली से फिशर, 1713-1935; पीपी 17-24

[आप इन स्रोतों के बीच उनके डी मोइवर के संबंध में पर्याप्त विसंगतियां नोट कर सकते हैं]


गहराई से जवाब देने के लिए धन्यवाद! मैंने आगे देखा है कि सामान्य वितरण का आकार कैसे प्राप्त किया गया था और मुझे यह दस्तावेज़ पाठ्यक्रम मिल गए हैं । ncssm.edu/math/Talks/PDFS/normal.pdf , और मुझे यह समझने में समस्या है कि हम यह कैसे मान सकते हैं? त्रुटियाँ समन्वय प्रणाली के उन्मुखीकरण पर निर्भर नहीं करती हैं (एक धारणा जो बाद में एक महत्वपूर्ण निष्कर्ष को सक्षम करती है), जब यह मुझे लगता है कि इस तरह की धारणा केवल डार्ट्स के उदाहरण में पकड़ लेगी, लेकिन आकस्मिक प्रयोगात्मक त्रुटियों के उदाहरण में नहीं ।
आरा

वास्तव में संपूर्ण डार्ट्स दृष्टिकोण मुझे भ्रमित करता है क्योंकि मैं आकस्मिक प्रयोगात्मक त्रुटियों के संदर्भ में सामान्य वितरण का अध्ययन कर रहा हूं। मैं अनुमान लगा रहा हूं कि डार्ट्स का दृष्टिकोण मानता है कि आप दो आयामों में स्वतंत्र त्रुटियां कर सकते हैं जो कि उपयोग किए गए संदर्भ में ठीक है लेकिन मेरे लिए स्पष्ट नहीं है कि यह प्रयोगात्मक त्रुटियों के संदर्भ में क्या अनुवाद करेगा जहां आपके पास एक आश्रित और एक स्वतंत्र चर है जिसका अर्थ है कि आप केवल एक आयाम में त्रुटि कर सकते हैं।
आरा

1
संदर्भों का भरपूर उपयोग। +1
एरॉन हॉल

2
मुझे लगता है कि "केंद्रीय सीमा प्रमेय" का उल्लेख यहां कहीं किया जाना चाहिए, क्योंकि ओपी लगता है (कम से कम भाग में) यह पूछने के लिए कि यह विशेष वितरण क्यों इतना प्रचलित है।
के लिए खेल

1
@ जोक मैं सवाल को व्यापकता के बारे में नहीं पूछ रहा हूं या इसके बारे में एक सवाल भी नहीं बता रहा हूं। हालाँकि, मैं डी मोइवर के काम के बारे में द्विपदीय से संबंधित और लाप्लास के काम के बारे में सममित यादृच्छिक चर के योगों के बारे में बात करता हूं ... जो कि सीधे प्रश्न से संबंधित हैं। हालाँकि, मैं समस्या पर लाप्लास के काम से संबंधित एक वाक्य जोड़ूँगा (हालाँकि इसे दूसरी सदी के लिए नहीं कहा जाएगा)।
Glen_b

11

"सामान्य" वितरण को उस विशेष वितरण के रूप में परिभाषित किया गया है।

सवाल यह है कि हम इस विशेष वितरण को प्रकृति में सामान्य होने की उम्मीद क्यों करेंगे, और इसका उपयोग अक्सर एक सन्निकटन के रूप में भी किया जाता है जब वास्तविक डेटा वास्तव में उस वितरण का पालन नहीं करता है? (वास्तविक डेटा में अक्सर "वसा पूंछ" पाया जाता है, अर्थात सामान्य वितरण की भविष्यवाणी की तुलना में इस माध्यम से बहुत अधिक मूल्य सामान्य हैं)।

इसे दूसरे तरीके से रखने के लिए, सामान्य वितरण के बारे में क्या खास है?

सामान्य में बहुत सारे "अच्छे" सांख्यिकीय गुण हैं, (उदाहरण के लिए देखें https://en.wikipedia.org/wiki/Central_limit_theorem ), लेकिन सबसे अधिक प्रासंगिक IMO तथ्य यह है कि किसी भी वितरण के साथ "अधिकतम एन्ट्रापी" फ़ंक्शन है एक दिया मतलब और विचरण। https://en.wikipedia.org/wiki/Maximum_entropy_probability_distribution

इसे सामान्य भाषा में व्यक्त करने के लिए, यदि आपको वितरण का केवल माध्य (केंद्रीय बिंदु) और विचरण (चौड़ाई) दिया जाता है, और आप इसके बारे में और कुछ नहीं मानते हैं, तो आप एक सामान्य वितरण आकर्षित करने के लिए बाध्य होंगे। किसी अन्य चीज के लिए अतिरिक्त जानकारी की आवश्यकता होती है ( शैनन सूचना सिद्धांत के अर्थ में ), उदाहरण के लिए, तिरछापन, इसे निर्धारित करने के लिए।

ईटी जेनेस द्वारा बेइज़ियन अनुमान में उचित पादरी निर्धारित करने के तरीके के रूप में अधिकतम एन्ट्रापी का सिद्धांत पेश किया गया था, और मुझे लगता है कि वह इस संपत्ति पर ध्यान आकर्षित करने वाले पहले व्यक्ति थे।

इसे आगे की चर्चा के लिए देखें: http://www.inf.fu-berlin.de/inst/ag-ki/rojas_home/documents/tutorials/Gaussian-distribution.pdf


6
"दूसरे शब्दों में, यदि आपको वितरण का केवल माध्य (केंद्रीय बिंदु) और विचरण (चौड़ाई) दिया जाता है, और आप इसके बारे में और कुछ नहीं मानते हैं, तो आपको एक सामान्य वितरण आकर्षित करने के लिए मजबूर किया जाएगा।" मुझे लगता है कि यह निर्भर करता है कि "मजबूर" की परिभाषा क्या है। आप मजबूर हो सकते हैं। मैं नहीं हूँगा। आपने जो वर्णन किया है, वह एक फ़ंक्शन मानने के लिए "मजबूर" होने के नैतिक समकक्ष है जब आप इसके रूप को नहीं जानते, या यह कि यादृच्छिक चर स्वतंत्र हैं जब आप उनकी सटीक निर्भरता नहीं जानते हैं। मैं इनमें से कोई भी धारणा बनाने के लिए मजबूर नहीं हूं और न ही हूं।
मार्क एल। स्टोन

5
@ मेरा मानना ​​है कि मार्क की बात का हिस्सा यह हो सकता है कि औचित्य अनिवार्य
whuber

5
@ दूर से यह! पहले आपको यह मान लेना होगा कि अधिकतम एंट्रोपी का सिद्धांत उपयोगी है और आपकी सांख्यिकीय समस्या पर लागू होता है। आगे आपको पूरी तरह से निश्चित होना है कि आप वितरण के बारे में कुछ और नहीं मान सकते हैं। वे दोनों समस्याग्रस्त हैं। (अधिकांश सांख्यिकीय समस्याओं में जो मैंने सामना किया है - सैद्धांतिक भौतिकी के दायरे के बाहर - पूर्व सत्य नहीं रहा है; और मैंने कभी भी वास्तविक दुनिया की समस्या नहीं देखी है जहां बाद की स्थिति है।)
व्हिबर

1
@ नील मार्क और व्हीबर। मैंने उस अनुच्छेद को स्पष्ट करने का प्रयास किया है। मुझे लगता है कि "जो कुछ भी और कुछ भी नहीं है उसे समझें" एक सामान्य साधारण भाषा की व्याख्या है जो अधिकतम एन्ट्रॉपी के सिद्धांत को करने की कोशिश कर रहा है। साधारण भाषा होने के नाते आप निश्चित रूप से इस पर एक अलग व्याख्या कर सकते हैं। इसलिए हमें गणित की जरूरत है। अधिक सटीक कथन यह है कि हम शैनन के अर्थ में कोई जानकारी नहीं जोड़ रहे हैं। लिंक इसे आगे समझाते हैं।
गैरेथ

1
@ सभी लोकों पर एक समान वितरण (जो मुझे लगता है कि आप अपनी नवीनतम टिप्पणी में मतलब था) एक अत्यधिक अनुचित वितरण होगा। एक सामान्य वितरण के प्रति आपके चालक के रूप में अधिकतम एंट्रोपी का आपका दावा एक प्रमुख धारणा बनाता है; यह न्यूनतम सीमा जैसे किसी और चीज़ को संभालने से अधिक बलशाली क्यों है?
हेनरी

3

सामान्य वितरण (उर्फ " गाऊसी वितरण ") एक फर्म गणितीय नींव है। केंद्रीय सीमा प्रमेय का कहना है कि आप में से n स्वतंत्र और हूबहू एक विशिष्ट मतलब और विचरण होने यादृच्छिक परिवर्तनीय वितरित, और आप उन यादृच्छिक चर की औसत लेते हैं, परिणाम के वितरण n के रूप में एक गाऊसी वितरण के अभिसरण जाएगा एक परिमित सेट है, तो अनंत तक जाता है। यहां कोई अनुमान नहीं है, क्योंकि गणितीय व्युत्पत्ति इस विशिष्ट वितरण समारोह की ओर ले जाती है और कोई अन्य नहीं।

इसे अधिक ठोस शब्दों में रखने के लिए, एक एकल यादृच्छिक चर पर विचार करें, जैसे कि एक उचित सिक्का (2 समान रूप से संभव परिणाम) को फ़्लिप करना। एक विशेष परिणाम प्राप्त करने की संभावना सिर के लिए 1/2 और पूंछ के लिए 1/2 है।

यदि आप सिक्कों की संख्या में वृद्धि करते हैं और प्रत्येक परीक्षण के साथ प्राप्त किए गए कुल सिर का ट्रैक रखते हैं, तो आपको एक द्विपद वितरण मिलेगा , जिसमें लगभग एक घंटी का आकार होता है। एक्स-एक्सिस के साथ सिर की संख्या के साथ बस ग्राफ करें, और जितनी बार आप फ़्लिप करते हैं, उतने सिर वाई-एक्सिस के साथ होते हैं।

आप जितने अधिक सिक्कों का उपयोग करते हैं, और जितने बार आप सिक्कों को पलटाते हैं, उतना ही ग्राफ़ एक गाऊसी बेल वक्र की तरह दिखाई देगा। यही केंद्रीय सीमा प्रमेय का दावा करती है।

आश्चर्यजनक बात यह है कि प्रमेय इस बात पर निर्भर नहीं करता है कि वास्तव में यादृच्छिक चर कैसे वितरित किए जाते हैं, बस इसलिए जब तक कि प्रत्येक यादृच्छिक चर में समान वितरण न हो। प्रमेय में एक महत्वपूर्ण विचार यह है कि आप यादृच्छिक चर जोड़ या औसत कर रहे हैं । एक अन्य मुख्य अवधारणा यह है कि प्रमेय गणितीय सीमा का वर्णन कर रहा है क्योंकि यादृच्छिक चर की संख्या अधिक और बड़ी हो जाती है। जितने अधिक चर आप उपयोग करते हैं, वितरण उतना ही सामान्य वितरण के करीब पहुंच जाएगा।

मैं आपको गणितीय सांख्यिकी में एक वर्ग लेने की सलाह देता हूं यदि आप यह देखना चाहते हैं कि गणितज्ञ यह कैसे निर्धारित करते हैं कि सामान्य वितरण वास्तव में घंटी वक्र के लिए गणितीय रूप से सही कार्य है।


आपके सहयोग के लिए धन्यवाद। यह सही होगा यदि आपको समझाया जाए कि योग का वितरण (या माध्य) मानकीकृत होना चाहिए। अन्यथा, राशि का वितरण एक सीमा तक नहीं पहुंचता है और माध्य का वितरण स्थिर होता है। लेकिन यह पोस्ट उन सवालों का जवाब कैसे देती है जो सामने आए थे? (वैसे, वहाँ विभिन्न सवाल पूछे जा रहे हैं और वे सब भ्रमित और अस्पष्ट हैं, लेकिन वे कैसे गाऊसी पीडीएफ के लिए सूत्र की खोज की थी या व्युत्पन्न के बारे में पूछ कर रहे हैं।)
whuber

2

इस धागे पर कुछ उत्कृष्ट उत्तर हैं। मैं यह महसूस करने में मदद नहीं कर सकता कि ओपी एक ही सवाल नहीं पूछ रहा था क्योंकि हर कोई जवाब देना चाहता था। मुझे ऐसा लगता है, हालांकि, क्योंकि यह उत्तर देने के लिए सबसे रोमांचक सवालों में से एक होने के करीब है - मुझे वास्तव में यह मिला क्योंकि मुझे उम्मीद थी कि किसी को यह सवाल था कि "हम कैसे जानते हैं कि सामान्य पीडीएफ एक पीडीएफ है?" और मैंने इसकी खोज की। लेकिन मुझे लगता है कि प्रश्न का उत्तर सामान्य वितरण की उत्पत्ति को प्रदर्शित करने के लिए हो सकता है।

सामान्य वितरण को पहली बार बहुत बड़े लिए द्विपद वितरण को अनुमानित करने के लिए उपयोग करने के लिए डिज़ाइन किया गया था । 1744 में, डी मोइवर नाम के एक गणितज्ञ ने दिखाया कि बड़े लिए द्विपद वितरण, सामान्य और विचरण साथ एक सामान्य वितरण की समान संभावनाएं हैं । इस का प्रमाण बहुत ही स्वाभाविक रूप से द्विपद पीडीएफ की सीमा को रूप में लेने से है , और स्टर्लिंग के सन्निकटन के साथ तथ्यात्मक मूल्यों की जगह लेना है।n n पी एन पी ( 1 - पी ) n nnnpnp(1p)n

लेकिन मैं फिर से इस बात का सबूत पाने के लिए ललचा गया हूं कि ऐसा होता है, और मुझे नहीं पता कि ओपी चाहता था। यदि दिलचस्पी है, तो इसे यहाँ समझाया गया है । बस यह जान लें कि हम "आसानी से" यह साबित कर सकते हैं कि द्विपद वितरण की सीमा और जैसे कि एक सामान्य वितरण है।पी 0 एन पी = 1np0np=1

उस ज्ञान को लेते हुए, हम देख सकते हैं कि सामान्य वितरण घंटी के आकार का क्यों है यदि हम देख सकते हैं कि द्विपद वितरण घंटी के आकार का क्यों है, जो देखने में बहुत आसान है। आगे बढ़ो और इसे अपने लिए आजमाओ - और लिए द्विपद संभावनाओं का असतत ग्राफ बनाओ । इसका आकार कैसा है? और लिए द्विपद संभावनाओं के असतत ग्राफ के बारे में क्या ? वास्तव में, इसे आनुभविक रूप से करें, कुछ यादृच्छिक डेटा को द्विपद रूप से वितरित करें और देखें कि हिस्टोग्राम कैसा दिखता है! बेशक, यह एक बहुत ही सुंदर दिखने वाली घंटी है, लेकिन यह उच्च अधिक सुडौल है। लेकिन यह घंटी के आकार का क्यों है?p = 0.5 n = 100 p = 0.5 nn=10p=0.5n=100p=0.5n

अगर मैं अभी जमीन पर 100 सिक्के डंप करता हूं और मुझे कितने सिर मिलते हैं, तो मैं 0 सिर गिन सकता हूं, या मैं 100 सिर गिन सकता हूं, लेकिन मुझे लगता है कि मेरे बीच में कहीं एक संख्या की गणना करने की अधिक संभावना है। क्या आप देखते हैं कि इस हिस्टोग्राम को घंटी के आकार का क्यों होना चाहिए?


+1 - हालाँकि, ध्यान दें कि मैं अपने उत्तर के कई हिस्सों में डी मोइवर की चर्चा करता हूं। आपको मेरे जवाब में अंतिम नोट मिल सकता है कि संदर्भों में विसंगतियों के संबंध में दिलचस्प है - यह वास्तव में देखने लायक है कि डी मोइवर ने अपने काम की विभिन्न विशेषताओं को किस हद तक पकड़ते हुए देखा है। उपयुक्त शर्तों के तहत एक सामान्य सीएफडी द्वारा द्विपद cdf अच्छी तरह से क्यों बन जाता है, इस बारे में विशिष्ट चर्चा क्यों एक द्विपद वितरण घंटी के आकार का है?
Glen_b

1

दो मान्यताओं से स्वतंत्र बहुभिन्नरूपी सामान्य वितरण की मैक्सवेल-हर्शल व्युत्पत्ति का भी उल्लेख करेंगे:

  1. वेक्टर के रोटेशन से वितरण प्रभावित नहीं होता है।

  2. वेक्टर के घटक स्वतंत्र हैं।

यहाँ Jaynes द्वारा प्रदर्शनी है

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.