यह स्वतंत्रता और सांख्यिकीय मापदंडों की डिग्री के बारे में एक कहानी है और यह अच्छा है कि दोनों का सीधा सरल संबंध है।
ऐतिहासिक रूप से, " - 1 " शब्द Euler के बीटा फ़ंक्शन के अध्ययन में दिखाई दिए। वह 1763 तक उस पैरामीटर का उपयोग कर रहा था, और इसलिए एड्रियन-मैरी लीजेंड्रे: उनके उपयोग ने बाद के गणितीय सम्मेलन की स्थापना की। यह कार्य सभी ज्ञात सांख्यिकीय अनुप्रयोगों का विरोध करता है।−1
आधुनिक गणितीय सिद्धांत विश्लेषण, संख्या सिद्धांत और ज्यामिति में अनुप्रयोगों के धन के माध्यम से पर्याप्त संकेत प्रदान करता है, कि " - 1 " शब्दों का वास्तव में कुछ अर्थ है। मैंने उन कारणों में से कुछ को टिप्पणी के लिए छोड़ दिया है।−1
अधिक ब्याज की "सही" सांख्यिकीय पैरामीटराइजेशन क्या होना चाहिए। यह बिल्कुल स्पष्ट नहीं है और यह गणितीय सम्मेलन के समान नहीं है। प्रायिकता वितरण के आमतौर पर उपयोग किए जाने वाले, प्रसिद्ध, अंतर्संबंधित परिवारों का एक बहुत बड़ा जाल है। इस प्रकार, सम्मेलनों को नाम दिया जाता है (अर्थात, मानकीकृत) एक परिवार आमतौर पर संबंधित परिवारों के नाम से संबंधित सम्मेलनों का उपयोग करता है। एक पैरामीटर बदलें और आप उन सभी को बदलना चाहेंगे। इसलिए हम सुराग के लिए इन रिश्तों को देख सकते हैं।
कुछ लोग इस बात से असहमत होंगे कि सबसे महत्वपूर्ण वितरण परिवार सामान्य परिवार से प्राप्त होते हैं। याद एक यादृच्छिक चर कि एक्स होना कहा जाता है "आम तौर पर वितरित" जब ( एक्स - μ ) / σ एक प्रायिकता घनत्व है च ( एक्स ) के लिए आनुपातिक विस्तार ( - एक्स 2 / 2 ) । जब σ = 1 और μ = 0 , एक्स एक कहा जाता है कि मानक सामान्य वितरण।X(X−μ)/σf(x)exp(−x2/2)σ=1μ=0एक्स
कई डेटासेट x 1 , x 2 , … , x n का अध्ययन अपेक्षाकृत सरल आँकड़ों का उपयोग करके किया जाता है जिसमें डेटा और कम शक्तियों (आमतौर पर वर्ग) के तर्कसंगत संयोजन शामिल होते हैं। जब उन डेटा को एक सामान्य वितरण से यादृच्छिक नमूने के रूप में तैयार किया जाता है - ताकि प्रत्येक x i को एक सामान्य चर X i की प्राप्ति के रूप में देखा जाए , सभी X i एक सामान्य वितरण साझा करते हैं, और स्वतंत्र होते हैं - उन आँकड़ों के वितरण उस सामान्य वितरण द्वारा निर्धारित किया जाता है। जो व्यवहार में सबसे अधिक बार उठते हैंएक्स1, एक्स2, ... , एक्सnएक्समैंएक्समैंएक्समैं
टी ν ,स्टूडेंट टी डिस्ट्रीब्यूशनविथ ν = n - १ "डिग्री ऑफ़ फ्रीडम।" यह आँकड़ा t = distribution X का वितरण हैटीνटीν= एन - 1se ( एक्स ) जहां ˉ एक्स =(एक्स1+एक्स2+⋯+एक्सएन)/nमॉडल डेटा के मतलब औरse(एक्स)=(1/√
टी = एक्स¯से( एक्स))
X¯=(X1+X2+⋯+Xn)/nn ) √( X 2 1 + X 2 2 + ⋯ + X 2 n ) / ( n - 1 ) - 2 X 2 माध्य की मानक त्रुटि है। N-1द्वारा विभाजन सेपता चलता है किnको2या अधिकहोना चाहिए, जहांνएक पूर्णांक1या अधिक है। सूत्र, हालांकि स्पष्ट रूप से थोड़ा जटिल है, डिग्री दो के डेटा के तर्कसंगत कार्य का वर्गमूल है: यह अपेक्षाकृत सरल है।se(X)=(1/n−−√)(X21+X22+⋯+X2n)/(n−1)−X¯2−−−−−−−−−−−−−−−−−−−−−−−−−−−−√n−1n2ν1
χ 2 ν , χ 2 (ची-वर्ग) वितरणके साथ ν "स्वतंत्रता की डिग्री" (DF)। यह ν स्वतंत्र मानक सामान्य चरके वर्गों के योग का वितरण है। इन चरों के वर्गों का मतलब के वितरण इसलिए एक हो जाएगा χ 2 वितरण द्वारा बढ़ाया 1 / ν : मैं के रूप में एक "सामान्य" इस का उल्लेख होगा χ 2 वितरण।χ2νχ2ννχ21/νχ2
एफ ν 1 , ν 2 , एफ मानकों के साथ अनुपात वितरण ( ν 1 , ν 2 ) दो स्वतंत्र सामान्यीकृत के अनुपात है χ 2 के साथ वितरण ν 1 और ν 2 स्वतंत्रता की डिग्री।Fν1,ν2F(ν1,ν2)χ2ν1ν2
गणितीय गणना से पता चलता है कि इन तीनों वितरणों में घनत्व है। महत्वपूर्ण रूप से, के घनत्व χ 2 ν वितरण गामा (के यूलर अभिन्न परिभाषा integrand के लिए आनुपातिक है Γ ) समारोह। आइए उनकी तुलना करें:χ2νΓ
च χ 2 ν ( 2 एक्स ) α एक्स ν / 2 - 1 ई - एक्स ;च Γ ( ν ) ( एक्स ) α एक्स ν - 1 ई - एक्स ।
fχ2ν(2x)∝xν/2−1e−x;fΓ(ν)(x)∝xν−1e−x.
यह दिखाता है कि दो बार χ 2 ν चर पैरामीटर के साथ एक गामा वितरण है ν / 2 । एक-आधा का कारक काफी परेशान करने वाला होता है, लेकिन 1 घटने से रिश्ता बहुत खराब हो जाएगा। यह पहले से ही सवाल का जवाब एक सम्मोहक की आपूर्ति: अगर हम एक के पैरामीटर चाहते χ 2 वितरण वर्ग सामान्य चर है कि यह (का एक पहलू का उत्पादन की संख्या की गणना करने के लिए 1 / 2 ) तो इसकी घनत्व समारोह चाहिए में प्रतिपादक, आधे से कम हो कि गिनती हो। χ2νν/21χ21/2
क्यों की कारक है 1 / 2 का अंतर कम से कम परेशानी 1 ? कारण यह है कि जब हम चीजों को जोड़ते हैं तो कारक लगातार बना रहेगा। यदि एन स्वतंत्र मानक नॉर्मल के वर्गों का योग पैरामीटर एन (कुछ कारक) के साथ एक गामा वितरण के लिए आनुपातिक है , तो एम स्वतंत्र मानक नॉर्मल के वर्गों का योग पैरामीटर मी (एक ही कारक बार) के साथ एक गामा वितरण के लिए आनुपातिक है , जहां सभी n + m चर के वर्गों का योग पैरामीटर m + n (अभी भी एक ही कारक) के साथ एक गामा वितरण के लिए आनुपातिक है । 1/21nnmmn+mm+nतथ्य यह है कि मापदंडों को इतनी बारीकी से जोड़ने से गिनती जोड़ने में बहुत मदद मिलती है।
यदि, हालांकि, हम गणितीय सूत्रों से "पेसिक-लुकिंग" - 1 " को हटा देते हैं, तो ये अच्छे रिश्ते अधिक जटिल हो जाएंगे। उदाहरण के लिए, अगर हम बदल की वास्तविक शक्ति का उल्लेख करने के गामा वितरण के parameterization एक्स सूत्र में, इतना है कि एक χ 2 1 वितरण एक "गामा से संबंधित हो जाएगा ( 0 ) की शक्ति के बाद से" वितरण ( एक्स में अपनी पीडीएफ है 1 - 1 = 0 ), तो तीन की राशि χ 2 1 वितरण एक "गामा कहा जा करने के लिए होगा ( 2 )−1xχ21(0)x1−1=0χ21(2)"वितरण। संक्षेप में, गामा वितरण में स्वतंत्रता की डिग्री और पैरामीटर के बीच घनिष्ठ योगात्मक संबंध - 1 को सूत्र से निकालकर और पैरामीटर में अवशोषित करके खो दिया जाएगा ।−1
इसी तरह, एफ अनुपात वितरण की संभाव्यता फ़ंक्शन बीटा वितरण से निकटता से संबंधित है। वास्तव में, जब Y एक है एफ अनुपात वितरण, के वितरण जेड = ν 1 Y / ( ν 1 Y + ν 2 ) एक बीटा है ( ν 1 / 2 , ν 2 / 2 ) वितरण। इसका घनत्व कार्य आनुपातिक हैFYFZ=ν1Y/(ν1Y+ν2)(ν1/2,ν2/2)
च जेड ( जेड ) α z ν 1 / 2 - 1 ( 1 - जेड ) ν 2 / 2 - 1 ।
fZ(z)∝zν1/2−1(1−z)ν2/2−1.
इसके अलावा - इन विचारों को पूर्ण रूप से लेते हुए - ν डीएफ के साथ एक छात्र टी वितरण के वर्ग में मापदंडों ( 1 , ν ) के साथ एफ अनुपात वितरण है । एक बार और यह स्पष्ट हो जाता है कि पारंपरिक मापदण्ड रखने से अंतर्निहित गणनाओं के साथ एक स्पष्ट संबंध बना रहता है जो स्वतंत्रता की डिग्री में योगदान देता है।tνF(1,ν)
देखने के एक सांख्यिकीय दृष्टिकोण से, फिर, यह सबसे स्वाभाविक होगा और सरल के पारंपरिक गणितीय parameterizations की भिन्नता का उपयोग करने के Γ और बीटा वितरण: हम एक फोन करने को प्राथमिकता देनी चाहिए Γ ( α ) वितरण एक " Γ ( 2 α ) वितरण" और बीटा ( α , β ) वितरण एक बुलाया जाना चाहिए "बीटा ( 2 α , 2 β ) वितरण।" वास्तव में, हम पहले से ही ऐसा कर चुके हैं: यही कारण है कि हम "ची-स्क्वेर्ड" और " एफ " नामों का उपयोग करना जारी रखते हैंΓΓ(α)Γ(2α)(α,β)(2α,2β)F Ratio" distribution instead of "Gamma" and "Beta". Regardless, in no case would we want to remove the "−1−1" terms that appear in the mathematical formulas for their densities. If we did that, we would lose the direct connection between the parameters in the densities and the data counts with which they are associated: we would always be off by one.