कार्ल पियर्सन ची-स्क्वायड स्टेटिस्टिक के साथ कैसे आए?


14

1900 में निम्नलिखित पियर्सन ची-वर्ग के आँकड़ों के साथ पियर्सन कैसे आए?

कि कश्मीर~χ2

K=(OijEij)2Eij
Kχ2

क्या उनके मन में ची-स्क्वेयर था और मीट्रिक (बॉटम-अप अप्रोच) को डिसाइड किया, या क्या उन्होंने स्टेटिस्टिक को डिसाइड किया और बाद में साबित किया कि यह ची-स्क्वर्ट डिस्ट्रीब्यूशन (टॉप-डाउन) को फॉलो करता है।K

मुझे पता है कि क्यों वह इस तरह के रूप में चुना है कि विशिष्ट रूप और दूसरों को नहीं चाहते या Σ | आई जे - आई जे | , और भी क्यों वह वर्ग को भाजक से विभाजित करता है।(OijEij)2|OijEij|



1
यह निश्चित रूप से, आपके द्वारा उपयोग किए जाने वाले किसी भी आंकड़े के लिए संभव है। आपके विकल्प पूरी तरह से ठीक हैं, हालांकि आपको उनके लिए नमूना वितरण का काम करना होगा, जो कोशिकाओं की संख्या के आधार पर भिन्न होगा। इस फॉर्म के बारे में एक बात जो सुविधाजनक है, वह यह है कि इसके अन्य वितरणों के साथ कुछ संबंध हैं, जैसे कि यह k वर्ग के मानक सामान्य यादृच्छिक यादृच्छिक के योग का वितरण है।
गूँग - मोनिका

जवाबों:


23

पियर्सन का 1900 पेपर कॉपीराइट से बाहर है, इसलिए हम इसे ऑनलाइन पढ़ सकते हैं ।

आपको यह ध्यान देकर शुरू करना चाहिए कि यह पेपर फिट टेस्ट की अच्छाई के बारे में है, न कि आज़ादी या एकरूपता के परीक्षण के बारे में।

वह बहुभिन्नरूपी सामान्य के साथ काम करके आगे बढ़ता है, और ची-स्क्वायर सामान्य मानकीकृत वर्गों के योग के रूप में उत्पन्न होता है।

आप p160-161 पर चर्चा से देख सकते हैं कि वह बहुराष्ट्रीय वितरित डेटा के परीक्षण को लागू करने के बारे में स्पष्ट रूप से चर्चा कर रहा है (मुझे नहीं लगता कि वह उस शब्द का कहीं भी उपयोग करता है)। वह स्पष्ट रूप से बहुराष्ट्रीय की अनुमानित बहुभिन्नरूपी सामान्यता को समझता है (निश्चित रूप से वह जानता है कि मार्जिन लगभग सामान्य हैं - यह एक बहुत पुराना परिणाम है - और साधन, संस्करण और सहसंयोजी जानता है, क्योंकि वे कागज में बताए गए हैं); मेरा अनुमान है कि उस सामान में से अधिकांश पहले से ही 1900 तक पुरानी टोपी है। (ध्यान दें कि ची-चुकता वितरण ही 1870 के दशक के मध्य में हेल्मर्ट द्वारा काम करने के लिए वापस मिल जाता है।)

फिर p163 के नीचे तक वह ची-स्क्वायर स्टेटिस्टिक को "फिट की भलाई का एक उपाय" के रूप में प्राप्त करता है (स्टेटिविस्ट स्वयं मल्टीवेरेट सामान्य सन्निकटन के घातांक में प्रकट होता है)।

χ122

* (ध्यान दें कि न तो फिशरियन और न हीमैन-पियर्सन परीक्षण प्रतिमान मौजूद हैं, फिर भी हम स्पष्ट रूप से उसे पी-मूल्य की अवधारणा को पहले से ही देखते हैं।)

आप ध्यान दें कि वह स्पष्ट रूप से जैसे शब्द नहीं लिखते हैं(हेमैं-मैं)2/मैं121'=-'2/

ची-स्क्वायर परीक्षण को समझने के अधिकांश वर्तमान तरीके अभी तक नहीं हैं, लेकिन दूसरी तरफ, काफी कुछ पहले से ही है (कम से कम अगर आपको पता है कि क्या देखना है)। 1920 (और आगे) में बहुत कुछ हुआ जिसने इन चीजों को देखने का तरीका बदल दिया।


मैंमैंमैं


संपादित में जोड़ा गया:

1983 के प्लैकेट द्वारा कागज ऐतिहासिक संदर्भ का एक अच्छा सौदा देता है, और कागज के लिए कुछ गाइड। मैं अत्यधिक इसे देखने की सलाह देता हूं। ऐसा लगता है कि यह JStor (यदि आप साइन इन करते हैं) के माध्यम से ऑनलाइन मुफ़्त है, इसलिए आपको इसे पढ़ने के लिए किसी संस्थान के माध्यम से एक्सेस की आवश्यकता नहीं होनी चाहिए।

प्लैकेट, आरएल (1983),
"कार्ल पियरसन और ची-स्क्वेर्ड टेस्ट,"
अंतर्राष्ट्रीय सांख्यिकीय समीक्षा ,
वॉल्यूम। 51, नंबर 1 (अप्रैल), पीपी। 59-72


1
मैं अभी इस पोस्ट को फिर से पढ़ता हूं और हर बार जब मैं करता हूं, मुझे एक अतिरिक्त जानकारी मिलती है। @Glen_b मैं आपके शानदार जवाब के लिए धन्यवाद देना चाहता हूं, जो मुझे पहले करना चाहिए था। यदि मैं अतिरिक्त प्रश्न पूछ सकता हूं, तो आपके स्पष्टीकरण में, ई द्वारा सहसंयोजक के लिए कैसे समायोजित किया जाता है, तो क्या आप उस पर अधिक विस्तार कर सकते हैं या मुझे उस संसाधन की ओर इशारा कर सकते हैं जो इस बिंदु पर चर्चा करता है? मैं सहज रूप से समझ सकता हूं कि "सामान्यीकरण" क्यों आवश्यक है, लेकिन मैं गणितीय प्रमाण के साथ अपने अंतर्ज्ञान को वापस करना चाहता हूं।
अलबी

1
Ei

1
XiCov(Xi,Xj)=E(XiXj)E(Xi)E(Xj)=E(Xi)E(Xj)Xi,Xj>0Cov(Oi,Oj)

लिंक @Glen_b के लिए धन्यवाद। पोस्ट पढ़ने के बाद, यह अब बहुत स्पष्ट है! मैं भोलेपन से सोच रहा था कि हर सेल के लिए प्रारंभिक मतभेदों को समायोजित करने के लिए हर जगह पर है, इस प्रकार "सामान्यीकरण" शब्द, लेकिन आपकी पोस्ट को पढ़कर मुझे एहसास हुआ कि मैं पूरी तरह से निशान से दूर था।
एल्बी

दुर्भाग्य से, शब्द 'नॉर्मलाइज' में सांख्यिकी में प्रासंगिक कम से कम तीन अलग-अलग इंद्रियां हैं। अनजाने में, मैं आमतौर पर इसका मतलब केवल "मानक 0 का मतलब और मानक विचलन 1" के लिए उपयोग कर सकता हूं, लेकिन अन्य लोग इसका उपयोग कुछ मानदंडों के अनुसार वेक्टर को सामान्य करने के अर्थ में 'सामान्यीकरण' करने के लिए करते हैं, या लगभग सामान्यता में बदलने के लिए भी करते हैं। चूँकि यहाँ इस तरह की बगिया है, इसलिए मुझे इससे बचना चाहिए।
Glen_b -Reinstate मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.