पियर्सन के अवशिष्ट


16

फिट की भलाई के लिए ची-स्क्वायर परीक्षण के संदर्भ में पियर्सन के अवशिष्ट के बारे में एक शुरुआती सवाल:

साथ ही परीक्षण आँकड़ा, आर के chisq.testकार्य में पियर्सन के अवशिष्ट की रिपोर्ट है:

(obs - exp) / sqrt(exp)

मैं समझता हूं कि प्रेक्षित और अपेक्षित मूल्यों के बीच के कच्चे अंतर को क्यों नहीं देखा जा सकता है, यह जानकारीपूर्ण नहीं है, क्योंकि एक छोटे नमूने के परिणामस्वरूप एक छोटा अंतर होगा। हालांकि, मैं हर के प्रभाव के बारे में अधिक जानना चाहता हूं: अपेक्षित मूल्य की जड़ से विभाजित क्यों? क्या यह एक 'मानकीकृत' अवशिष्ट है?


6
हर का उपयोग कच्चे अवशिष्टों के विचरण के लिए किया जाता है, जो तब पियर्सन के अवशिष्टों को इकाई विचरण के लगभग बनाता है (इसे प्राप्त करने के अन्य तरीके हैं)। कृपया ध्यान दें कि stdresमानकीकृत अवशिष्टों के लिए एक घटक है ।
chl

@chl आपकी त्वरित प्रतिक्रिया के लिए धन्यवाद। हालाँकि, मैं इस संदर्भ में विचरण की अवधारणा को नहीं समझता। क्या आप किसी भी संसाधन के बारे में जानते हैं जहाँ मैं और अधिक सीख सकता हूँ? मेरा मानना ​​है कि तब, एक पियर्सन का अवशिष्ट 'मानकीकृत' नहीं है, जो कि घटक की chisq.testगणना भी करता stdresहै?
इयान डिलिंगम

3
एलन एग्रेस्टी द्वारा श्रेणीबद्ध डेटा के विश्लेषण का निश्चित संदर्भ श्रेणीबद्ध डेटा विश्लेषण है । यदि कोई भी अधिक विस्तृत जवाब नहीं देता है, तो मैं अपनी टिप्पणियों को उचित उत्तर में बदलने की कोशिश करूंगा।
chl

लिंक के लिए धन्यवाद, @chl। मैंने पुस्तक तक पहुँच प्राप्त कर ली है, इसलिए मैं स्वयं इसे जानने की कोशिश करूँगा।
इयान डिलिंगम

जवाबों:


10

आकस्मिक तालिकाओं के विश्लेषण का मानक सांख्यिकीय मॉडल यह मान लेना है कि (कुल गिनती पर बिना शर्त) सेल काउंट स्वतंत्र पॉसन यादृच्छिक चर हैं। इसलिए यदि आपके पास एक n×m आकस्मिक तालिका है, तो विश्लेषण के लिए एक आधार के रूप में इस्तेमाल किया जाने वाला सांख्यिकीय मॉडल प्रत्येक कोशिका गणना को बिना शर्त वितरण के लिए लेता है:

Xi,j ~ Pois(μi,j)

एक बार जब आप आकस्मिक तालिका, या एक पंक्ति या स्तंभ गणना के लिए कुल सेल गिनती लागू करते हैं, तो सेल काउंट्स के परिणामस्वरूप सशर्त वितरण फिर बहुराष्ट्रीय बन जाते हैं। किसी भी मामले में, एक पॉइसन वितरण के लिए हमारे पास E(Xi,j)=V(Xi,j)=μi,j , इसलिए मानकीकृत सेल काउंट है:

STD(Xi,j)Xi,jE(Xi,j)V(Xi,j)=Xi,jμi,jμi,j

तो, आप जिस फॉर्मूले के बारे में पूछ रहे हैं, उसमें आप जो देख रहे हैं, वह मानकीकृत सेल काउंट है, इस धारणा के तहत कि सेल काउंट में एक (बिना शर्त) पॉइसन वितरण है।

यहां से डेटा में पंक्ति और स्तंभ चर की स्वतंत्रता का परीक्षण करना आम है, और इस मामले में आप एक परीक्षण आँकड़ा का उपयोग कर सकते हैं जो उपरोक्त मानों के योग-वर्गों को देखता है (जो वर्ग-मान के बराबर है) मानकीकृत मूल्यों की सदिश राशि)। ची-स्क्वैयर परीक्षण इस तरह के परीक्षण के लिए एक बड़े-नमूना सन्निकटन के आधार पर परीक्षण सांख्यिकीय के शून्य वितरण के लिए एक पी-मूल्य प्रदान करता है। यह आमतौर पर उन मामलों में लागू किया जाता है, जहां कोई भी विक्रय संख्या बहुत छोटी नहीं होती है।


0

फिट की अच्छाई के संदर्भ में, आप इस http://www.stat.yale.edu/Courses/1997-98/101/chigf.htm को संदर्भित कर सकते हैं ।

यदि आप यह जानना चाहते हैं कि भाजक वहां कैसे पहुंच गया, तो आपको शुरुआत के लिए द्विपद के सामान्य सन्निकटन के रूप में यहाँ चि-वर्ग को देखना होगा, जिसे बाद में बहुराष्ट्रीय कंपनियों तक बढ़ाया जा सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.