क्या ऐसा है कि मानकीकरण में विचरण को जाना जाता है जबकि छात्रकरण में इसे ज्ञात नहीं है और इसलिए इसका अनुमान है? धन्यवाद।
क्या ऐसा है कि मानकीकरण में विचरण को जाना जाता है जबकि छात्रकरण में इसे ज्ञात नहीं है और इसलिए इसका अनुमान है? धन्यवाद।
जवाबों:
एक संक्षिप्त पुनरावृत्ति। एक मॉडल को देखते हुए , जहां है , और , जहां "हैट मैट्रिक्स" है। अवशिष्ट जनसंख्या भिन्नता अज्ञात है और इसका अर्थ , वर्गाकार त्रुटि से हो सकता है।एक्स n × पी β = ( एक्स ' एक्स ) - 1 एक्स ' y y = एक्स β = एक्स ( एक्स ' एक्स ) - 1 एक्स ' y = एच वाई एच = एक्स ( एक्स ' एक्स ) - 1 एक्स ' ई = y -σ2एमएसई
अर्धवृत्ताकार अवशिष्ट को रूप में परिभाषित किया गया है , लेकिन चूंकि अवशेषों का विचरण और X दोनों पर निर्भर करता है , उनका अनुमानित विचरण है: \ widehat V (e_i) = एमएसई (1-h_ {ii}) जहां h_ {ii} है मैं टोपी मैट्रिक्स के वें विकर्ण तत्व। σ2एक्सवी(ईमैं)=एमएसई(1-एचमैंमैं)जमैंमैंमैं
मानकीकृत अवशिष्ट, जिन्हें आंतरिक रूप से छात्र अवशिष्ट भी कहा जाता है , हैं:
हालाँकि एकल और गैर स्वतंत्र हैं, इसलिए में वितरण नहीं हो सकता है । फिर प्रक्रिया th अवलोकन को हटाने के लिए, शेष अवलोकनों के लिए प्रतिगमन फ़ंक्शन को फिट करें , और new प्राप्त करें जिसे द्वारा निरूपित किया जा सकता है । अंतर: को हटाए गए अवशिष्ट कहा जाता है । एक समतुल्य अभिव्यक्ति जिसके लिए एक आवश्यकता नहीं है: नए और को और द्वारा एम एस ई आर मैं टी मैं n - 1 y y मैं ( मैं ) d मैं = y मैं - y मैं ( मैं ) d मैं = ई मैं
कुटनेर एट अल।, एप्लाइड रैखिक सांख्यिकीय मॉडल , अध्याय 10 देखें।
संपादित करें: मुझे कहना होगा कि रिप्रिज द्वारा उत्तर एकदम सही है। मैंने सोचा था कि ओपी मानकीकृत और छात्र अवशिष्ट के बारे में था (और मानकीकृत अवशिष्ट प्राप्त करने के लिए जनसंख्या मानक विचलन द्वारा विभाजित करना मुझे बिल्कुल अजीब लगा), लेकिन मैं गलत था। मुझे उम्मीद है कि मेरा जवाब ओटी होने पर भी किसी की मदद कर सकता है।
सामाजिक विज्ञान में यह आम तौर पर कहा जाता है कि Studentizated स्कोर नमूना प्रसरण / मानक विचलन (से जनसंख्या विचरण / मानक विचलन के आकलन के लिए विद्यार्थी का / Gosset की गणना का उपयोग करता है )। इसके विपरीत, मानकीकृत स्कोर (एक संज्ञा, एक विशेष प्रकार का आँकड़ा, Z स्कोर) को जनसंख्या मानक विचलन (? ) का उपयोग करने के लिए कहा जाता है ।σ
हालाँकि, ऐसा प्रतीत होता है कि खेतों में कुछ पारिभाषिक अंतर हैं (कृपया इस उत्तर पर टिप्पणी देखें)। इसलिए, इन अंतरों को बनाने में सावधानी के साथ आगे बढ़ना चाहिए। इसके अलावा, छात्र स्कोर को शायद ही कभी ऐसे कहा जाता है और एक आम तौर पर प्रतिगमन के संदर्भ में 'छात्रों के मूल्यों' को देखता है। @ शेरगियो ने अपने उत्तर में उन प्रकार के छात्र हटाए गए अवशेषों के बारे में विवरण प्रदान किया है।
मुझे इस प्रश्न का उत्तर देने में बहुत देर हो गई है !!। लेकिन इसका जवाब देने का इतना विनम्र प्रयास बहुत सरल भाषा में जवाब नहीं मिला।
हम मानकीकरण क्यों करते हैं? कल्पना कीजिए कि आपके पास दो मॉडल हैं- अध्ययन के आँकड़ों पर बिताए समय की मात्रा से पागलपन की भविष्यवाणी करते हैं जबकि अन्य भविष्यवाणी आँकड़ों पर समय की मात्रा के साथ लॉग (पागलपन) करते हैं।
यह समझना कठिन होगा कि अवशिष्ट दोनों अलग-अलग इकाइयों में हैं। इसलिए हम उन्हें मानकीकृत करते हैं। (जेड-स्कोर के समान सिद्धांत)
मानकीकृत अवशिष्ट: - जब अवशिष्ट को मानक विचलन के अनुमान से विभाजित किया जाता है। सामान्य तौर पर अगर निरपेक्ष मान> 3 तो यह चिंता का कारण है।
हम इसका उपयोग मॉडल में आउटलेर की जांच करने के लिए करते हैं।
छात्र अवशिष्ट: हम मॉडल की स्थिरता का अध्ययन करने के लिए इसका उपयोग करते हैं।
प्रक्रिया सरल है। हम मॉडल से व्यक्तिगत परीक्षण मामले को हटाते हैं और नए अनुमानित मूल्य का पता लगाते हैं। नए मूल्य और मूल मनाया मूल्य के बीच अंतर को मानक त्रुटि को विभाजित करके मानकीकृत किया जा सकता है। यह मान स्टूडेंटाइज्ड रेजिड्यूअल है
अधिक जानकारी के लिए R - http://www.statisticshell.com/html/dsur.html का उपयोग करके स्टैटिक्स की खोज करना
विकिपीडिया पर https://en.wikipedia.org/wiki/Normalization_(statistics) का अच्छा अवलोकन है :
मानक स्कोर : जनसंख्या पैरामीटर ज्ञात होने पर त्रुटियों को सामान्य करना। आम तौर पर वितरित की जाने वाली आबादी के लिए अच्छी तरह से काम करता है
छात्र के टी-स्टेटिस्टिक : जनसंख्या मापदंडों के अज्ञात होने पर (अनुमानित) अवशिष्ट को सामान्य करना।