की स्वतंत्रता की डिग्री


33

के लिए परीक्षण आंकड़ा Hosmer-Lemeshow एक रसद प्रतिगमन मॉडल के फिट (GOF) की भलाई के लिए परीक्षण (HLT) के रूप में परिभाषित किया गया है:

नमूना फिर , में विभाजित होता है , निम्न मात्राओं की गणना करता है:d=10D1,D2,,Dd

  • O1d=iDdyi , यानी दशमक में सकारात्मक मामलों की प्रेक्षित संख्या ;Dd
  • O0d=iDd(1yi) , यानी में नकारात्मक मामलों की संख्या देखी ;Dd
  • E1d=iDdπ^i , यानी दशमक में सकारात्मक मामलों की अनुमानित संख्या Dd ;
  • E0d=iDd(1π^i) , यानी दशमक में नकारात्मक मामलों की अनुमानित संख्या Dd ;

जहां yi के लिए मनाया द्विआधारी परिणाम है i मई के अवलोकन और π^i कि अवलोकन के लिए अनुमानित संभावना।

फिर परीक्षण आँकड़ा को इस प्रकार परिभाषित किया जाता है:

X2=h=01g=1d((OhgEhg)2Ehg)=g=1d(O1gngπ^gng(1π^g)π^g)2,

जहां π^g decile g में औसत अनुमानित संभावना है gऔर ng में कंपनियों की संख्या होने दें ।

Hosmer-Lemeshow के अनुसार (देखें इस लिंक क) यह आँकड़ा है (कुछ मान्यताओं के तहत) χ2 वितरण के साथ (d2) स्वतंत्रता की डिग्री

दूसरी ओर , अगर मैं एक पंक्तियों की तालिका के साथ d पंक्तियों (डिकाइल्स के अनुरूप) और 2 कॉलम (सही / गलत बाइनरी परिणाम के अनुरूप) को परिभाषित करूंगा, तो इस आकस्मिक तालिका के लिए χ2 परीक्षण के लिए परीक्षण-आँकड़ा उपरोक्त के रूप में एक्स ^ 2 के रूप में ही X2है, हालांकि, आकस्मिक तालिका के मामले में, यह परीक्षण आँकड़ा \ (डी -1) (2-1) = डी -1 डिग्री के χ2साथ \ chi ^ 2 है(d1)(21)=d1तो स्वतंत्रता की एक डिग्री अधिक !

स्वतंत्रता की डिग्री की संख्या में इस अंतर को कोई कैसे समझा सकता है?

संपादित करें: टिप्पणी पढ़ने के बाद परिवर्धन:

@whuber

वे कहते हैं (देखें होसमर डीडब्ल्यू, लेमेशो एस। (1980), मल्टीपल लॉजिस्टिक रिग्रेशन मॉडल के लिए एक अच्छाई-से-फिट परीक्षण। सांख्यिकी, ए 10, 1043-1069 में संचार ) जिसमें मूर और स्प्रिल द्वारा प्रदर्शित एक प्रमेय है, जिसमें से। यह निम्नानुसार है कि यदि (1) मापदंडों का आकलन अनियंत्रित डेटा के लिए संभावना कार्यों का उपयोग करके किया जाता है और (2) 2xg तालिका में आवृत्तियां अनुमानित मापदंडों पर निर्भर करती हैं, अर्थात कोशिकाएं यादृच्छिक होती हैं, निश्चित नहीं होती हैं, तब, उपयुक्त नियमितता शर्तों के तहत (1) और (2) के तहत फिट स्टेटिस्टिक की अच्छाई एक केंद्रीय ची-वर्ग की है जो अनुमानित मापदंडों के कारण स्वतंत्रता की डिग्री की सामान्य कमी के साथ-साथ भारित ची-वर्ग चर का योग है।

फिर, अगर मैं उनके पेपर को अच्छी तरह से समझता हूं, तो वे इस 'सुधार शब्द' के लिए एक अनुमान लगाने की कोशिश करते हैं कि, अगर मैं इसे अच्छी तरह से समझता हूं, तो क्या यह ची-स्क्वायर यादृच्छिक चर का भारित योग है, और वे सिमुलेशन बनाकर ऐसा करते हैं, लेकिन मैं स्वीकार करना चाहिए कि मैं पूरी तरह से नहीं समझता कि वे वहां क्या कहते हैं, इसलिए मेरा सवाल; ये कोशिकाएँ यादृच्छिक क्यों हैं, यह स्वतंत्रता की डिग्री को कैसे प्रभावित करती है? क्या यह अलग होगा यदि मैं कोशिकाओं की सीमाओं को ठीक करता हूं और फिर मैं अनुमानित स्कोर के आधार पर निश्चित कोशिकाओं में टिप्पणियों को वर्गीकृत करता हूं, उस स्थिति में कोशिकाएं यादृच्छिक नहीं हैं, हालांकि सेल की 'सामग्री' है?

@ फ्रेंक हरेल: क्या यह नहीं हो सकता है कि होस्मेर-लेमेशो परीक्षण की 'कमी' जिसका उल्लेख आप अपनी टिप्पणियों में करते हैं, क्या ची-वर्गों के भारित योग के अनुमान का परिणाम है ?


9
पुस्तक में इस परीक्षण का विस्तृत विवरण और इसके लिए आधार शामिल है। आपका प्रश्न पूरी तरह से पीपी 145-149 पर उत्तर दिया गया है। परीक्षणों में स्वतंत्रता की डिग्री निर्धारित करना एक सूक्ष्म बात है, क्योंकि इनमें से अधिकांश परीक्षण सन्निकटन (पहली जगह में) हैं और वे सन्निकटन केवल तभी अच्छे होते हैं जब मामूली तकनीकी स्थितियाँ लागू होती हैं। इस सब के बारे में कुछ चर्चा के लिए, आँकड़े देखें ।stackexchange.com/a/17148 । एच एंड एल ने विशुद्ध रूप से व्यावहारिक मार्ग लिया: उन्होंने " सिमुलेशन के व्यापक सेट" पर डीएफ की अपनी सिफारिश को आधार बनाया । χ2d2
whuber

4
इस परीक्षण को अब (1) शक्ति की कमी, (2) निरंतर संभावनाओं का द्वंद्व, और द्विशताब्दी और मनुष्‍य की परिभाषा की पसंद के चयन में मनमानी के कारण अप्रचलित माना जाता है। होस्मर - ले केसी 1 डीएफ परीक्षण या स्पीगेल्टर परीक्षण की सिफारिश की जाती है। उदाहरण के लिए R rmsपैकेज residuals.lrmऔर val.probफ़ंक्शंस देखें।
फ्रैंक हरेल

2
@ फ्रेंक हरल: (ए) यहां तक ​​कि होस्मर-लेमेशो परीक्षण अप्रचलित है, मुझे लगता है कि यह अभी भी दिलचस्प है और साथ अंतर को समझने के लिए (बी) क्या आपके पास एक संदर्भ है जो दिखाता है कि स्पीगलर परीक्षण में अधिक शक्ति है होस्मेर-लेमेशो परीक्षण? χ2

2
मूल प्रश्न की तुलना में ये मुद्दे IMHO बहुत छोटे हैं।
फ्रैंक हरेल

3
मुझे लगता है कि विवरण इस साइट पर कहीं और दिखाई देते हैं। संक्षेप में, (1) होसमर ने दिखाया कि परीक्षा मनमानी है - ठीक उसी तरह से संवेदनशील है जैसे कि डिकाइल्स की गणना कैसे की जाती है; (२) इसमें शक्ति का अभाव है। आप देख सकते हैं कि यह द्विपाद अंशांकन वक्र (एक चिकनी अंशांकन वक्र के विपरीत) और जंपिंग नोट करने के द्वारा अभेद्य मात्रा पर आधारित है। इसके अलावा, यह अत्यधिक ओवरफिटिंग के लिए ठीक से दंडित नहीं करता है।
फ्रैंक हरेल

जवाबों:


2

होसमर डीडब्ल्यू, लेमेशो एस। (1980), कई लॉजिस्टिक रिग्रेशन मॉडल के लिए एक अच्छाई-से-फिट परीक्षण। सांख्यिकी, A10, 1043-1069 में संचार बताते हैं कि:

यदि मॉडल एक लॉजिस्टिक रिग्रेशन मॉडल है और मापदंडों को अधिकतम संभावना द्वारा अनुमानित किया गया है और जी समूह अनुमानित संभावनाओं पर परिभाषित किया गया है, तो यह माना जाता है कि एक्स 2 असमान रूप से χ 2 ( जी - पी - 1 ) + पी + 1 i है। = 1 λ मैं χpGX2 (Hosmer, Lemeshow, 1980, p.1052, प्रमेय 2)।χ2(Gp1)+i=1p+1λiχi2(1)

(नोट: आवश्यक शर्तें थ्योरम 2 में स्पष्ट रूप से पृष्ठ 1052 पर नहीं हैं, लेकिन यदि कोई ध्यानपूर्वक कागज और प्रमाण को पढ़ता है तो ये पॉप अप हो जाते हैं)

दूसरे कार्यकाल के तथ्य यह है कि समूह पर अनुमान आधारित है से परिणाम - यानी यादृच्छिक - मात्रा (Hosmer, Lemeshow, 1980, p.1051)i=1p+1λiχi2(1)

सिमुलेशन का उपयोग करके उन्होंने दिखाया कि दूसरा शब्द ual (सिम्यूलेशन में प्रयुक्त मामलों में) χ द्वारा अनुमानित किया जा सकता है (Hosmer, Lemeshow, 1980, p.1060)χ2(p1)

इन दो तथ्यों के संयोजन से दो चर प्राप्त होते हैं, एक G - p - 1 डिग्री स्वतंत्रता के साथ और दूसरा p - 1 डिग्री स्वतंत्रता या X 2χ 2 ( G - p - 1 +) के साथ।χ2Gp1p1X2χ2(Gp1+p1=G2)

तो सवाल का जवाब 'भारित ची-वर्ग अवधि' की घटना में है या इस तथ्य में है कि समूहों को अनुमानित संभावनाओं का उपयोग करके परिभाषित किया गया है जो स्वयं यादृच्छिक चर हैं।

होस्मेर लेमेशो (1980) पेपर - प्रमेय 2 भी देखें


'इसलिए प्रश्न का उत्तर' भारित ची-वर्ग अवधि 'की घटना में है और इस तथ्य में कि समूह अनुमानित संभावनाओं का उपयोग करके परिभाषित किए गए हैं जो स्वयं यादृच्छिक चर हैं।' ) अनुमानित संभावनाएं बनाती हैं कि आपको पी + 1 की अतिरिक्त कमी मिलती है , जो आकस्मिक तालिका के मामले में मुख्य अंतर बनाती है (जिसमें केवल जी शब्दों का अनुमान है)। बी ) भारित ची-वर्ग शब्द एक सुधार के रूप में होता है क्योंकि अनुमान संभावना अनुमान या समान रूप से कुशल नहीं है, और यह बनाता है कि कमी का प्रभाव (पी + 1) की तुलना में कम अतिरिक्त है।
सेक्सस एम्पिरिकस

@Martijn वेटरिंग्स: क्या मैं सही हूं अगर मैं यह निष्कर्ष निकालता हूं कि आप इस टिप्पणी में जो कहते हैं, वह बिल्कुल वैसा ही स्पष्टीकरण नहीं है (पूरी तरह से अलग कहने के लिए) जैसा कि आप अपने जवाब में कहते हैं? क्या आपकी टिप्पणी से निष्कर्ष निकलता है कि df ? G2

मेरा उत्तर इस आकस्मिक तालिका के लिए " टेस्ट-स्टेटिस्टिक फॉर द टेस्ट " पर आधारित तर्क की तुलना में स्वतंत्रता की डिग्री में अंतर के पीछे के अंतर्ज्ञान को बताता है, यह बताता है कि वे अलग-अलग क्यों हैं (मामला निश्चित कोशिकाओं का आकलन कर रहा है)। यह 'सामान्य कमी' पर केंद्रित है जिसमें से आप निष्कर्ष निकालेंगे कि df G-3 होगा। हालांकि, 'सामान्य कमी' के लिए कुछ शर्तों को पूरा नहीं किया गया है। इस कारण से (रैंडम सेल) आपको भारित ची-वर्ग शब्द के साथ एक सुधार के रूप में अधिक जटिल शब्द मिलते हैं और आप प्रभावी रूप से जी -2 के साथ समाप्त होते हैं। यह पूरी तरह से अलग है। χ2
सेक्सस एम्पिरिकस

@ मार्टिज़न वेटरिंग्स, क्षमा करें, लेकिन मैं अपवोट नहीं कर सकता क्योंकि मुझे आपके जवाब में 'रैंडम सेल' जैसी कोई धारणा दिखाई नहीं देती, क्या आपका मतलब है कि आपकी अच्छी तस्वीरें (और मेरा मतलब है, वे बहुत अच्छी हैं) 'यादृच्छिक कोशिकाओं' के बारे में कुछ या आप मेरे उत्तर को पढ़ने के बाद उस धारणा के साथ आए थे?

क्षमा न करें। मैं इस बात से सहमत हूं कि मेरा जवाब एचएल परीक्षण में स्वतंत्रता की डिग्री दिखाने के लिए सटीक उत्तर नहीं है। मुझे इसके लिए खेद है। क्या आपके पास Chernoff लीमैन आंकड़ा (यह भी यादृच्छिक कोशिकाओं के साथ) है कि एक इस प्रकार है i=1ks1χ2(1)+i=ksk1λiχi2(1)वितरण। यह वर्तमान में मेरे लिए स्पष्ट नहीं है कि कौन सा हिस्सा आपको परेशान कर रहा है, मुझे उम्मीद है कि आप इसमें अधिक रचनात्मक हो सकते हैं। यदि आप चाहते हैं कि सभी समझाया जाए, तो आपके पास उसके लिए पहले से ही लेख हैं। मेरा जवाब सिर्फ घेरने की कोशिश की आकस्मिकता तालिका परीक्षण के लिए मुख्य अंतर समझा। i=1ks1χ2(1)
सेक्सटस एम्पिरिकस

2

प्रमेय जिसे आप संदर्भित करते हैं (सामान्य पैरामीटर "अनुमानित मापदंडों के कारण स्वतंत्रता की डिग्री की सामान्य कमी") ज्यादातर आरए फिशर द्वारा वकालत की गई है। 'आकस्मिकता तालिकाओं से ची स्क्वायर की व्याख्या, और पी की गणना' (1922) में उन्होंने नियम और 'प्रतिगमन स्रोतों के फिट होने की भलाई' का उपयोग करने का तर्क दिया ( 1922) वह डेटा से अपेक्षित मूल्यों को प्राप्त करने के लिए प्रतिगमन में उपयोग किए जाने वाले मापदंडों की संख्या से स्वतंत्रता की डिग्री को कम करने का तर्क देता है। (यह ध्यान रखना दिलचस्प है कि लोगों ने ची-स्क्वायर परीक्षण का दुरुपयोग किया, स्वतंत्रता की गलत डिग्री के साथ, बीस से अधिक वर्षों के लिए, क्योंकि यह 1900 में शुरू हुआ है)(R1)(C1)

आपका मामला दूसरी तरह का है (प्रतिगमन) और पूर्व प्रकार (आकस्मिक तालिका) का नहीं, हालांकि दोनों इस बात से संबंधित हैं कि वे मापदंडों पर रैखिक प्रतिबंध हैं।

चूँकि आप अपने देखे गए मूल्यों के आधार पर अपेक्षित मूल्यों को मॉडल करते हैं, और आप ऐसा मॉडल करते हैं जिसमें दो पैरामीटर होते हैं, स्वतंत्रता की डिग्री में 'सामान्य' कमी दो से एक होती है (अतिरिक्त एक क्योंकि O_i को योग करने की आवश्यकता होती है कुल, जो एक और रैखिक प्रतिबंध है, और आप दो की कमी के साथ प्रभावी ढंग से समाप्त होते हैं, तीन के बजाय, मॉडल किए गए अपेक्षित मूल्यों की 'दक्षता' के कारण)।


ची-वर्ग परीक्षण एक का उपयोग करता है एक दूरी उपाय के रूप में व्यक्त करने के लिए कितने करीब एक परिणाम की उम्मीद डेटा है। ची-स्क्वायर परीक्षणों के कई संस्करणों में इस 'दूरी' का वितरण सामान्य वितरित चर में विचलन के योग से संबंधित है (जो केवल सीमा में सच है और एक अनुमान है यदि आप गैर-सामान्य वितरित डेटा के साथ सौदा करते हैं) ।χ2

मल्टीवेरिएट सामान्य वितरण के लिए घनत्व समारोह से संबंधित है χ2 से

f(x1,...,xk)=e12χ2(2π)k|Σ|

के साथ एक्स के सहसंयोजक मैट्रिक्स के निर्धारक|Σ|x

और है महालनोबिस दूरी जो अगर Euclidian दूरी को कम कर देता Σ = मैंχ2=(xμ)TΣ1(xμ)Σ=I

उसकी 1900 लेख में पीयरसन ने तर्क दिया कि -levels spheroids कर रहे हैं और वह क्रम में इस तरह के रूप एक मूल्य के एकीकृत करने के लिए गोलाकार निर्देशांक को बदल सकता है कि पी ( χ 2 > एक )χ2P(χ2>a) । जो एकल अभिन्न हो जाता है।


यह यह ज्यामितीय प्रतिनिधित्व है, χ2 एक दूरी है और यह भी घनत्व समारोह में एक शब्द, कि कर सकते हैं स्वतंत्रता की डिग्री की कमी को समझने के लिए जब रैखिक प्रतिबंध मौजूद हैं मदद के रूप में।

सबसे पहले एक 2x2 आकस्मिक तालिका का मामला । आपको ध्यान देना चाहिए कि चार मान OiEiEi नहीं कर रहे हैं चार स्वतंत्र सामान्य वितरित चर। वे इसके बजाय एक दूसरे से संबंधित हैं और एक एकल चर के लिए उबलते हैं।

चलो तालिका का उपयोग करें

Oij=o11o12o21o22

फिर यदि अपेक्षित मान

Eij=e11e12e21e22

जहां तय तो स्वतंत्रता के चार डिग्री के साथ एक ची-वर्ग वितरण के रूप में वितरित किया जाएगा, लेकिन अक्सर हम अनुमानमैंजेके आधार परमैंjऔर विभिन्नता चार तरह नहीं स्वतंत्र चरों है। इसके बजाय हम पाते हैं किऔरई केबीच सभी अंतरसमान हैंoijeijeijeijoijoe

(o11e11)=(o22e22)=(o21e21)=(o12e12)=o11(o11+o12)(o11+o21)(o11+o12+o21+o22)

और वे प्रभावी रूप से चार के बजाय एक एकल चर हैं। ज्यामितीय रूप से आप इसे r 2 के रूप में देख सकते हैंχ2 मान के एक चार आयामी क्षेत्र पर नहीं बल्कि एक पंक्ति में एकीकृत है।

ध्यान दें कि यह आकस्मिक तालिका परीक्षण होसमेर-लेमेशो परीक्षण में आकस्मिक तालिका के लिए मामला नहीं है (यह एक अलग अशांति की परिकल्पना का उपयोग करता है!)। यह भी देखें अनुभाग 2.1 'मामला है जब और β _ जाना जाता है' Hosmer और Lemshow के लेख में। उनके मामले में आपको 2 जी -1 डिग्री की स्वतंत्रता मिलती है और जी -1 की स्वतंत्रता की डिग्री (आर -1) (सी -1) नियम के अनुसार नहीं। यह (आर 1) (सी -1) नियम विशेष रूप से है कि पंक्ति और स्तंभ चर स्वतंत्र हैं (जिस पर आर + सी -1 की कमी पैदा करता है शून्य परिकल्पना के लिए मामला है मैं - मैंβ0β_oieiमान)। Hosmer-Lemeshow परीक्षण परिकल्पना से संबंधित है कि कोशिकाओं एक रसद प्रतिगमन मॉडल की संभावनाओं पर आधारित के अनुसार भर रहे हैं वितरणात्मक धारणा ए और के मामले में मानकों पी + 1 वितरणात्मक धारणा बी के मामले में मानकोंfourp+1

दूसरा एक प्रतिगमन का मामला। एक प्रतिगमन अंतर करने के लिए कुछ ऐसा ही आकस्मिकता तालिका के रूप में और विभिन्नता के आयामी स्वरूप कम करता है। वहाँ मूल्य के रूप में इस के लिए एक अच्छी ज्यामितीय प्रतिनिधित्व है y मैं एक मॉडल अवधि की राशि के रूप में प्रतिनिधित्व किया जा सकता है β x मैं और एक अवशिष्ट (नहीं त्रुटि) शर्तों ε मैं । ये मॉडल शब्द और अवशिष्ट शब्द प्रत्येक एक आयामी स्थान का प्रतिनिधित्व करते हैं जो एक दूसरे के लंबवत है। मतलब यह है कि अवशिष्ट मामले ε मैंoeyiβxiϵiϵiकोई संभावित मूल्य नहीं ले सकता है! अर्थात् वे उस हिस्से से कम हो जाते हैं जो मॉडल पर प्रोजेक्ट करता है, और मॉडल में प्रत्येक पैरामीटर के लिए अधिक विशेष 1 आयाम है।


हो सकता है कि निम्नलिखित चित्र थोड़ा मदद कर सकते हैं

B(n=60,p=1/6,2/6,3/6)N(μ=np,σ2=np(1p))χ2=1,2,6χ0ae12χ2χd1dχ in which this χd1 part represents the area of the d-dimensional sphere. If we would limit the variables χ in some way than the integration would not be over a d-dimensional sphere but something of lower dimension.

graphical representation of chi^2

The image below can be used to get an idea of the dimensional reduction in the residual terms. It explains the least squares fitting method in geometric term.

In blue you have measurements. In red you have what the model allows. The measurement is often not exactly equal to the model and has some deviation. You can regard this, geometrically, as the distance from the measured point to the red surface.

The red arrows mu1 and mu2 have values (1,1,1) and (0,1,2) and could be related to some linear model as x = a + b * z + error or

[x1x2x3]=a[111]+b[012]+[ϵ1ϵ2ϵ3]

so the span of those two vectors (1,1,1) and (0,1,2) (the red plane) are the values for x that are possible in the regression model and ϵ is a vector that is the difference between the observed value and the regression/modeled value. In the least squares method this vector is perpendicular (least distance is least sum of squares) to the red surface (and the modeled value is the projection of the observed value onto the red surface).

So this difference between observed and (modelled) expected is a sum of vectors that are perpendicular to the model vector (and this space has dimension of the total space minus the number of model vectors).

In our simple example case. The total dimension is 3. The model has 2 dimensions. And the error has a dimension 1 (so no matter which of those blue points you take, the green arrows show a single example, the error terms have always the same ratio, follow a single vector).

graphical representation of regression dimension reduction


I hope this explanation helps. It is in no way a rigorous proof and there are some special algebraic tricks that need to be solved in these geometric representations. But anyway I like these two geometrical representations. The one for the trick of Pearson to integrate the χ2 by using the spherical coordinates, and the other for viewing the sum of least squares method as a projection onto a plane (or larger span).

I am always amazed how we end up with oee, this is in my point of view not trivial since the normal approximation of a binomial is not a devision by e but by np(1p) and in the case of contingency tables you can work it out easily but in the case of the regression or other linear restrictions it does not work out so easily while the literature is often very easy in arguing that 'it works out the same for other linear restrictions'. (An interesting example of the problem. If you performe the following test multiple times 'throw 2 times 10 times a coin and only register the cases in which the sum is 10' then you do not get the typical chi-square distribution for this "simple" linear restriction)


2
In my honest opinion this answer has very nice figures and arguments that are related to χ2 test but it has not so much to do with the question which is about the Hosmer-Lemeshow test for a logistic regression. You are arguing something with a regression where 1 parameters is estimated but the Hosmer-Lemeshow test is about a logistic regression where p>1 parameters are estimated. See also stats.stackexchange.com/questions/296312/…

... and, as you say, you end up with an e in the denominator and not with a np(1p) , so this does not answer this question. Hence I have to downvote, sorry (but the graphs are very nice :-) ).

You were asking in a comment for "to understand the formula or at least the 'intuitive' explanation". So that is what you get with these geometrical interpretations. To calculate exactly how these np(1p) cancel out if you add both the positive and negative cases is far from intuitive and does not help you understand the dimensions.
Sextus Empiricus

In my answer I used the typical (d1p) degrees of freedom and assumed that the regression was performed with one parameter (p=1), which was a mistake. The parameters in your references are two, a β0 and β. These two parameters would have reduced the dimensionality to d-3 if only the proper conditions (efficient estimate) would have been met (see for instance again a nice article from Fisher 'The conditions under which the chi square measures the discrepancy between observation and hypothesis')....
Sextus Empiricus

....anyway, I explained why we don't get dimension d-1 (and should instead expect something like d-3, if you put two parameters in the regression) and how the dimensional reduction by an efficient estimate can be imagined. It is the Moore-Spruill article that works out the extra terms (potentially increasing the effective degrees of freedom) due to that inefficiency and it is the Hosmer-Lemeshow simulation that shows that d-2 works best. That theoretical work is far from intuitive and the simulation is far from exact. My answer is just the requested explanation for the difference with d-1.
Sextus Empiricus
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.