स्वतंत्रता की डिग्री कई संदर्भों में गैर-पूर्णांक हैं। वास्तव में कुछ परिस्थितियों में आप यह स्थापित कर सकते हैं कि कुछ विशेष मॉडलों के लिए डेटा फिट करने की स्वतंत्रता की डिग्री कुछ मूल्य और बीच होनी चाहिए ।kk+1
हम आमतौर पर स्वतंत्रता की डिग्री को मुक्त मापदंडों की संख्या के रूप में सोचते हैं, लेकिन ऐसी परिस्थितियां हैं जहां पैरामीटर पूरी तरह से मुक्त नहीं हैं और फिर उन्हें गिनना मुश्किल हो सकता है। यह तब हो सकता है जब उदाहरण के लिए स्मूथिंग / नियमित करना।
स्थानीय रूप से भारित प्रतिगमन / कर्नेल विधियों के एक चौरसाई विभाजन के मामले ऐसी स्थिति के उदाहरण हैं - कुल मुक्त मापदंडों की संख्या कुछ ऐसी नहीं है जिसे आप भविष्यवाणियों को जोड़कर आसानी से गिन सकते हैं, इसलिए स्वतंत्रता की डिग्री के एक अधिक सामान्य विचार की आवश्यकता है।
में सामान्यीकृत Additive मॉडल जिस पर gam
आंशिक रूप से आधारित है, Hastie और Tibshirani (1990) [1] (और वास्तव में कई अन्य संदर्भ में) कुछ मॉडलों जहां हम लिख सकते हैं के लिए , स्वतंत्रता की डिग्री कभी कभी होने के लिए लिया जाता है (वे भी या चर्चा करते हैं )। पहला अधिक सामान्य दृष्टिकोण के अनुरूप है जहां दोनों काम करते हैं (उदाहरण के लिए, प्रतिगमन में, जहां सामान्य स्थितियों में का स्तंभ आयाम होगा ), लेकिन जब सममित और निष्क्रिय है, उन तीनों सूत्र समान हैं।y^=Aytr(A)tr(AAT)tr(2A−AAT)tr(A)XA
[मेरे पास इस संदर्भ को पर्याप्त विवरणों की जांच करने के लिए आसान नहीं है; एक ही लेखक (प्लस फ्राइडमैन) द्वारा वैकल्पिक रूप से पकड़ना आसान है, तत्वों के सांख्यिकीय सीखना [2]; उदाहरण के समीकरण 5.16 के लिए देखें, जो एक चिकने तख़्ते की स्वतंत्रता के प्रभावी अंशों को (मेरे संकेतन में) के रूप में परिभाषित करता है ]tr(A)
अधिक आम तौर पर अभी भी, ये (1998) [3] ने स्वतंत्रता की सामान्यीकृत डिग्री को किया है, जो कि उनके संबंधित टिप्पणियों के लिए फिट किए गए मूल्यों की संवेदनशीलता का योग है। बदले में, यह साथ संगत है जहां यह परिभाषा काम करती है। ये की परिभाषा का उपयोग करने के लिए आपको केवल गणना करने में सक्षम होना चाहिए और डेटा को कुछ छोटी राशि से कम करना होगा (क्रम में संख्यात्मक रूप से)। यह इसे बहुत व्यापक रूप से लागू करता है।∑i∂y^i∂yitr(A)y^∂y^i∂yi
द्वारा फिट किए गए जैसे मॉडल के लिए gam
, वे विभिन्न उपाय आम तौर पर पूर्णांक नहीं होते हैं।
(मैं इस मुद्दे पर इन संदर्भों की चर्चा को पढ़ने की अत्यधिक सलाह देता हूं, हालांकि कहानी कुछ स्थितियों में अधिक जटिल हो सकती है। उदाहरण के लिए देखें। (4)
[१] हस्ती, टी। और टिब्शिरानी, आर। (१ ९९ ०),
सामान्यीकृत एडिटिव मॉडल्स
लंदन: चैपमैन एंड हॉल।
[२] हस्ति, टी।, तिब्शीरानी, आर। और फ्रीडमैन, जे। (२०० ९),
द एलिमेंट्स ऑफ़ स्टैटिस्टिकल लर्निंग: डेटा माइनिंग , इनविज़न , एंड प्रेडिक्शन , २ इएड
स्प्रिंगर-वेरलाग।
https://statweb.stanford.edu/~tibs/ElemStatLearn/
[३] ये, जे। (१ ९९,),
"डेटा माइनिंग एंड मॉडल सलेक्शन के प्रभावों को मापने और ठीक करने पर"
जर्नल ऑफ़ द अमेरिकन स्टैटिस्टिकल एसोसिएशन , वॉल्यूम। 93, नंबर 441, पीपी 120-131
[४] जानसन, एल।, फिथियन, डब्ल्यू।, और हस्ति, टी। (२०१३),
"फ्रीडम के प्रभावी डिग्रियाँ: ए फ्लैव्ड मेटाफ़ोर"
https://arxiv.org/abs/1312.7851