"संतृप्त" मॉडल क्या है?


जवाबों:


36

एक संतृप्त मॉडल वह है जिसमें डेटा बिंदुओं के रूप में कई अनुमानित पैरामीटर हैं। परिभाषा के अनुसार, यह एक सही फिट को जन्म देगा, लेकिन सांख्यिकीय रूप से बहुत कम उपयोग होगा, क्योंकि आपके पास विचरण का अनुमान लगाने के लिए कोई डेटा नहीं बचा है।

उदाहरण के लिए, यदि आपके पास 6 डेटा बिंदु हैं और डेटा के लिए 5-क्रम बहुपद फिट है, तो आपके पास एक संतृप्त मॉडल होगा (आपके स्वतंत्र चर के 5 शक्तियों में से प्रत्येक के लिए एक पैरामीटर और निरंतर अवधि के लिए एक)।


17
मैंने ऐसे उदाहरण देखे जहां एक मॉडल में दस डेटा पॉइंट और नौ पैरामीटर होते हैं। यह इंगित करने पर कि मॉडल में बहुत अधिक पैरामीटर हैं, मुझे बताया गया था कि R ^ 2 0.999 था इसलिए मॉडल सही होना चाहिए!
csgillespie

4
जैसा कि मेरे और डेव के पोस्ट में पढ़ा जा सकता है, संतृप्त मॉडल सही परिभाषा के अनुसार प्रति फिट नहीं होते हैं। लेकिन अगर आप मॉडल के रूप में n-1 बहुपद का उपयोग करते हैं। इस विषय पर Sue Doe Nihm का सेमिनल
हेनरिक

24

एक संतृप्त मॉडल एक ऐसा मॉडल है जो इस बिंदु पर अधिक है कि यह मूल रूप से केवल डेटा को प्रक्षेपित कर रहा है। कुछ सेटिंग्स में, जैसे कि छवि संपीड़न और पुनर्निर्माण, यह जरूरी नहीं कि एक बुरी बात है, लेकिन यदि आप एक पूर्वानुमान मॉडल का निर्माण करने की कोशिश कर रहे हैं तो यह बहुत समस्याग्रस्त है।

संक्षेप में, संतृप्त मॉडल अत्यंत उच्च-भिन्न भविष्यवाणियों की ओर ले जाते हैं जिन्हें वास्तविक डेटा से अधिक शोर द्वारा चारों ओर धकेला जा रहा है।

एक सोचा प्रयोग के रूप में, कल्पना कीजिए कि आपको संतृप्त मॉडल मिला है, और डेटा में शोर है, फिर मॉडल को कुछ सौ बार फिट करने की कल्पना करें, हर बार शोर के एक अलग अहसास के साथ, और फिर एक नए बिंदु की भविष्यवाणी करें। आपके फिट और आपकी भविष्यवाणी (और बहुपद मॉडल विशेष रूप से इस संबंध में बहुत अच्छे हैं) के लिए, आपको हर बार मौलिक रूप से अलग-अलग परिणाम प्राप्त होने की संभावना है; दूसरे शब्दों में फिट और भविष्यवक्ता का विचरण बहुत अधिक है।

इसके विपरीत एक मॉडल जो संतृप्त नहीं है (यदि यथोचित रूप से निर्मित किया गया है) फिट बैठता है जो अलग-अलग शोर के एहसास के तहत एक-दूसरे के साथ अधिक सुसंगत हैं, और भविष्यवक्ता का विचरण भी कम हो जाएगा।


17

एक मॉडल को संतृप्त किया जाता है यदि और केवल तभी जब उसके पास कई पैरामीटर हों क्योंकि इसमें डेटा बिंदु (अवलोकन) होते हैं। या अन्यथा, गैर-संतृप्त मॉडल में स्वतंत्रता की डिग्री शून्य से बड़ी है।

इसका मूल रूप से मतलब है कि यह मॉडल बेकार है, क्योंकि यह कच्चे डेटा की तुलना में डेटा को अधिक पार्सिमेंटली नहीं बताता है (और डेटा को परमानेंटली वर्णन करना आमतौर पर मॉडल का उपयोग करने के पीछे का विचार है)। इसके अलावा, संतृप्त मॉडल (लेकिन जरूरी नहीं) एक (बेकार) सही फिट प्रदान कर सकते हैं क्योंकि वे डेटा को केवल प्रक्षेपित या प्रसारित करते हैं।

उदाहरण के लिए कुछ डेटा के लिए एक मॉडल के रूप में माध्य लें। यदि आपके पास माध्य (यानी, 5) का उपयोग करके केवल एक डेटा बिंदु है (जैसे, 5; ध्यान दें कि माध्य केवल एक डेटा बिंदु के लिए संतृप्त मॉडल है) बिल्कुल मदद नहीं करता है। हालाँकि, यदि आपके पास पहले से ही माध्य (यानी, 6) का उपयोग करके दो डेटा पॉइंट (जैसे, 5 और 7) हैं, तो एक मॉडल आपको मूल डेटा की तुलना में अधिक पारिश्रमिक विवरण प्रदान करता है।


8
सही फिट न बैठाने के बारे में यह बात इस धागे का सबसे दिलचस्प हिस्सा है। ऐसी स्थिति का एक प्राकृतिक उदाहरण एकरस प्रतिगमन होगा । मान लीजिए, उदाहरण के लिए, आप जानते हैं कि आपके मूल्यों में समय के साथ वृद्धि होनी चाहिए और आप बहुपद प्रतिगमन करते हैं, जिससे बहुपद के बढ़ने की संभावना बढ़ती है। उन आंकड़ों पर विचार करें जिनमें कुछ त्रुटि है, इसलिए कुछ समय में वे थोड़ा कम हो जाते हैं। फिर कोई फर्क नहीं पड़ता कि आप कितने मापदंडों का उपयोग करते हैं (भले ही यह डेटा मानों की संख्या से अधिक हो), आप इन आंकड़ों को पूरी तरह से फिट नहीं करेंगे।
whuber

17

जैसा कि बाकी सभी ने पहले कहा था, इसका मतलब है कि आपके पास जितने पैरामीटर हैं, आपके डेटा बिंदु हैं। तो, फिट परीक्षण की कोई अच्छाई नहीं है। लेकिन इसका मतलब यह नहीं है कि "परिभाषा के अनुसार", मॉडल किसी भी डेटा बिंदु को पूरी तरह से फिट कर सकता है। मैं आपको कुछ संतृप्त मॉडल के साथ काम करने के व्यक्तिगत अनुभव से बता सकता हूं जो विशिष्ट डेटा बिंदुओं की भविष्यवाणी नहीं कर सकता था। यह काफी दुर्लभ है, लेकिन संभव है।

एक और महत्वपूर्ण मुद्दा यह है कि संतृप्त का मतलब बेकार नहीं है। उदाहरण के लिए, मानव अनुभूति के गणितीय मॉडल में, मॉडल पैरामीटर विशिष्ट संज्ञानात्मक प्रक्रियाओं से जुड़े होते हैं जिनकी सैद्धांतिक पृष्ठभूमि होती है। यदि कोई मॉडल संतृप्त है, तो आप केवल हेरफेर के साथ केंद्रित प्रयोगों को करके इसकी पर्याप्तता का परीक्षण कर सकते हैं जो केवल विशिष्ट मापदंडों को प्रभावित करना चाहिए। यदि सैद्धांतिक अनुमान पैरामीटर के अनुमानों में देखे गए अंतर (या कमी) से मेल खाते हैं, तो कोई कह सकता है कि मॉडल वैध है।

एक उदाहरण: उदाहरण के लिए कल्पना कीजिए कि दो मॉडल हैं जिनमें दो सेट पैरामीटर हैं, एक संज्ञानात्मक प्रसंस्करण के लिए और दूसरा मोटर प्रतिक्रियाओं के लिए। अब कल्पना कीजिए कि आपके पास दो स्थितियों के साथ एक प्रयोग है, जिसमें एक प्रतिभागी की प्रतिक्रिया की क्षमता क्षीण है (वे केवल दो के बजाय एक हाथ का उपयोग कर सकते हैं), और दूसरी स्थिति में कोई हानि नहीं है। यदि मॉडल वैध है, तो दोनों स्थितियों के लिए पैरामीटर अनुमानों में अंतर केवल मोटर प्रतिक्रिया मापदंडों के लिए होना चाहिए।

इसके अलावा, ध्यान रखें कि यदि कोई मॉडल गैर-संतृप्त है, तो भी यह गैर-पहचान योग्य हो सकता है, जिसका अर्थ है कि पैरामीटर मानों के विभिन्न संयोजन एक ही परिणाम उत्पन्न करते हैं, जो किसी भी मॉडल को फिट करने के लिए समझौता करता है।

यदि आप सामान्य रूप से इन मुद्दों पर अधिक जानकारी प्राप्त करना चाहते हैं, तो आप इन पत्रों को देख सकते हैं:

बंबर, डी।, और वैन सेंटेन, जेपीएच (1985)। एक मॉडल में कितने पैरामीटर हो सकते हैं और अभी भी परीक्षण योग्य हो सकते हैं? जर्नल ऑफ़ मैथमेटिकल साइकोलॉजी, 29, 443-473।

बंबर, डी।, और वैन सेंटेन, जेपीएच (2000)। कैसे एक मॉडल की परख और पहचान की क्षमता का आकलन करने के लिए। जर्नल ऑफ़ मैथमेटिकल साइकोलॉजी, 44, 20-40।

चियर्स


3

यह भी उपयोगी है अगर आपको एआईएस को क्वैसी-लाइक मॉडल के लिए गणना करने की आवश्यकता है। फैलाव का अनुमान संतृप्त मॉडल से आना चाहिए। आप एलआईसी को विभाजित करेंगे जिसे आप एआईसी गणना में संतृप्त मॉडल से अनुमानित फैलाव द्वारा फिटिंग कर रहे हैं।


2

एसईएम (या पथ विश्लेषण) के संदर्भ में, एक संतृप्त मॉडल या एक उचित पहचान वाला मॉडल एक ऐसा मॉडल है जिसमें मुक्त मापदंडों की संख्या बिल्कुल भिन्न और अद्वितीय सहसंबंधों की संख्या के बराबर होती है। उदाहरण के लिए निम्नलिखित मॉडल एक संतृप्त मॉडल है क्योंकि 3 * 4/2 डेटा पॉइंट (भिन्न और विशिष्ट सहसंयोजक) हैं और 6 मुक्त मापदंडों का अनुमान लगाया जाना है:

एक संतृप्त मॉडल

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.