क्या मिश्रित मॉडल भविष्य कहनेवाला मॉडल के रूप में उपयोगी हैं?


24

मैं भविष्यवाणी मॉडलिंग के संबंध में मिश्रित मॉडल के लाभों के बारे में थोड़ा भ्रमित हूं। चूंकि पूर्वानुमान मॉडल आमतौर पर पहले अज्ञात टिप्पणियों के मूल्यों की भविष्यवाणी करने के लिए होते हैं, तो यह मुझे स्पष्ट लगता है कि मिश्रित मॉडल का एकमात्र तरीका उपयोगी हो सकता है, जो आबादी-स्तर की भविष्यवाणियां प्रदान करने की क्षमता के माध्यम से होता है (जो बिना किसी यादृच्छिक प्रभाव को जोड़े)। हालाँकि, समस्या यह है कि अब तक मेरे अनुभव में मिश्रित मॉडल पर आधारित जनसंख्या-स्तर की भविष्यवाणियां केवल निर्धारित प्रभावों के साथ मानक प्रतिगमन मॉडल पर आधारित भविष्यवाणियों की तुलना में काफी खराब हैं।

तो भविष्यवाणी समस्याओं के संबंध में मिश्रित मॉडल का क्या मतलब है?

संपादित करें। समस्या निम्नलिखित है: मैंने एक मिश्रित मॉडल (फिक्स्ड और रैंडम इफेक्ट्स दोनों के साथ) फिट किया है और स्टैण्डर्ड लीनियर मॉडल केवल फिक्स्ड इफेक्ट्स के साथ। जब मैं क्रॉस-वैलिडेशन करता हूं तो मुझे भविष्यवाणिय सटीकता का एक निम्न पदानुक्रम मिलता है: 1) फिक्स्ड और रैंडम इफेक्ट्स का उपयोग करते समय मिश्रित मॉडल (लेकिन यह केवल रैंडम इफेक्ट चर के ज्ञात स्तरों के साथ टिप्पणियों के लिए काम करता है, इसलिए यह भविष्य कहनेवाला दृष्टिकोण नहीं है वास्तविक भविष्य कहनेवाला अनुप्रयोगों के लिए उपयुक्त हो!); 2) मानक रैखिक मॉडल; 3) मिश्रित मॉडल जब जनसंख्या-स्तर की भविष्यवाणियों का उपयोग किया जाता है (इसलिए यादृच्छिक प्रभावों के साथ)। इस प्रकार, मानक रैखिक मॉडल और मिश्रित मॉडल के बीच एकमात्र अंतर कुछ अलग-अलग आकलन विधियों के कारण गुणांक के भिन्न मूल्य हैं (अर्थात दोनों मॉडल में समान प्रभाव / भविष्यवाणियां हैं, लेकिन उनके अलग-अलग गुणांक हैं)।

तो मेरा भ्रम एक प्रश्न पर उबलता है, मैं कभी भी एक मिश्रित मॉडल का उपयोग भविष्य कहनेवाला मॉडल के रूप में करूंगा, क्योंकि मिश्रित मॉडल का उपयोग जनसंख्या-स्तर की भविष्यवाणियों को उत्पन्न करने के लिए एक मानक रैखिक मॉडल की तुलना में एक अवर रणनीति प्रतीत होती है।


आप अपनी भविष्यवाणी कैसे कर रहे हैं? क्या आप यादृच्छिक प्रभावों का उपयोग नहीं कर रहे हैं या आप उनके माध्यम से अपने यादृच्छिक प्रभावों को ठीक कर रहे हैं? (यानी आप भविष्यवाणी के समय यादृच्छिक प्रभाव निकाल रहे हैं?)
वेन

जहां तक ​​मैं यादृच्छिक प्रभावों को सही ढंग से समझता हूं, उनके साधनों पर यादृच्छिक प्रभावों को ठीक करना उन्हें बाहर फेंकने के समान है, क्योंकि यादृच्छिक प्रभाव (कम से कम पैरामीरीज़ेशन में मैं उपयोग करता हूं) का मतलब 0 और विचरण सिग्मा के सामान्य वितरण से उत्पन्न होता है। लेकिन वैसे भी, जब से मुझे नई टिप्पणियों के लिए यादृच्छिक प्रभावों के चर का मूल्य नहीं पता है, तो मैं निश्चित रूप से भविष्यवाणी के समय यादृच्छिक प्रभावों का उपयोग नहीं करता हूं, केवल निश्चित प्रभाव।
पीसीसी

1
आप इस पत्र के माध्यम से देखना चाह सकते हैं, " लॉन्गिट्यूडिनल
जॉन

1
sztal: तुम बिल्कुल सही हो। मैं जल्दी से जवाब देने की कोशिश कर रहा था और कहा कि कुछ सार्थक नहीं है। मुझे पेपर ( gllamm.org/JRSSApredict_09.pdf ) मिला, जो धारा 7 में भविष्यवाणी को संबोधित करता है। मेरा कहना है कि मैं इसे एक टिप्पणी के लिए संक्षेप में प्रस्तुत नहीं कर सकता, जो इंगित करता है कि मैं वास्तव में इसे नहीं समझता।
वेन

एक आखिरी सवाल: जब आप फिक्स्ड-इफेक्ट्स की तुलना केवल मिश्रित प्रभावों से करते हैं, तो क्या आप प्रत्येक में समान फिक्स्ड इफेक्ट्स का उपयोग कर रहे हैं, केवल एक व्यक्तिगत-स्तर अवरोधन जैसी चीज के अलावा? ऐसा लगता है कि इस स्थिति में, आपको अपने वास्तविक पूर्वानुमान के बेहतर विचार के अलावा, बहुत ही समान प्रभाव होना चाहिए।
वेन

जवाबों:


17

यह डेटा की प्रकृति पर निर्भर करता है, लेकिन सामान्य तौर पर मैं मिश्रित मॉडल को केवल निर्धारित प्रभाव से बेहतर प्रदर्शन की उम्मीद करूंगा।

आइए एक उदाहरण लेते हैं: धूप और गेहूं के डंठल की ऊंचाई के बीच के संबंध को मॉडलिंग करना। हमारे पास व्यक्तिगत डंठल के माप की एक संख्या है, लेकिन कई डंठल एक ही साइटों पर मापे जाते हैं (जो मिट्टी, पानी और अन्य चीजों में समान हैं जो ऊंचाई को प्रभावित कर सकते हैं)। यहां कुछ संभावित मॉडल दिए गए हैं:

1) ऊँचाई ~ धूप

2) ऊंचाई ~ धूप + साइट

3) ऊंचाई ~ धूप + (1 | साइट)

हम इन मॉडलों का उपयोग नए गेहूं के डंठल की ऊंचाई का अनुमान लगाने के लिए करना चाहते हैं, जो कि धूप का अनुभव होगा। मैं उस पैरामीटर पेनल्टी को नज़रअंदाज़ करने जा रहा हूँ जिसे आप केवल निश्चित मॉडल में कई साइटों के लिए भुगतान करेंगे, और केवल मॉडल की सापेक्ष भविष्य कहनेवाला शक्ति पर विचार करें।

यहां सबसे प्रासंगिक सवाल यह है कि क्या आप अनुमान लगाने की कोशिश कर रहे ये नए डेटा पॉइंट आपके द्वारा मापी गई साइटों में से एक हैं; आप कहते हैं कि यह वास्तविक दुनिया में दुर्लभ है, लेकिन ऐसा होता है।

A) नया डेटा आपके द्वारा मापी गई साइट से है

यदि हां, तो मॉडल # 2 और # 3 # 1 से बेहतर प्रदर्शन करेंगे। वे दोनों पूर्वानुमान बनाने के लिए अधिक प्रासंगिक जानकारी (मतलब साइट प्रभाव) का उपयोग करते हैं।

बी) नया डेटा एक अनमिश साइट से है

मैं फिर भी निम्नलिखित कारणों से मॉडल # 3 से # 1 और # 2 को आउटपरफॉर्म करने की उम्मीद करूंगा।

(i) मॉडल # 3 बनाम # 1:

मॉडल # 1 उन अनुमानों का उत्पादन करेगा जो अतिप्राप्त साइटों के पक्षपाती हैं। यदि आपके पास प्रत्येक साइट से समान संख्या में और साइटों का एक समान प्रतिनिधि नमूना है, तो आपको दोनों से समान परिणाम प्राप्त करने चाहिए।

(ii) मॉडल # ३ बनाम # २:

मॉडल # 3 इस मामले में मॉडल # 2 क्यों बेहतर होगा? क्योंकि यादृच्छिक प्रभाव संकोचन का लाभ उठाते हैं - साइट प्रभाव शून्य की ओर 'सिकुड़' जाएगा। दूसरे शब्दों में, आप साइट के प्रभावों के लिए कम चरम मान पाएंगे जब इसे निर्धारित प्रभाव के रूप में निर्दिष्ट किए जाने की तुलना में यादृच्छिक प्रभाव के रूप में निर्दिष्ट किया जाता है। यह उपयोगी है और आपकी भविष्य कहनेवाला क्षमता में सुधार करता है जब जनसंख्या का साधन यथोचित रूप से एक सामान्य वितरण से तैयार होने के रूप में सोचा जा सकता है ( सांख्यिकी में स्टीन के विरोधाभास देखें )। यदि जनसंख्या का मतलब सामान्य वितरण का पालन करने की उम्मीद नहीं है, तो यह एक समस्या हो सकती है, लेकिन यह आमतौर पर एक बहुत ही उचित धारणा है और विधि छोटे विचलन के लिए मजबूत है।

[साइड नोट: डिफ़ॉल्ट रूप से, जब मॉडल # 2 फिटिंग करते हैं, तो अधिकांश सॉफ़्टवेयर संदर्भ के रूप में साइटों में से एक का उपयोग करते हैं और अन्य साइटों के लिए गुणांक का अनुमान लगाते हैं जो संदर्भ से उनके विचलन का प्रतिनिधित्व करते हैं। इसलिए ऐसा प्रतीत हो सकता है जैसे कि समग्र 'जनसंख्या प्रभाव' की गणना करने का कोई तरीका नहीं है। लेकिन आप इसे व्यक्तिगत साइटों के सभी के लिए औसत अनुमानों के आधार पर गणना कर सकते हैं, या अधिक बस मॉडल की कोडिंग को बदलकर कर सकते हैं ताकि गुणांक की गणना हर साइट के लिए की जाए।]


जवाब के लिए धन्यवाद। मैं बल्कि आश्वस्त हूं। दुर्भाग्य से मुझे अब याद नहीं है कि सटीक मामला जिसने मेरे सवाल को प्रेरित किया, लेकिन मुझे लगता है कि मेरे मामले में मिश्रित मॉडल का खराब प्रदर्शन मेरे द्वारा मॉडल में इस्तेमाल किए गए भविष्यवाणियों के काफी अनियमित वितरण के कारण हो सकता है। मैं जल्द ही उत्तर स्वीकार कर लूंगा, लेकिन चूंकि प्रश्न ने थोड़ा ध्यान आकर्षित किया, इसलिए मैं कुछ और दिन दूंगा ताकि कोई व्यक्ति अधिक सख्त खोज कर सके (शायद कुछ उदाहरणों के साथ)।
पीसीएल

1
अच्छे से कहा। यह ध्यान दिया जाना चाहिए कि साइट-विशिष्ट प्रभावों की भविष्यवाणी करने वाले यादृच्छिक प्रभाव की भविष्यवाणी करते हुए, जो भी यादृच्छिक अवरोधन या यादृच्छिक ढलान का अनुमान लगाने के लिए मॉडल से अनुभवजन्य रूप से अनुमान लगाया गया था, वह व्यक्तिगत स्तर और साइट विशिष्ट प्रभावों के एक समूह के बराबर होना चाहिए। मॉडल में।
एडम जूल

8

Mkt की उत्कृष्ट प्रतिक्रिया के बाद: स्वास्थ्य बीमा क्षेत्र में भविष्य कहनेवाला मॉडल विकसित करने के अपने स्वयं के व्यक्तिगत अनुभव से, भविष्य कहनेवाला मॉडल (मशीन सीखने के मॉडल सहित) में यादृच्छिक प्रभावों को शामिल करने के कई फायदे हैं।

मुझे अक्सर किसी व्यक्ति के ऐतिहासिक दावों के आंकड़ों के आधार पर भविष्य के दावों के परिणामों (जैसे, भविष्य के स्वास्थ्य व्यय, रहने की अवधि, आदि) की भविष्यवाणी करने वाले मॉडल बनाने के लिए कहा जाता है। अक्सर सहसंबद्ध परिणामों के साथ प्रति व्यक्ति कई दावे होते हैं। इस तथ्य को नजरअंदाज करते हुए कि एक ही मरीज द्वारा कई दावों को साझा किया जाता है, जो एक पूर्वानुमान मॉडल में मूल्यवान जानकारी को फेंक देगा।

डेटासेट में प्रत्येक सदस्य के लिए निश्चित प्रभाव सूचक चर बनाने के लिए एक समाधान होगा और सदस्य स्तर के प्रत्येक निर्धारित प्रभाव को अलग करने के लिए एक दंडित प्रतिगमन का उपयोग करना होगा। हालांकि, यदि आपके डेटा में हजारों या लाखों सदस्य हैं, तो कम्प्यूटेशनल और प्रेडिक्टिव दोनों दृष्टिकोणों से अधिक कुशल समाधान एक सामान्य वितरण के साथ एकल यादृच्छिक प्रभाव अवधि के रूप में कई सदस्य-स्तरीय निश्चित प्रभावों का प्रतिनिधित्व करने के लिए हो सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.