GLMs में अधिक फैलाव परीक्षण वास्तव में * उपयोगी * हैं?


15

जीएलएम में 'अति-फैलाव' की घटना तब उत्पन्न होती है जब हम एक मॉडल का उपयोग करते हैं जो प्रतिक्रिया चर के विचरण को प्रतिबंधित करता है, और डेटा मॉडल प्रतिबंध की तुलना में अधिक विचरण प्रदर्शित करता है। यह आमतौर पर तब होता है जब मॉडलिंग एक पॉइज़न जीएलएम का उपयोग करके डेटा की गणना करता है, और इसे प्रसिद्ध परीक्षणों द्वारा निदान किया जा सकता है। यदि परीक्षण दिखाते हैं कि अति-फैलाव के सांख्यिकीय रूप से महत्वपूर्ण सबूत हैं, तो हम आम तौर पर वितरण के व्यापक परिवार का उपयोग करके मॉडल को सामान्य करते हैं जो मूल मॉडल के तहत होने वाले प्रतिबंध से विचरण पैरामीटर को मुक्त करते हैं। एक पॉइसन GLM के मामले में या तो एक ऋणात्मक-द्विपद या अर्ध-पॉइज़न GLM का सामान्यीकरण करना आम है।

यह स्थिति एक स्पष्ट आपत्ति के साथ गर्भवती है। क्यों एक Poisson GLM के साथ शुरू करते हैं? एक सीधे व्यापक वितरण रूपों के साथ शुरू हो सकता है, जिसमें एक (अपेक्षाकृत) मुक्त विचरण पैरामीटर है, और पूरी तरह से अधिक फैलाव परीक्षणों की अनदेखी करते हुए, विचरण पैरामीटर को डेटा के लिए फिट होने की अनुमति देता है। अन्य स्थितियों में जब हम डेटा विश्लेषण कर रहे होते हैं तो हम लगभग हमेशा वितरण के रूपों का उपयोग करते हैं जो कम से कम पहले दो-क्षणों की स्वतंत्रता की अनुमति देते हैं, इसलिए यहां एक अपवाद क्यों करें?

मेरा प्रश्न: क्या वितरण के साथ शुरू करने का कोई अच्छा कारण है जो विचरण को ठीक करता है (जैसे, पॉसन वितरण) और फिर एक अति-फैलाव परीक्षण करता है? इस प्रक्रिया की तुलना इस अभ्यास को पूरी तरह से छोड़ देने और सीधे अधिक सामान्य मॉडल (जैसे, नकारात्मक-द्विपद, अर्ध-पॉइसन, आदि) से कैसे की जाती है? दूसरे शब्दों में, हमेशा एक मुक्त विचरण पैरामीटर के साथ वितरण का उपयोग क्यों नहीं किया जाता है?


1
मेरा अनुमान है कि, यदि अंतर्निहित सही मायने में पियर्सन है, तो आपका glm परिणाम उन अच्छी तरह से ज्ञात गुणों को प्रदर्शित नहीं करेगा, जैसे अनुमान भी अनुमानों के विचरण के लिहाज से कुशल होने के नाते, इससे अधिक होने की जरूरत है, अगर सही हो मॉडल का इस्तेमाल किया गया था। अनुमान शायद निष्पक्ष या MLE के भी नहीं हैं। लेकिन यह सिर्फ मेरा अंतर्ज्ञान है और मैं गलत हो सकता है। मैं उत्सुक हूँ कि एक अच्छा जवाब क्या है।
मिली

3
मेरे अनुभव में, अति-फैलाव के लिए परीक्षण (विरोधाभासी रूप से) मुख्य रूप से उपयोग होता है जब आप जानते हैं (डेटा पीढ़ी प्रक्रिया के एक ज्ञान से) कि अति-फैलाव मौजूद नहीं हो सकता है। इस संदर्भ में, अति-फैलाव के लिए परीक्षण आपको बताता है कि क्या रैखिक मॉडल डेटा में सभी सिग्नल उठा रहा है। यदि ऐसा नहीं है, तो मॉडल में अधिक कोवरिएट्स को जोड़ने पर विचार किया जाना चाहिए। यदि ऐसा है, तो अधिक कोवरिएट्स मदद नहीं कर सकते हैं।
गॉर्डन स्माइथ

@GordonSmyth: मुझे लगता है कि यह एक अच्छा जवाब है। यदि आप इसे अपने उत्तर में बदलना नहीं चाहते हैं, तो मैं इसे अपने में बदल लूंगा।
क्लिफ एबी

1
@GordonSmyth जो एक चीज पर हो जाता है जिसने मुझे हमेशा फिट परीक्षण की भलाई के रूप में भक्ति के विश्लेषण के बारे में परेशान किया है: लापता कोवरिएट्स अतिवृद्धि के साथ भ्रमित हैं। यह कुछ समस्याओं के बारे में सुझाव देता है कि कैसे सामग्री को अक्सर सिखाया जाता है। मैं श्रेणीबद्ध में एक कक्षा पढ़ाता हूं और पाठ्यपुस्तकें इस बात को बहुत मजबूती से नहीं बताती हैं।
लड़का

1
@guy हाँ, यह सही है, और लोग यह मान लेते हैं कि अवशिष्ट अवशिष्ट हमेशा ही विखंडित होता है, जो अक्सर ऐसा नहीं होता है। हमने अपनी हाल की पाठ्यपुस्तक doi.org/10.1007/978-1-4419-0118-7 में इन बिंदुओं का बेहतर काम करने की कोशिश की, लेकिन अंतरिक्ष सीमाओं के भीतर सब कुछ कवर करना कठिन है।
गॉर्डन स्माइथ

जवाबों:


14

सिद्धांत रूप में, मैं वास्तव में इस बात से सहमत हूं कि 99% समय, केवल अधिक लचीले मॉडल का उपयोग करना बेहतर है। इसके साथ ही, यहाँ दो ढाई तर्क दिए गए हैं कि आप क्यों नहीं।

(1) कम लचीले का मतलब अधिक कुशल अनुमान है। यह देखते हुए कि विचरण पैरामीटर माध्य मापदंडों की तुलना में कम स्थिर होते हैं, निश्चित माध्य-विचरण संबंध की आपकी धारणा मानक त्रुटियों को और अधिक स्थिर कर सकती है

(२) मॉडल जाँच। मैंने भौतिकविदों के साथ काम किया है जो मानते हैं कि सैद्धांतिक भौतिकी के कारण विभिन्न मापों को पॉइसन वितरण द्वारा वर्णित किया जा सकता है। यदि हम उस परिकल्पना को अस्वीकार करते हैं जिसका अर्थ = विचरण है, तो हमारे पास पोइसन वितरण परिकल्पना के खिलाफ सबूत हैं। जैसा कि @GordonSmyth द्वारा एक टिप्पणी में कहा गया है, यदि आपके पास यह विश्वास करने का कारण है कि किसी दिए गए माप को एक पॉइसन वितरण का पालन करना चाहिए , यदि आपके पास अधिक फैलाव के सबूत हैं, तो आपके पास सबूत हैं कि आप महत्वपूर्ण कारक गायब हैं।

वीआर[y]=α[y]α1


2.5 पर: बेतरतीब प्रभावों के साथ निश्चित रूप से नकारात्मक द्विपद और GLMM है जो कि सीमा नहीं है।
ब्योर्न

@ ब्योर्न: यही कारण है कि यह केवल आधा तर्क है; केवल क्वैसी-लिकेलिहुड विधियों पर लागू होता है। जहाँ तक मुझे पता है, वहाँ के लिए कोई संभावना आधारित तरीके हैं के तहत फैलाव है, भले ही यह एक अर्ध संभावना मॉडल के साथ विश्लेषण किया जा सकता है।
क्लिफ एबी

1
2.5 पर भी: मेरी समझ यह है कि कोई भी फैलाने वाला फैलाव परिवार नहीं है जो वांछित संबंध को संतुष्ट करता है। मतलब, अर्ध स्कोर वास्तविक स्कोर के अनुरूप नहीं है। इसका मतलब यह नहीं है कि गणना डेटा के लिए वितरण के कोई परिवार नहीं हैं जो वांछित संबंध को संतुष्ट करते हैं; ऐसे कई परिवार होने चाहिए।
लड़का

2
@CliffAB अंडर-छितरी हुई गणना डेटा के लिए कॉनवे-मैक्सवेल- पॉइसन मॉडल है: en.m.wikipedia.org/wiki/… जो कि आर पैकेज के एक जोड़े में लागू है।
दिमित्रिस रिजोपोलोस

यदि मॉडल का उपयोग भविष्यवाणी के लिए किया जा रहा है, तो सरल मॉडल को पसंद करने का एक और कारण यह है कि, यदि बाकी सभी समान हैं, तो सरल मॉडल में बेहतर भविष्य कहनेवाला गुण होंगे। मैं एआईसी, बीआईसी और साथ ही पीएसी के बारे में सोच रहा हूं।
हुंह

11

यद्यपि यह मेरा अपना प्रश्न है, मैं उत्तर के रूप में अपने स्वयं के दो-सेंट भी पोस्ट करने जा रहा हूं, ताकि हम इस प्रश्न पर दृष्टिकोण की संख्या में जोड़ दें। यहां मुद्दा यह है कि शुरू में डेटा के लिए एक-पैरामीटर वितरण को फिट करने के लिए समझदारी है या नहीं। जब आप एक-पैरामीटर वितरण का उपयोग करते हैं (जैसे कि पॉइसन जीएलएम, या फिक्स्ड ट्रायल पैरामीटर के साथ एक द्विपद जीएलएम), तो विचरण एक मुक्त पैरामीटर नहीं है, और इसके बजाय अर्थ के कुछ फ़ंक्शन होने के लिए विवश है। इसका मतलब यह है कि किसी भी स्थिति में डेटा के लिए एक-पैरामीटर वितरण को फिट करने के लिए यह गलत है कि आप बिल्कुल सुनिश्चित नहीं हैं कि विचरण उस वितरण की संरचना का अनुसरण करता है।


डेटा के लिए एक-पैरामीटर वितरण को समाप्त करना लगभग हमेशा एक बुरा विचार है: प्रस्तावित मॉडल की तुलना में डेटा अक्सर गड़बड़ होता है, और यहां तक ​​कि जब कोई विशेष एक-पैरामीटर मॉडल प्राप्त हो सकता है, यह विश्वास करने के लिए सैद्धांतिक कारण हैं, तो अक्सर ऐसा होता है कि डेटा वास्तव में पैरामीटर मानों की एक श्रृंखला के साथ, उस एक-पैरामीटर वितरण के मिश्रण से आते हैं। यह अक्सर एक व्यापक मॉडल के बराबर होता है, जैसे कि दो-पैरामीटर वितरण जो विचरण के लिए अधिक स्वतंत्रता की अनुमति देता है। जैसा कि नीचे चर्चा की गई है, यह गणना डेटा के मामले में पॉइसन जीएलएम के लिए सही है।

जैसा कि सवाल में कहा गया है, आंकड़ों के अधिकांश अनुप्रयोगों में, वितरण रूपों का उपयोग करने के लिए मानक अभ्यास है जो कम से कम पहले दो क्षणों को स्वतंत्र रूप से भिन्न होने की अनुमति देता है। यह सुनिश्चित करता है कि फिट किया गया मॉडल डेटा को इन कृत्रिम रूप से विवश करने के बजाय अवर माध्य और विचरण को निर्देशित करने की अनुमति देता है। इस दूसरे पैरामीटर के होने से केवल मॉडल में एक डिग्री की स्वतंत्रता खो जाती है, जो डेटा से अनुमान लगाने की अनुमति देने के लाभ की तुलना में एक छोटा नुकसान है। एक निश्चित रूप से इस तर्क का विस्तार कर सकता है और तिरछा फिटिंग की अनुमति देने के लिए एक तीसरा पैरामीटर जोड़ सकता है, एक चौथाई कुर्ते की फिटिंग की अनुमति दे सकता है, आदि।


कुछ बेहद मामूली अपवादों के साथ, एक पॉइसन जीएलएम एक बुरा मॉडल है: मेरे अनुभव में, डेटा की गणना करने के लिए एक पॉइसन वितरण को फिट करना लगभग हमेशा एक बुरा विचार है। गणना के आंकड़ों के लिए यह डेटा के विचरण के लिए पॉसन वितरण के सापेक्ष 'अति-फैलाव' होना बेहद आम है। यहां तक ​​कि उन स्थितियों में जहां सिद्धांत एक पॉइसन वितरण को इंगित करता है, अक्सर सबसे अच्छा मॉडल पॉइसन वितरण का मिश्रण होता है, जहां विचरण एक मुक्त पैरामीटर बन जाता है। वास्तव में, गणना डेटा के मामले में ऋणात्मक-द्विपद वितरण दर पैरामीटर के लिए गामा वितरण के साथ एक पॉइज़न मिश्रण है, इसलिए यहां तक ​​कि जब यह सोचने के सैद्धांतिक कारण होते हैं कि काउंस एक पॉइसन वितरण की प्रक्रिया के अनुसार आते हैं, तो अक्सर ऐसा होता है कि 'अति-फैलाव' होता है और नकारात्मक-द्विपद वितरण बहुत बेहतर होता है।

डेटा को गिनने और फिर 'अति-फैलाव' की जाँच के लिए एक सांख्यिकीय परीक्षण करने के लिए एक पोइसन जीएलएम को फिट करने का अभ्यास एक अतिवाद है, और यह शायद ही कभी एक अच्छा अभ्यास है। सांख्यिकीय विश्लेषण के अन्य रूपों में, हम दो-पैरामीटर वितरण के साथ शुरू नहीं करते हैं, मनमाने ढंग से एक विचरण प्रतिबंध का चयन करते हैं, और फिर इस प्रतिबंध के लिए परीक्षण करते हैं कि वितरण से एक पैरामीटर को खत्म करने का प्रयास करें। इस तरह से चीजें करने से, हम वास्तव में एक अजीब हाइब्रिड प्रक्रिया बनाते हैं, जिसमें मॉडल चयन के लिए उपयोग की जाने वाली प्रारंभिक परिकल्पना परीक्षण शामिल है, और फिर वास्तविक मॉडल (या तो पॉइसन, या एक व्यापक वितरण)। कई संदर्भों में यह दिखाया गया है कि एक प्रारंभिक मॉडल चयन परीक्षण से हाइब्रिड मॉडल बनाने के इस तरह के अभ्यास से समग्र मॉडल खराब होते हैं।

एक अनुरूप स्थिति, जहां एक समान संकर विधि का उपयोग किया गया है, मतलब अंतर के टी-परीक्षणों में है। यह ऐसा मामला हुआ करता था कि आँकड़े पाठ्यक्रम पहले लेवेन के परीक्षण (या यहां तक ​​कि कुछ बहुत क्रैपीयर "अंगूठे के नियम") का उपयोग करके दो आबादी के बीच भिन्नताओं की समानता की जांच करने की सलाह देते थे , और फिर यदि डेटा "परीक्षण" पास करता है, तो आप स्टूडेंट टी-टेस्ट का उपयोग करें जो समान भिन्नता मानता है, और यदि डेटा परीक्षण में "विफल" हो जाता है, तो आप इसके बजाय वेल्च के टी-टेस्ट का उपयोग करेंगे। यह वास्तव में एक बुरी प्रक्रिया है (उदाहरण के लिए, यहां और यहां देखें))। यह केवल बाद के परीक्षण का उपयोग करने के लिए बहुत बेहतर है, जो एक अजीब यौगिक परीक्षण बनाने के बजाय विचरण पर कोई धारणा नहीं बनाता है, जो प्रारंभिक परिकल्पना परीक्षण के साथ मिलकर जाम करता है और फिर मॉडल का चयन करने के लिए इसका उपयोग करता है।

गणना डेटा के लिए, आप आमतौर पर दो-पैरामीटर मॉडल जैसे कि एक नकारात्मक-द्विपद या अर्ध-पॉइसन मॉडल को फिट करके अच्छे प्रारंभिक परिणाम प्राप्त करेंगे। (ध्यान दें कि उत्तरार्द्ध एक वास्तविक वितरण नहीं है, लेकिन यह अभी भी एक उचित दो-पैरामीटर मॉडल देता है।) यदि किसी भी आगे के सामान्यीकरण की आवश्यकता है, तो यह आमतौर पर शून्य-मुद्रास्फीति के अतिरिक्त होता है, जहां अत्यधिक संख्या में शून्य होते हैं। डेटा में। एक पॉइसन GLM के लिए प्रतिबंधित एक कृत्रिम और संवेदनहीन मॉडल विकल्प है, और इसे अधिक फैलाव के लिए परीक्षण करके बेहतर नहीं बनाया गया है।


ठीक है, अब यहाँ कुछ मामूली अपवाद हैं: ऊपर की एकमात्र वास्तविक अपवाद दो स्थितियाँ हैं:

(1) आपके पास बेहद मजबूत एक प्रायोरी विश्वास है कि एक पैरामीटर वितरण के लिए मान्यताओं संतुष्ट हैं, और विश्लेषण के भाग के डेटा के खिलाफ इस सैद्धांतिक मॉडल का परीक्षण करने के लिए है सैद्धांतिक कारण; या

(2) किसी अन्य (अजीब) कारण के लिए, आपके विश्लेषण का उद्देश्य डेटा के विचरण पर एक परिकल्पना परीक्षण करना है, और इसलिए आप वास्तव में इस परिकल्पना को इस परिकल्पना प्रतिबंध तक सीमित करना चाहते हैं, और फिर इस परिकल्पना का परीक्षण करें।

ये स्थितियां बहुत दुर्लभ हैं। वे केवल तभी उत्पन्न होते हैं जब डेटा-जनरेटिंग तंत्र के बारे में एक प्राथमिक सैद्धांतिक ज्ञान मजबूत होता है , और विश्लेषण का उद्देश्य इस अंतर्निहित सिद्धांत का परीक्षण करना है। यह अनुप्रयोगों की एक अत्यंत सीमित सीमा में मामला हो सकता है जहां डेटा को कसकर नियंत्रित स्थितियों (जैसे भौतिकी में) के तहत उत्पन्न किया जाता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.