लघु संस्करण:
हम जानते हैं कि लॉजिस्टिक रिग्रेशन और प्रोबेट रिग्रेशन को एक निरंतर अव्यक्त चर को शामिल करने के रूप में व्याख्या किया जा सकता है जो अवलोकन से पहले कुछ निश्चित सीमा के अनुसार विवेकाधीन हो जाता है। क्या इसी तरह की अव्यक्त चर व्याख्या, पोइसन प्रतिगमन के लिए उपलब्ध है? जब दो से अधिक असतत परिणाम होते हैं, तो द्विपद प्रतिगमन (जैसे कि लॉगिट या प्रोबिट) के बारे में कैसे? सबसे सामान्य स्तर पर, अव्यक्त चर के संदर्भ में किसी भी GLM की व्याख्या करने का एक तरीका है?
दीर्घ संस्करण:
बाइनरी परिणामों के लिए प्रोबेट मॉडल को प्रेरित करने का एक मानक तरीका (जैसे, विकिपीडिया से ) निम्नलिखित है। हमारे पास एक बिना बताए / अव्यक्त परिणाम चर है जो सामान्य रूप से वितरित किया जाता है, पूर्वसूचक पर सशर्त । इस अव्यक्त चर को एक थ्रेशोल्डिंग प्रक्रिया के अधीन किया जाता है, ताकि जो असतत परिणाम हम देखते हैं वह वास्तव में यदि , यदि । यह होता है की संभावना दिए गए एक सामान्य CDF के रूप में, माध्य और मानक विचलन के साथ सीमा के एक समारोह लेने के लिए और का प्रतिगमन की ढलान परएक्स यू = 1 Y ≥ γ यू = 0 वाई < γ यू = 1 एक्स γ वाई एक्स वाई एक्स , क्रमशः। तो प्रोबेट मॉडल को पर इस अव्यक्त प्रतिगमन से ढलान का अनुमान लगाने के तरीके के रूप में प्रेरित किया जाता है ।
यह नीचे के भूखंड में सचित्र है, इटसेन एंड ऑरलैंडो (2001) से। ये लेखक तकनीकी रूप से आइटम प्रतिक्रिया सिद्धांत से सामान्य ऑगिव मॉडल पर चर्चा कर रहे हैं, जो हमारे उद्देश्यों के लिए प्रोबेट रिग्रेशन की तरह दिखता है (ध्यान दें कि ये लेखक स्थान पर उपयोग करते हैं , और संभावना सामान्य बजाय साथ लिखी जाती है )।एक्स टी पी
हम काफी हद तक उसी तरह से लॉजिस्टिक रिग्रेशन की व्याख्या कर सकते हैं । अंतर केवल इतना है कि अब बिना बोले निरंतर एक लॉजिस्टिक डिस्ट्रीब्यूशन को फॉलो करता है , न कि एक सामान्य डिस्ट्रीब्यूशन, । इस बात के लिए एक सैद्धांतिक तर्क कि एक सामान्य वितरण के बजाय एक लॉजिस्टिक वितरण का पालन क्यों कर सकता है, यह थोड़ा कम स्पष्ट है ... लेकिन चूंकि परिणामी लॉजिस्टिक वक्र अनिवार्य रूप से व्यावहारिक उद्देश्यों के लिए सामान्य सीडीएफ के समान है (rescaling के बाद), यकीनन यह जीता है ' टी व्यवहार में बहुत ज्यादा मायने रखता है कि आप किस मॉडल का उपयोग करते हैं। मुद्दा यह है कि दोनों मॉडलों में एक बहुत सीधा अव्यक्त चर व्याख्या है।X य
मैं जानना चाहता हूं कि क्या हम अन्य GLM - या यहां तक कि किसी भी GLM के समान-दिखने वाले (या, नरक, असंतुष्ट-रूप) अव्यक्त चर व्याख्याओं को लागू कर सकते हैं ।
यहां तक कि मॉडल को बीनोमियल परिणामों के लिए (यानी, केवल बर्नौली परिणामों के साथ) के विस्तार के लिए मेरे लिए पूरी तरह से स्पष्ट नहीं है। संभवत: कोई यह अनुमान लगाकर कर सकता है कि एकल दहलीज होने के बजाय , हमारे पास कई थ्रेसहोल्ड हैं (मनाया असतत परिणामों की संख्या से कम)। लेकिन हमें थ्रेशोल्ड पर कुछ अड़चनें डालने की जरूरत है, जैसे कि वे समान रूप से दूरी पर हैं। मुझे पूरा यकीन है कि ऐसा कुछ काम कर सकता है, हालांकि मैंने विवरणों पर काम नहीं किया है।γ
पोइसन प्रतिगमन के मामले में जाना मुझे और भी कम स्पष्ट लगता है। मुझे यकीन नहीं है कि अगर इस मामले में मॉडल के बारे में सोचने के लिए थ्रेसहोल्ड की धारणा सबसे अच्छा तरीका है। मुझे यह भी निश्चित नहीं है कि हम किस प्रकार के वितरण के रूप में अव्यक्त परिणाम की कल्पना कर सकते हैं।
इसका सबसे वांछनीय समाधान कुछ वितरण या अन्य के साथ अव्यक्त चर के संदर्भ में किसी भी GLM की व्याख्या करने का एक सामान्य तरीका होगा - भले ही यह सामान्य समाधान लॉजिट / प्रोबिट रिग्रेशन के लिए सामान्य से एक अलग अव्यक्त चर व्याख्या का अर्थ हो। बेशक, यह और भी अच्छा होगा यदि सामान्य विधि लॉगिट / प्रोबिट की सामान्य व्याख्याओं से सहमत है, लेकिन स्वाभाविक रूप से अन्य जीएलएम के लिए भी विस्तारित है।
लेकिन यहां तक कि अगर इस तरह के अव्यक्त चर व्याख्याएं आम तौर पर सामान्य जीएलएम मामले में उपलब्ध नहीं हैं, तो मैं विशेष मामलों की अव्यक्त चर व्याख्याओं जैसे कि बाइनोमियल और पॉइसन मामलों के बारे में भी सुनना चाहूंगा, जिनका मैंने ऊपर उल्लेख किया था।
संदर्भ
इटसेन, डी। एंड ऑरलैंडो, एम। (2001)। दो श्रेणियों में बनाए गए आइटमों के लिए आइटम प्रतिक्रिया सिद्धांत। डी। थेसेन एंड वेनर में, एच। (ईडीएस), टेस्ट स्कोरिंग (पीपी। 73-140)। महवा, एनजे: लॉरेंस एर्लबम एसोसिएट्स, इंक।
2016-09-23 को संपादित करें
एक प्रकार का तुच्छ अर्थ है जिसमें कोई भी GLM एक अव्यक्त चर मॉडल होता है, जो यह है कि हम परिणाम वितरण के पैरामीटर को "अव्यक्त चर" के रूप में अनुमानित रूप से हमेशा देख सकते हैं - अर्थात, हम सीधे निरीक्षण नहीं करते हैं , कहते हैं, पोइसन के दर पैरामीटर, हम इसे केवल डेटा से अनुमान लगाते हैं। मैं इसे एक बल्कि तुच्छ व्याख्या मानता हूं, और वास्तव में मैं जो खोज रहा हूं वह नहीं है, क्योंकि इस व्याख्या के अनुसार कोई भी रैखिक मॉडल (और निश्चित रूप से कई अन्य मॉडल!) एक "अव्यक्त चर मॉडल है।" उदाहरण के लिए, सामान्य प्रतिगमन में हम अनुमान लगाते हैं कि एक "अव्यक्त" का सामान्य दिया गयाY X Y γ। तो यह सिर्फ पैरामीटर अनुमान के साथ अव्यक्त चर मॉडलिंग को भ्रमित करने के लिए लगता है। उदाहरण के लिए, पॉसों के प्रतिगमन मामले में मैं जो देख रहा हूं, वह एक सैद्धांतिक मॉडल की तरह दिखाई देगा, जिसके लिए यह माना जाता है कि पहले परिणाम में पोइसन वितरण क्यों होना चाहिए, कुछ मान्यताओं (आपके द्वारा भरने के लिए!) के बारे में। अव्यक्त का वितरण , चयन प्रक्रिया यदि एक है, आदि तो (शायद महत्वपूर्ण रूप से?) हमें इन अव्यक्त वितरणों / प्रक्रियाओं के मापदंडों के संदर्भ में अनुमानित GLM गुणांक की व्याख्या करने में सक्षम होना चाहिए, जैसा कि हम कैसे कर सकते हैं अव्यक्त सामान्य चर और / या थ्रेशोल्ड में बदलाव के मतलब बदलाव के संदर्भ में प्रोबेट प्रतिगमन से गुणांक की व्याख्या करें ।