सामान्यीकृत रैखिक मॉडल (GLM) की अव्यक्त चर व्याख्या


21

लघु संस्करण:

हम जानते हैं कि लॉजिस्टिक रिग्रेशन और प्रोबेट रिग्रेशन को एक निरंतर अव्यक्त चर को शामिल करने के रूप में व्याख्या किया जा सकता है जो अवलोकन से पहले कुछ निश्चित सीमा के अनुसार विवेकाधीन हो जाता है। क्या इसी तरह की अव्यक्त चर व्याख्या, पोइसन प्रतिगमन के लिए उपलब्ध है? जब दो से अधिक असतत परिणाम होते हैं, तो द्विपद प्रतिगमन (जैसे कि लॉगिट या प्रोबिट) के बारे में कैसे? सबसे सामान्य स्तर पर, अव्यक्त चर के संदर्भ में किसी भी GLM की व्याख्या करने का एक तरीका है?


दीर्घ संस्करण:

बाइनरी परिणामों के लिए प्रोबेट मॉडल को प्रेरित करने का एक मानक तरीका (जैसे, विकिपीडिया से ) निम्नलिखित है। हमारे पास एक बिना बताए / अव्यक्त परिणाम चर है जो सामान्य रूप से वितरित किया जाता है, पूर्वसूचक पर सशर्त । इस अव्यक्त चर को एक थ्रेशोल्डिंग प्रक्रिया के अधीन किया जाता है, ताकि जो असतत परिणाम हम देखते हैं वह वास्तव में यदि , यदि । यह होता है की संभावना दिए गए एक सामान्य CDF के रूप में, माध्य और मानक विचलन के साथ सीमा के एक समारोह लेने के लिए और का प्रतिगमन की ढलान परएक्स यू = 1 Y γ यू = 0 वाई < γ यू = 1 एक्स γ वाई एक्स वाई एक्सYXu=1Yγu=0Y<γu=1XγYX , क्रमशः। तो प्रोबेट मॉडल को पर इस अव्यक्त प्रतिगमन से ढलान का अनुमान लगाने के तरीके के रूप में प्रेरित किया जाता है ।YX

यह नीचे के भूखंड में सचित्र है, इटसेन एंड ऑरलैंडो (2001) से। ये लेखक तकनीकी रूप से आइटम प्रतिक्रिया सिद्धांत से सामान्य ऑगिव मॉडल पर चर्चा कर रहे हैं, जो हमारे उद्देश्यों के लिए प्रोबेट रिग्रेशन की तरह दिखता है (ध्यान दें कि ये लेखक स्थान पर उपयोग करते हैं , और संभावना सामान्य बजाय साथ लिखी जाती है )।एक्स टी पीθXTP

प्रॉबिट मॉडल

हम काफी हद तक उसी तरह से लॉजिस्टिक रिग्रेशन की व्याख्या कर सकते हैं । अंतर केवल इतना है कि अब बिना बोले निरंतर एक लॉजिस्टिक डिस्ट्रीब्यूशन को फॉलो करता है , न कि एक सामान्य डिस्ट्रीब्यूशन, । इस बात के लिए एक सैद्धांतिक तर्क कि एक सामान्य वितरण के बजाय एक लॉजिस्टिक वितरण का पालन क्यों कर सकता है, यह थोड़ा कम स्पष्ट है ... लेकिन चूंकि परिणामी लॉजिस्टिक वक्र अनिवार्य रूप से व्यावहारिक उद्देश्यों के लिए सामान्य सीडीएफ के समान है (rescaling के बाद), यकीनन यह जीता है ' टी व्यवहार में बहुत ज्यादा मायने रखता है कि आप किस मॉडल का उपयोग करते हैं। मुद्दा यह है कि दोनों मॉडलों में एक बहुत सीधा अव्यक्त चर व्याख्या है।X YXY

मैं जानना चाहता हूं कि क्या हम अन्य GLM - या यहां तक ​​कि किसी भी GLM के समान-दिखने वाले (या, नरक, असंतुष्ट-रूप) अव्यक्त चर व्याख्याओं को लागू कर सकते हैं

यहां तक ​​कि मॉडल को बीनोमियल परिणामों के लिए (यानी, केवल बर्नौली परिणामों के साथ) के विस्तार के लिए मेरे लिए पूरी तरह से स्पष्ट नहीं है। संभवत: कोई यह अनुमान लगाकर कर सकता है कि एकल दहलीज होने के बजाय , हमारे पास कई थ्रेसहोल्ड हैं (मनाया असतत परिणामों की संख्या से कम)। लेकिन हमें थ्रेशोल्ड पर कुछ अड़चनें डालने की जरूरत है, जैसे कि वे समान रूप से दूरी पर हैं। मुझे पूरा यकीन है कि ऐसा कुछ काम कर सकता है, हालांकि मैंने विवरणों पर काम नहीं किया है।γn>1γ

पोइसन प्रतिगमन के मामले में जाना मुझे और भी कम स्पष्ट लगता है। मुझे यकीन नहीं है कि अगर इस मामले में मॉडल के बारे में सोचने के लिए थ्रेसहोल्ड की धारणा सबसे अच्छा तरीका है। मुझे यह भी निश्चित नहीं है कि हम किस प्रकार के वितरण के रूप में अव्यक्त परिणाम की कल्पना कर सकते हैं।

इसका सबसे वांछनीय समाधान कुछ वितरण या अन्य के साथ अव्यक्त चर के संदर्भ में किसी भी GLM की व्याख्या करने का एक सामान्य तरीका होगा - भले ही यह सामान्य समाधान लॉजिट / प्रोबिट रिग्रेशन के लिए सामान्य से एक अलग अव्यक्त चर व्याख्या का अर्थ हो। बेशक, यह और भी अच्छा होगा यदि सामान्य विधि लॉगिट / प्रोबिट की सामान्य व्याख्याओं से सहमत है, लेकिन स्वाभाविक रूप से अन्य जीएलएम के लिए भी विस्तारित है।

लेकिन यहां तक ​​कि अगर इस तरह के अव्यक्त चर व्याख्याएं आम तौर पर सामान्य जीएलएम मामले में उपलब्ध नहीं हैं, तो मैं विशेष मामलों की अव्यक्त चर व्याख्याओं जैसे कि बाइनोमियल और पॉइसन मामलों के बारे में भी सुनना चाहूंगा, जिनका मैंने ऊपर उल्लेख किया था।


संदर्भ

इटसेन, डी। एंड ऑरलैंडो, एम। (2001)। दो श्रेणियों में बनाए गए आइटमों के लिए आइटम प्रतिक्रिया सिद्धांत। डी। थेसेन एंड वेनर में, एच। (ईडीएस), टेस्ट स्कोरिंग (पीपी। 73-140)। महवा, एनजे: लॉरेंस एर्लबम एसोसिएट्स, इंक।


2016-09-23 को संपादित करें

एक प्रकार का तुच्छ अर्थ है जिसमें कोई भी GLM एक अव्यक्त चर मॉडल होता है, जो यह है कि हम परिणाम वितरण के पैरामीटर को "अव्यक्त चर" के रूप में अनुमानित रूप से हमेशा देख सकते हैं - अर्थात, हम सीधे निरीक्षण नहीं करते हैं , कहते हैं, पोइसन के दर पैरामीटर, हम इसे केवल डेटा से अनुमान लगाते हैं। मैं इसे एक बल्कि तुच्छ व्याख्या मानता हूं, और वास्तव में मैं जो खोज रहा हूं वह नहीं है, क्योंकि इस व्याख्या के अनुसार कोई भी रैखिक मॉडल (और निश्चित रूप से कई अन्य मॉडल!) एक "अव्यक्त चर मॉडल है।" उदाहरण के लिए, सामान्य प्रतिगमन में हम अनुमान लगाते हैं कि एक "अव्यक्त" का सामान्य दिया गयाY X Y γμYX। तो यह सिर्फ पैरामीटर अनुमान के साथ अव्यक्त चर मॉडलिंग को भ्रमित करने के लिए लगता है। उदाहरण के लिए, पॉसों के प्रतिगमन मामले में मैं जो देख रहा हूं, वह एक सैद्धांतिक मॉडल की तरह दिखाई देगा, जिसके लिए यह माना जाता है कि पहले परिणाम में पोइसन वितरण क्यों होना चाहिए, कुछ मान्यताओं (आपके द्वारा भरने के लिए!) के बारे में। अव्यक्त का वितरण , चयन प्रक्रिया यदि एक है, आदि तो (शायद महत्वपूर्ण रूप से?) हमें इन अव्यक्त वितरणों / प्रक्रियाओं के मापदंडों के संदर्भ में अनुमानित GLM गुणांक की व्याख्या करने में सक्षम होना चाहिए, जैसा कि हम कैसे कर सकते हैं अव्यक्त सामान्य चर और / या थ्रेशोल्ड में बदलाव के मतलब बदलाव के संदर्भ में प्रोबेट प्रतिगमन से गुणांक की व्याख्या करें ।Yγ


क्या हम आपके प्रश्न को "क्या GLM परिवारों के लिए रैखिक भविष्यवक्ता कुछ निरंतर वितरण और एक चयन मॉडल के लिए एक स्थान पैरामीटर के अनुरूप है?" प्रोबिट और लॉजिस्टिक रिग्रेशन के लिए क्रमशः रैखिक भविष्यवक्ता गॉसियन और लॉजिस्टिक वितरण स्थान पैरामीटर है। चयन मॉडल 0. पर थ्रेसहोल्ड है (एफडब्ल्यूआईडब्ल्यू, मुझे नहीं लगता कि कई अन्य लोग होंगे - और वास्तव में प्रोबिट / लॉजिस्टिक एक ही परिवार हैं, लेकिन विभिन्न लिंक फ़ंक्शन के साथ ...)
एंड्रयू एम

@AndrewM मुझे लगता है कि rephrasing शायद असतत परिणामों के साथ GLMs के लिए काम कर सकता है। लेकिन मैं नीचे दिए गए पूरे प्रश्न को कम करने में संकोच करता हूं क्योंकि मैं वास्तव में यह नहीं देख सकता कि इस तरह के स्थान + चयन मॉडल निरंतर परिणामों के साथ जीएलएम के लिए कैसे काम कर सकते हैं। ऐसा लगता है कि rephrasing उन GLMs के लिए लगभग एक जवाब देना होगा
जेक

अव्यक्त वर्ग मॉडल परिमित मिश्रण मॉडल की श्रेणी में आते हैं। उनके बारे में सोचने का एक सीधा तरीका यह है कि वे सीखने वाले मॉडल की देखरेख करते हैं, जो कि अंत में, समूहों में मॉडल से अवशिष्ट में विषमता को विभाजित करता है। इसी तरह के तर्क और विभाजन को GLM सहित किसी भी मॉडल से प्राप्त अवशेषों में निहित विषमता पर लागू किया जा सकता है। बेशक, इस विभाजन के लिए दृष्टिकोण एक nontrivial विकल्प हो सकता है और यह एक kluge समाधान हो सकता है, लेकिन इसे काम करने के लिए बनाया जा सकता है।
माइक हंटर

अगर glm वितरण प्रेरित करता है तो हम बहुत अधिक अव्यक्त वितरण चयन नहीं कर सकते हैं, जैसे कि ? f(yi|ηi)g(θi|ηi)f(yi|ηi)=f(yi|ηi,θi)g(θi|ηi)dθi
एंड्रयू एम।

1
आदेशित प्रोबिट की एक समान व्याख्या हो सकती है। ईटी में बेकर और कैनेडी पेपर देखें ।
दिमित्री वी। मास्टरोव

जवाबों:


1

एक से अधिक असतत परिणामों वाले मॉडल के लिए, लॉगिट मॉडल के कई संस्करण हैं (उदाहरण के लिए सशर्त लॉगिट, मल्टीमोनियल लॉगिट, मिश्रित लॉगिट, नेस्टेड लॉगिट, ...)। इस विषय पर केनेथ ट्रेन की पुस्तक देखें: http://eml.berkeley.edu/books/choice2.html

उदाहरण के लिए, सशर्त लॉगिट में, परिणाम, , एक व्यक्ति द्वारा चुनी गई कार है, और हो सकता है कि, कारों को चुनने के लिए कहा जाए और कार में द्वारा दी गई । तब लगता है कि अलग-अलग उपयोगिता प्राप्त करता chosing कार से , जहां वितरित किया जाता है प्रकार मैं चरम मूल्य। तब संभावना है कि कार को चुना गया हैजे जे एक्स जे मैं यू मैं j = एक्स जे β + ε मैं जे जे ε मैं जे जेyJjxjiuij=xjβ+εijjεijj

Pr(y=j)=exp(xjβ)k=1Jexp(xkβ)

इस मॉडल में, , विकल्पों की एक रैंकिंग बनाते हैं । हम मापदंडों, खोज कर रहे हैं , ताकि यह रैंकिंग उन मनाया विकल्पों के अनुरूप हो जो हम लोगों को बनाते हुए देखते हैं। उदाहरण के लिए, यदि अधिक महंगी कारों के बाजार के शेयर बाकी सभी बराबर हैं, तो कीमत पर गुणांक नकारात्मक होना चाहिए। βuijβ

अर्थशास्त्री व्याख्या प्रत्येक विकल्प बनाने की एक अव्यक्त "उपयोगिता" के रूप में करते हैं। सूक्ष्मअर्थशास्त्र में, उपयोगिता सिद्धांत पर काम का एक काफी हिस्सा है: उदाहरण के लिए देखें https://en.wikipedia.org/wiki/Unilityu

ध्यान दें कि यहां "थ्रेशोल्ड" पैरामीटर नहीं है: इसके बजाय, जब एक उपयोगिता पहले से बड़ी हो जाती है, तो उपभोक्ता इस विकल्प को चुनने के लिए स्विच करेगा।

इसलिए, में कोई अवरोधक नहीं हो सकता है : यदि वहाँ थे, तो यह सभी उपलब्ध विकल्पों की उपयोगिता को माप देगा, जिससे रैंकिंग संरक्षित और विकल्प अपरिवर्तित रह जाएगा।xjβ

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.