रेखीय प्रतिगमन में स्वतंत्र चर के रूप में एक के बराबर अनुपात की व्याख्या करना


13

मैं श्रेणीबद्ध चर की अवधारणा और संबंधित डमी चर कोडिंग से परिचित हूं जो हमें एक स्तर को आधार रेखा के रूप में फिट करने की अनुमति देता है ताकि कोलीनियरिटी से बचा जा सके। मैं ऐसे मॉडल से पैरामीटर अनुमानों की व्याख्या करने के तरीके से भी परिचित हूं: आधारभूत श्रेणी के सापेक्ष, श्रेणीबद्ध भविष्यवक्ता के दिए गए फिट स्तर के लिए परिणाम में अनुमानित परिवर्तन।

मैं इस बारे में अनिश्चित हूं कि स्वतंत्र चर के एक सेट की व्याख्या कैसे की जाती है जो एक के अनुपात में हैं । यदि हम मॉडल में सभी अनुपातों को फिट करते हैं, तो हमारे पास फिर से मिलीभगत है, इसलिए संभवतः हमें एक श्रेणी को आधार रेखा के रूप में छोड़ना होगा। मुझे यह भी लगता है कि मैं इस चर के महत्व के समग्र परीक्षण के लिए III SS को देखूंगा। हालांकि, हम उन स्तरों के लिए पैरामीटर अनुमानों की व्याख्या कैसे करते हैं जो मॉडल बनाम फिट के आधार पर समझे जाते हैं?

एक उदाहरण : ज़िप कोड स्तर पर, स्वतंत्र चर कायापलट, आग्नेय और अवसादी चट्टानों का अनुपात है। जैसा कि आप जानते हैं, ये तीन प्रमुख चट्टान प्रकार हैं, और सभी चट्टानों को इनमें से एक के रूप में वर्गीकृत किया गया है। जैसे, सभी तीनों योगों के अनुपात में 1. परिणाम संबंधित ज़िप कोड में औसत रेडॉन स्तर है।

अगर मैं, फिट कहते हैं, के लिए गए थे रूपांतरित और आग्नेय मॉडल में भविष्यफल बताने अनुपात, छोड़ने तलछटी आधार रेखा के रूप, एक समग्र प्रकार III एस एस एफ दो फिट के स्तर के टेस्ट दर्शाता कि क्या रॉक प्रकार, एक पूरे के रूप में एक महत्वपूर्ण है परिणाम का अनुमानक (औसत रेडॉन स्तर)। फिर, मैं यह निर्धारित करने के लिए व्यक्तिगत पी- अंतराल ( टी वितरण के आधार पर ) देख सकता हूं कि क्या एक या दोनों रॉक प्रकार बेसलाइन से काफी अलग थे।

हालाँकि, जब पैरामीटर के अनुमानों की बात आती है, तो मेरा मस्तिष्क उन्हें विशुद्ध रूप से व्याख्या करना चाहता है क्योंकि समूहों (रॉक प्रकार) के परिणाम में अनुमानित परिवर्तन, और मुझे समझ में नहीं आता है कि इस तथ्य को कैसे शामिल किया जाए कि वे अनुपात के रूप में फिट हों। ।

अगर मेटामॉर्फिक के लिए अनुमान था , तो 0.43 कहें, व्याख्या केवल यह नहीं है कि जब रॉक मेटामॉर्फिक बनाम तलछटी होता है, तो अनुमानित औसत रेडॉन स्तर 0.43 यूनिट बढ़ जाता है। हालांकि, व्याख्या भी केवल किसी प्रकार की इकाई वृद्धि (0.1 के अनुसार) के लिए मेटामॉर्फिक रॉक प्रकार के अनुपात में नहीं है, क्योंकि यह इस तथ्य को प्रतिबिंबित नहीं करता है कि यह आधारभूत ( तलछटी ) के सापेक्ष भी है , और, इसके अतिरिक्त, वह बदल रहा है स्वाभाविक रूप से मॉडल में अन्य रॉक स्तर फिट के अनुपात में मेटामॉर्फिक का अनुपात बदल जाता है, आग्नेयβ

क्या किसी के पास ऐसा स्रोत है जो इस तरह के मॉडल की व्याख्या प्रदान करता है, या आप यहां एक संक्षिप्त उदाहरण प्रदान कर सकते हैं यदि नहीं?


2
+1 प्रायः अनुपात प्रतिक्रिया के साथ रैखिक संबंध नहीं । यदि reparameterifications जैसे को मॉडल में सुधार करना था, तो वे प्राकृतिक, सरल व्याख्याओं की भी अनुमति देंगे। क्या आपने अपने डेटा में रैखिकता की जांच की है? π मैं = exp ( λ मैं )(π1,π2,,πk)
πi=exp(λi)exp(λ1)++exp(λk)
whuber

1
नहीं, लेकिन मैं अनुमान लगा रहा हूं कि यह समस्याग्रस्त होने वाला है, खासकर क्योंकि "अनुपात" के कई वास्तव में 0 और 1 के रूप में सामने आए, या मान 0 और 1 के बहुत करीब हैं, और इस प्रकार अनिवार्य रूप से वैसे भी द्विआधारी के रूप में कार्य कर रहे हैं। जैसे, यह संभव है कि हम वास्तविक समूहों को उनमें से बाहर कर देंगे (और अनुपात से दूर कर देंगे), लेकिन इसने मेरी रुचि को स्पष्ट कर दिया कि सही व्याख्या क्या होगी, काल्पनिक रूप से।
मेग

काफी उचित - यह एक अच्छा सवाल है।
व्हिबर

2
प्रतिनिधित्व करने के लिए गणितीय बराबर तरीके हैं । उनकी व्याख्या करने के लिए, उसबाएं हाथ की ओर "लॉग ऑड्स अनुपात" कहा जाएगा जब प्रायिकताएं होती हैं; इसका किसी भी अनुपात के लिए एक तुलनीय अर्थ है। इस प्रकार, को लॉग ऑड्स अनुपात की तरह ही व्याख्या किया जा सकता है। regressors के एक समूह को एकता के लिए करने के लिए, आप अपने मॉडल में उन को फिर से व्‍यक्‍त करने के लिए of the का उपयोग कर सकते हैं । (कुछ देखभाल की जरूरत है जब भी या )λiπ
log(πi/πj)=λiλj.
πiλiλjkk1λiπi=0πi=1
whuber

2
λi=log(πi) को ठीक काम करना चाहिए, क्योंकि तब और ।
log(πi/πj)=λiλj
exp(λi)exp(λ1)++exp(λk)=πiπ1+π2++πk=π11=πi
whuber

जवाबों:


8

अनुवर्ती के रूप में और मुझे क्या लगता है कि सही उत्तर है (मेरे लिए उचित प्रतीत होता है): मैंने इस सवाल को एएसए कनेक्ट लिस्टवेस्टर पर पोस्ट किया, और स्टोनी ब्रुक में थॉमस सेक्स्टन से निम्नलिखित प्रतिक्रिया मिली:

"आपका अनुमानित रेखीय प्रतिगमन मॉडल जैसा दिखता है:

ln (रैडॉन) = (अन्य चर में एक रैखिक अभिव्यक्ति) + 0.43M + 0.92I

जहां M और I क्रमशः ज़िप कोड में मेटामॉर्फिक और आग्नेय चट्टानों के प्रतिशत का प्रतिनिधित्व करते हैं। आप इससे विवश हैं:

एम + आई + एस = १००

जहां S ज़िप कोड में तलछटी चट्टान के प्रतिशत का प्रतिनिधित्व करता है।

0.43 की व्याख्या यह है कि एम में एक प्रतिशत अंक वृद्धि 0.43 की वृद्धि के साथ जुड़ा हुआ है ln (रेडॉन) में निर्धारित मॉडल में अन्य सभी चर पकड़े हुए हैं । इस प्रकार, मैं का मूल्य नहीं बदल सकता है, और बाधा को संतुष्ट करते हुए एम में एक प्रतिशत अंक की वृद्धि का एकमात्र तरीका है, छोड़े गए वर्ग में एस में एक प्रतिशत अंक की कमी है।

बेशक, यह परिवर्तन ज़िप कोड में नहीं हो सकता है जिसमें S = 0 है, लेकिन एम में कमी और एस में इसी वृद्धि से ऐसे ज़िप कोड संभव होंगे। "

यहाँ थ्रेड एएसए का लिंक दिया गया है: http://community.amstat.org/communities/community-home/digestviewer/viewthread?GroupId=2653&MID=29924/tab=digestviewer&UserKey=5adc7e8b-ae4f=43f4.143.14.143.14.143.14/43.14/43.14

मैं इसे स्वीकार किए गए सही उत्तर के रूप में पोस्ट कर रहा हूं, लेकिन अगर किसी को कुछ जोड़ना है तो मैं आगे चर्चा के लिए खुला हूं।


एक सलाह एएसए के धागे पर जाने की होगी, क्योंकि काफी कुछ चर्चा है जो यहां दिए गए उत्तर पर सवाल उठाती है।
मैक्सिम.क

@ Maxim.K: क्या आप अपने स्वयं के एएसए धागे का उल्लेख कर रहे हैं जो मैंने ऊपर जोड़ा है? यदि हां, तो कई अनुत्तरित कैविएट थे, और मैं अभी भी "सही" उत्तर (यदि कोई मौजूद है) के बारे में पूरी तरह से निश्चित नहीं हूं। यही कारण है कि मैंने क्वालीफायर जोड़ा, "मैं इसे स्वीकार किए गए सही उत्तर के रूप में पोस्ट कर रहा हूं, लेकिन आगे भी चर्चा के लिए खुला है कि अगर किसी को कुछ जोड़ना है।"
मेग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.