लॉग ट्रांसफ़ॉर्म किए गए पूर्वानुमान और / या प्रतिक्रिया की व्याख्या


46

मुझे आश्चर्य हो रहा है कि क्या यह व्याख्या में फर्क करता है कि क्या केवल आश्रित, आश्रित और स्वतंत्र, या केवल स्वतंत्र चर ही रूपांतरित हैं।

के मामले पर विचार करें

log(DV) = Intercept + B1*IV + Error 

मैं IV की व्याख्या प्रतिशत वृद्धि के रूप में कर सकता हूं लेकिन मेरे पास होने पर यह कैसे बदलता है

log(DV) = Intercept + B1*log(IV) + Error

या जब मेरे पास है

DV = Intercept + B1*log(IV) + Error

?


1
मुझे लगता है कि "प्रतिशत वृद्धि" की व्याख्या सही नहीं है, लेकिन मेरे पास यह कहने के लिए पर्याप्त समझ नहीं है कि वास्तव में क्यों। मुझे आशा है कि कोई मदद कर सकता है .... इससे परे, मैं लॉग का उपयोग करके मॉडलिंग करने की सलाह दूंगा यदि वे XY संबंध बेहतर बनाने में मदद करते हैं, लेकिन मूल चर का उपयोग करके उस संबंध के चयनित उदाहरणों की रिपोर्टिंग करते हैं। खासकर अगर ऐसे दर्शकों से निपटना जो तकनीकी रूप से बहुत समझदार नहीं हैं।
rolando2

3
@ rolando2: मैं असहमत हूं। यदि एक वैध मॉडल को परिवर्तन की आवश्यकता होती है, तो एक मान्य व्याख्या आमतौर पर रूपांतरित मॉडल से गुणांक पर निर्भर करेगी। यह अन्वेषक के लिए दर्शकों पर उन गुणांकों के अर्थ को उचित रूप से संप्रेषित करने के लिए बना रहता है। यही है, निश्चित रूप से, हमें इतनी बड़ी रकम का भुगतान क्यों किया जाता है कि पहले वेतन को लॉग इन करना पड़ता है।
jthetzel

1
@BigBucks: ठीक है, इसे इस तरह से देखें। मान लीजिए कि आपके श्रोता सिर्फ यह नहीं समझ सकते हैं कि आप का क्या मतलब है जब आप समझाते हैं कि X के लॉग (बेस 10) में 1 के हर बदलाव के लिए Y, b द्वारा बदल जाएगा। लेकिन मान लीजिए कि वे 10, 100 और 1000 के एक्स मानों का उपयोग करके 3 उदाहरणों को समझ सकते हैं। वे इस बिंदु पर संभवतः रिश्ते के गैर-प्रकृति पर पकड़ लेंगे। आप अभी भी समग्र, लॉग-आधारित बी की रिपोर्ट कर सकते हैं, लेकिन उन उदाहरणों को देने से सभी अंतर हो सकते हैं।
रोलैंडो 2

1
.... हालाँकि अब जब मैंने आपके महान विवरण को नीचे पढ़ा है, तो शायद उन "टेम्प्लेट" का उपयोग करने से हमें समझ में आने वाली इन समस्याओं को दूर करने में बहुत मदद मिल सकती है।
rolando2

जवाबों:


42

चार्ली एक अच्छा, सही स्पष्टीकरण प्रदान करता है। यूसीएलए में सांख्यिकीय कम्प्यूटिंग साइट के कुछ और उदाहरण हैं: http://www.ats.ucla.edu/stat/sas/faq/sas_interpret_log.htm , और http://www.ats.ucla.edu/stat/mult_pkg/ पूछे जाने वाले प्रश्न / सामान्य / log_transformed_regression.htm

बस चार्ली के जवाब के पूरक के लिए, नीचे आपके उदाहरणों की विशिष्ट व्याख्याएं हैं। हमेशा की तरह, गुणांक व्याख्याएं मानती हैं कि आप अपने मॉडल का बचाव कर सकते हैं, कि प्रतिगमन निदान संतोषजनक हैं, और यह कि डेटा एक वैध अध्ययन से हैं।

उदाहरण A : कोई परिवर्तन नहीं

DV = Intercept + B1 * IV + Error 

"IV में एक B1इकाई वृद्धि DV में एक ( ) इकाई वृद्धि से जुड़ी है ।"

उदाहरण बी : परिणाम बदल गया

log(DV) = Intercept + B1 * IV + Error 

"IV में एक इकाई वृद्धि B1 * 100डीवी में ( ) प्रतिशत वृद्धि के साथ जुड़ी हुई है।"

उदाहरण C : एक्सपोज़र रूपांतरित

DV = Intercept + B1 * log(IV) + Error 

"IV में एक प्रतिशत की वृद्धि B1 / 100DV में ( ) इकाई वृद्धि से जुड़ी है ।"

उदाहरण D : आउटकम ट्रांसफ़ॉर्म हो गया और एक्सपोज़र ट्रांसफ़ॉर्म हो गया

log(DV) = Intercept + B1 * log(IV) + Error 

"IV में एक B1प्रतिशत वृद्धि डीवी में ( ) प्रतिशत वृद्धि के साथ जुड़ी है ।"


1
क्या ये व्याख्याएं लघुगणक के आधार की परवाह किए बिना रखती हैं?
अयालेव ए।

उदाहरण बी: आउटकम ट्रांसफॉर्म्ड लॉग (डीवी) = इंटरसेप्ट + बी 1 * आईवी + एरर "आईवी में एक यूनिट की वृद्धि डीवी में (बी 1 * 100) प्रतिशत की वृद्धि के साथ जुड़ी हुई है। इस मामले में, यदि आप 30 प्रतिशत चाहते हैं तो आप कैसे करते हैं? DV कमी। आपके उत्तर के लिए धन्यवाद
Antouria

तो एक DV ~ B1 * लॉग (IV) शून्य बाउंडेड निरंतर निर्भर चर के लिए एक अच्छा मॉडल है?
बकाबुर्ग

2
मुझे भ्रम हो सकता है। यदि आप परिणाम को लॉग-ट्रांसफ़ॉर्म करते हैं, तो आपको गुणात्मक अंतर को खोजने के लिए गुणांक को फिर से प्रतिपादक करना होगा। लॉग स्केल पर इसकी व्याख्या करना केवल एक सन्निकटन के रूप में काम करता है जब अनुपात 1. के करीब होता है
एडम डे

लिंक टूट गए हैं।
निक कॉक्स

22

β1=log(y)log(x).
log(y)y=1y
log(y)=yy.
yx

β1yx

उसी तर्क के बाद, स्तर-लॉग मॉडल के लिए, हमारे पास है

β1=ylog(x)=100y100×log(x).
β1/100yएक्स

लॉग(y)=yy?

1
लॉग(y)yyyy1-y0yyy

7

रेखीय प्रतिगमन का मुख्य उद्देश्य एक प्रतिगामी के समीपस्थ स्तरों की तुलना में परिणामों के औसत अंतर का अनुमान लगाना है। साधन कई प्रकार के होते हैं। हम अंकगणित माध्य से सबसे अधिक परिचित हैं।

(एक्स)=(एक्स1+एक्स2+...+एक्सn)n

AM वह है जो अनुमानित रूप से OLS और अनियंत्रित चर का उपयोग कर रहा है। ज्यामितीय माध्य अलग है:

जी(एक्स)=(एक्स1×एक्स2×...×एक्सn)n=exp((लॉग(एक्स))

यहाँ छवि विवरण दर्ज करें

व्यावहारिक रूप से एक जीएम अंतर एक गुणात्मक अंतर है: आप एक प्रीमियम का एक्स% ब्याज का भुगतान करते हैं जब ऋण लेते हैं, तो आपके हीमोग्लोबिन का स्तर मेटफॉर्मिन शुरू करने के बाद एक्स% कम हो जाता है, स्प्रिंग्स की विफलता दर चौड़ाई के एक अंश के रूप में एक्स% बढ़ जाती है। इन सभी उदाहरणों में, एक कच्चा मतलब अंतर कम समझ में आता है।

log(y) ~ xβ1एक्सβ1

β1=0.40

लॉग(एक्स)1-एक्सएक्सexp(0.05)1.05एक्सexp(0.5)=1.65Yएक्स

y ~ log(x, base=2)एक्सएक्सβ1

अंत में, log(y) ~ log(x)बस दोनों परिभाषाओं को लागू करने के लिए गुणक अंतर प्राप्त करने के लिए दोनों की तुलना समूहों के जोखिम के स्तर में गुणा भिन्नता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.