दो चर के लॉग के बीच एक रैखिक संबंध होने का सहज अर्थ क्या है?


20

मेरे पास दो चर हैं जो एक दूसरे के खिलाफ साजिश रचने के दौरान बहुत सहसंबंध नहीं दिखाते हैं, लेकिन एक बहुत स्पष्ट रैखिक संबंध है जब मैं प्रत्येक चर के लॉग को फिर से दूसरे को साजिश करता हूं।

तो मैं टाइप के एक मॉडल के साथ समाप्त होगा:

log(Y)=alog(X)+b
, जो गणितीय रूप से बहुत अच्छा है, लेकिन एक नियमित रैखिक मॉडल का व्याख्यात्मक मान नहीं लगता है।

मैं ऐसे मॉडल की व्याख्या कैसे कर सकता हूं?


5
मेरे पास मौजूदा उत्तरों में जोड़ने के लिए पर्याप्त कुछ नहीं है, लेकिन परिणाम और भविष्यवक्ता में एक लघुगणक एक लोच है। उस शब्द की खोजों को उस रिश्ते की व्याख्या के लिए कुछ अच्छे संसाधन खोजने चाहिए, जो बहुत सहज नहीं है।
अपर_कैसे-रोकना मोनिका

लॉग-लॉग मॉडल की व्याख्या, जहां आश्रित चर लॉग (y) है और स्वतंत्र चर लॉग (x) है, है: : । %Δ=β1%Δx
बॉब

3
पूरक लॉग-लॉग लिंक एक आदर्श GLM विनिर्देश है जब परिणाम द्विआधारी (जोखिम मॉडल) होता है और एक्सपोज़र संचयी होता है, जैसे कि यौन साझेदारों की संख्या बनाम एचआईवी संक्रमण। jstor.org/stable/2532454
एडम मै

2
@ यदि आप घटता ओवरले करते हैं तो आप चिपचिपे बिंदु देख सकते हैं। curve(exp(-exp(x)), from=-5, to=5)बनाम कोशिश करें curve(plogis(x), from=-5, to=5)। संधि में तेजी आती है। यदि एक एकल मुठभेड़ से घटना का जोखिम पी था p, तो दूसरी घटना के बाद का जोखिम 1(1p)2 और इसी तरह होना चाहिए , यह एक संभाव्य आकार का लोगो कब्जा नहीं करेगा। उच्च उच्च जोखिम लॉजिस्टिक रिग्रेशन परिणाम को नाटकीय रूप से कम कर देगा (पूर्व संभाव्यता नियम के अनुसार गलत तरीके से)। कुछ सिमुलेशन आपको यह दिखाते हैं।
एडम २

1
@ अदमो संभवत: एक ऐसा शैक्षणिक पत्र है जिसमें ऐसे सिमुलेशन को शामिल किया गया है जो प्रेरित करता है कि तीनों में से एक विशेष द्विविभाजन परिणाम लिंक को कैसे चुना जाए, जिसमें ऐसी परिस्थितियां शामिल हैं जहां यह होता है और इससे कोई फर्क नहीं पड़ता।
एलेक्सिस

जवाबों:


27

आपको बस समीकरण के दोनों पक्षों का विस्तार करने की आवश्यकता है और आपको एक संभावित संबंध मिलेगा, जो कुछ डेटा के लिए समझ में आता है।

log(Y)=alog(X)+b

exp(log(Y))=exp(alog(X)+b)

Y=ebXa

और चूँकि सिर्फ एक पैरामीटर है जो किसी भी सकारात्मक मान को ले सकता है, यह मॉडल इसके बराबर है:eb

Y=cXa

यह ध्यान दिया जाना चाहिए कि मॉडल अभिव्यक्ति में त्रुटि शब्द शामिल होना चाहिए, और चर के इन परिवर्तनों का उस पर दिलचस्प प्रभाव पड़ता है:

log(Y)=alog(X)+b+ϵ

Y=ebXaexp(ϵ)

अर्थात, ओएलएस (सामान्य रूप से स्थिर विचरण के साथ सामान्य रूप से वितरित त्रुटियों) के लिए शर्तों का पालन करने वाले एक योजक त्रुटियों के साथ आपका मॉडल गुणात्मक त्रुटियों के साथ एक संभावित मॉडल के बराबर है जिसका लघुगणक निरंतर विचरण के साथ एक सामान्य वितरण का अनुसरण करता है।


3
ओपी यह जानने के लिए इच्छुक हो सकता है कि इस वितरण का एक नाम है, लॉग-नॉर्मल: en.wikipedia.org/wiki/Log-normal_distribution
gardenhead

2
जेनसन की असमानता के प्रभाव के बारे में क्या? आम तौर पर के लिए उत्तल जी,E[g(X)]g(E[X])
आँकड़े

14

आप अपना मॉडल और कुल अंतर की गणना कर सकते हैं, आप कुछ इस तरह से समाप्त करेंगे: जो पैदावार करता है log(Y)=alog(X)+b

1YdY=a1XdX
dYdXXY=a

इसलिए गुणांक में से एक सरल व्याख्या प्रतिशत में आया बदलाव हो जाएगा में एक प्रतिशत परिवर्तन के लिए । इसका तात्पर्य यह है कि चर , की वृद्धि दर के निरंतर अंश ( ) पर ।aYXYएक्सaX


तो अगर लॉग-लॉग प्लॉट रैखिक है, तो यह एक निरंतर विकास दर होगा?
दिमित्री वी। मास्टरोव

वास्तव में नहीं, की वृद्धि दर स्थिर रहेगी और यदि केवल । = 0Ya=0
आरएसक्रेली

समय के साथ नहीं, x में वृद्धि के संबंध में विकास दर।
दिमित्री वी। मास्टरोव

पुनर्व्यवस्था मदद नहीं, मैं इसे हटाने होता है
Aksakal

1
@ DimitriyV.Masterov ठीक है, तब से में रैखिक है, इसका मतलब है कि चर , की वृद्धि दर के निरंतर अंश पर बढ़ता है । क्या आपके अनुसार मेरे उत्तर में कुछ गड़बड़ है? लॉग ( X ) Y Xlog(Y)log(X)YX
आरएसक्रेली

7

Intuitively हमें एक चर की परिमाण का आदेश देता है , इसलिए हम संबंध को देख सकते हैं क्योंकि दो चर के परिमाण के क्रम रैखिक रूप से संबंधित हैं। उदाहरण के लिए, परिमाण के एक क्रम से भविष्यवक्ता बढ़ाना प्रतिक्रिया के परिमाण के तीन आदेशों की वृद्धि के साथ जुड़ा हो सकता है।log

लॉग-लॉग प्लॉट का उपयोग करते समय हम एक रैखिक संबंध देखने की उम्मीद करते हैं। इस प्रश्न से एक उदाहरण का उपयोग करके , हम रैखिक मॉडल मान्यताओं की जांच कर सकते हैं:

लॉग-लॉग


3
एक unintuitive अवधारणा के लिए एक सहज जवाब के लिए +1। हालाँकि, आपके द्वारा शामिल की गई छवि पूर्वसूचक के निरंतर त्रुटि विचलन का स्पष्ट रूप से उल्लंघन करती है।
फ्रैंस रोडेनबर्ग

1
इसका उत्तर सही है, लेकिन प्राधिकरण का अधिकार गलत है। छवि Google छवियों के लिए जिम्मेदार नहीं होनी चाहिए, लेकिन कम से कम, वेब पेज पर जहां यह पाया जाना है, वह Google छवियों में क्लिक करके ही पता लगाया जा सकता है।
पेरे

@ क्या मुझे दुर्भाग्य से छवि का मूल स्रोत नहीं मिल रहा है (कम से कम रिवर्स इमेज सर्च का उपयोग करके)
qwr

यह मूल रूप से आने के लिए लगता है diagramss.us कि हालांकि साइट के बंद होने और इसके अधिकांश पृष्ठों को वेब संग्रह में अलग से नहीं कर रहे हैं अपने होमपेज
हेनरी

4

वास्तविक असतत डेटा के साथ @Rscrill द्वारा उत्तर को फिर से समझना, विचार करें

log(Yt)=alog(Xt)+b,log(Yt1)=alog(Xt1)+b

log(Yt)log(Yt1)=a[log(Xt)log(Xt1)]

परंतु

log(Yt)log(Yt1)=log(YtYt1)log(Yt1+ΔYtYt1)=log(1+ΔYtYt1)

ΔYtYt1 , अवधि और बीच का प्रतिशत परिवर्तन है , या की वृद्धि दर , । जब यह से छोटा है , तो हमारे पास एक स्वीकार्य अनुमान हैYt1tYtgYt0.1

log(1+ΔYtYt1)ΔYtYt1=gYt

इसलिए हम प्राप्त करते हैं

gYtagXt

जो अनुभवजन्य अध्ययनों में @Rscrill के सैद्धांतिक उपचार को मान्य करता है।


1
यह शायद वही है जो एक गणितज्ञ सहज कहेंगे :)
रिचर्ड हार्डी

2

लॉग के बीच एक रैखिक संबंध एक शक्ति कानून निर्भरता के बराबर है : भौतिकी में इस तरह के व्यवहार का मतलब है कि सिस्टम स्केल फ्री या स्केल इनवेरिएंट है । एक उदाहरण के रूप में, यदि दूरी या समय है , तो इसका मतलब है कि पर निर्भरता की विशेषता एक विशेषता लंबाई या समय के पैमाने के रूप में नहीं हो सकती है (जैसा कि घातीय किरणों के विपरीत)। नतीजतन, ऐसी प्रणाली पर की लंबी दूरी की निर्भरता दर्शाती है ।

YXα
X X Y XXXYX

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.