प्रॉबिट और लॉजिट मॉडल के सीमांत प्रभाव


12

क्या कोई यह बता सकता है कि आम आदमी की शर्तों में प्रोबिट और लॉजिट मॉडल के मामूली प्रभाव की गणना कैसे की जाए?

मैं आंकड़ों के लिए नया हूं और इन दो मॉडलों के बारे में उलझन में हूं।


ध्यान दें कि जो संख्याएं प्रोबेट और लॉजिट मॉडल से निकलती हैं, वे ऐसी दिखती हैं जैसे कि वे लगभग एक ही चीज को मापती हैं, लेकिन अक्सर अलग-अलग होती हैं। जब आप उन्हें वास्तविक जीवन में वापस अनुवादित करते हैं, तो दोनों के बीच का अंतर आमतौर पर बहुत छोटा हो जाता है।
हेनरी

जवाबों:


15

मुझे लगता है कि किसी दिए गए चर के सीमांत प्रभाव को देखने के लिए एक बेहतर तरीका है, कहते हैं , ऊर्ध्वाधर अक्ष पर अनुमानित संभावना का एक बिखराव साजिश का उत्पादन करना है, और क्षैतिज अक्ष पर है। यह सबसे "आम आदमी" तरीका है जिससे मैं यह संकेत करने के बारे में सोच सकता हूं कि एक दिया गया चर कितना प्रभावशाली है। कोई गणित नहीं, सिर्फ तस्वीरें। यदि आपके पास बहुत सारे डेटा पॉइंट हैं, तो एक बॉक्सप्लॉट, या स्कैल्पलॉट स्मूथ, यह देखने में मदद कर सकता है कि अधिकांश डेटा कहां है (केवल अंकों के एक बादल के लिए विरोध के रूप में)।एक्स जेXjXj

यह निश्चित नहीं है कि अगला भाग "आम आदमी" कैसा है, लेकिन आपको यह उपयोगी लग सकता है।

यदि हम सीमांत प्रभाव को देखते हैं, तो इसे कहते हैं , यह देखते हुए कि , हम प्राप्त करते हैं जी ( पी ) = Σ कश्मीर एक्स कश्मीर β कश्मीरmjg(p)=kXkβk

mj=pXj=βjg[g1(XTβ)]=βjg(p)

इसलिए सीमांत प्रभाव बीटा के अलावा अनुमानित संभावना और लिंक फ़ंक्शन के ग्रेडिएंट पर निर्भर करता है। द्वारा विभाजित , विभेदीकरण के लिए चेन नियम से आता है, और यह तथ्य कि । यह स्पष्ट रूप से सही समीकरण दोनों किनारों को अलग-अलग करके दिखाया जा सकता है । हमारे पास यह भी है कि परिभाषा के अनुसार। एक लॉग मॉडल के लिए, हमारे पास , और सीमांत प्रभाव है:जी - 1 ( जेड )g(p) जेड=g1(z)z=1g[g1(z)] जी - 1 ( एक्स टी β)=पीजी(पी)=लॉग(पी)-लॉग(1-पी)z=g[g1(z)]g1(XTβ)=pg(p)=log(p)log(1p)g(p)=1p+11p=1p(1p)

mjlogit=βjp(1p)

इसका क्या मतलब है? अच्छी तरह से और पर शून्य है , और यह पर इसके अधिकतम मान तक पहुंच जाता है । सीमांत प्रभाव तो जब संभावना के पास है सबसे बड़ी है , और सबसे छोटा जब के पास है या पास । हालांकि, अभी भी पर निर्भर करता है , इसलिए सीमांत प्रभाव जटिल हैं। वास्तव में, क्योंकि यह पर निर्भर करता है , आपको अलग-अलग लिए एक अलग सीमांत प्रभाव मिलेगाp = 0 p = 1 0.25p(1p)p=0p=10.250.5 पी 0 1 पी ( 1 - पी ) एक्स जे पी एक्स कश्मीर ,p=0.50.5p01p(1p)XjpXk,kjमान। संभवतः एक साधारण कारण यह है कि साधारण बिखराव की साजिश - कोवरिएट्स का उपयोग करने के लिए कौन से मूल्यों को चुनने की आवश्यकता नहीं है।

एक प्रोबिट मॉडल के लिए, हमारे पास जहाँ मानक सामान्य CDF है, और मानक सामान्य पीडीएफ है। तो हमें मिलता है: Φ()φ()g(p)=Φ1(p)g(p)=1ϕ[Φ1(p)]Φ(.)ϕ(.)

mjprobit=βjϕ[Φ1(p)]

ध्यान दें कि इसमें अधिकांश गुण हैं जो सीमांत प्रभाव के बारे में मैंने पहले चर्चा की है, और किसी भी लिंक फ़ंक्शन के लिए समान रूप से सच है जो (और समझदार, उदाहरण के लिए, बारे में सममित है )। पर निर्भरता अधिक जटिल है, लेकिन अभी भी सामान्य "कूबड़" आकार है (उच्चतम बिंदु , सबसे कम और )। लिंक फ़ंक्शन अधिकतम ऊंचाई के आकार को बदल देगा (उदाहरण के लिए प्रोबेट अधिकतम , लॉगिट ), और कितनी जल्दी सीमांत प्रभाव शून्य की ओर टैप किया जाता है। 0.5 जी ( पी ) = टी एक n ( πmjlogit0.5पी0.5011g(p)=tan(π2[2p1])p0.5010.2512π0.40.25


effectsआर में पैकेज आसानी से क्षैतिज अक्ष पर ऊर्ध्वाधर अक्ष बनाम एक्स पर भविष्यवाणी की संभावना के इस तरह के भूखंडों का उत्पादन कर सकते हैं। Socialserv.socsci.mcmaster.ca/jfox/Misc/effects/index.html
Landroni


5

लॉगिट और प्रोबेट मॉडल आमतौर पर एक संभावना का पता लगाने के लिए उपयोग किया जाता है कि निर्भर चर y 0 या 1 है जो कई इनपुट चर पर आधारित है।

अंग्रेजी में: मान लीजिए कि आप द्विआधारी मूल्य का अनुमान लगाने की कोशिश कर रहे हैं, जैसे कि किसी को उनके जीवन के दौरान हृदय रोग विकसित होगा या नहीं। आपके पास ब्लड प्रेशर, उम्र, चाहे वे धूम्रपान करने वाले हों, उनका बीएमआई, जहां वे रहते हैं, आदि जैसे कई इनपुट चर हैं। वे सभी चर किसी न किसी तरह से हृदय रोग के विकास की संभावना में योगदान कर सकते हैं।

एकल इनपुट चर का सीमांत प्रभाव यदि आप उस चर को थोड़ा बढ़ाते हैं, तो यह हृदय रोग होने की संभावना को कैसे प्रभावित करता है? मान लीजिए कि थोड़ी मात्रा में रक्तचाप बढ़ जाता है, तो इससे हृदय रोग होने की संभावना कैसे बदल जाती है? या यदि आप एक वर्ष तक उम्र बढ़ाते हैं?

इन प्रभावों में से कुछ गैर-रैखिक भी हो सकते हैं: बीएमआई को थोड़ी मात्रा में बढ़ाने से किसी ऐसे व्यक्ति के लिए बहुत अलग प्रभाव हो सकता है, जो किसी ऐसे व्यक्ति की तुलना में बहुत स्वस्थ बीएमआई रखता है जो नहीं करता है।


1

आप अभी भी अपने आम आदमी को कैलकुलस जानना चाहेंगे, क्योंकि सीमांत प्रभाव ब्याज के चर के संबंध में एक फिट संभावना की व्युत्पत्ति है। जैसा कि फिट होने की संभावना है लिंक फ़ंक्शन (लॉगिट, प्रोबेट या जो भी) फिट किए गए मानों पर लागू होता है, आपको इसे गणना करने के लिए श्रृंखला नियम की आवश्यकता है। तो, रैखिक सूचकांक मॉडल में (जहां पैरामीटर X'b की तरह कुछ दर्ज करते हैं) यह लिंक फ़ंक्शन के व्युत्पन्न समय के अनुमान के पैरामीटर के बराबर है। चूंकि रजिस्टरों के विभिन्न मूल्यों में व्युत्पन्न भिन्न है (रैखिक मॉडल के मामले के विपरीत), आपको यह तय करना होगा, जहां सीमांत प्रभाव का मूल्यांकन करना है। एक प्राकृतिक विकल्प सभी रजिस्टरों के मूल्य का मतलब होगा। एक और तरीका यह होगा कि प्रत्येक अवलोकन के लिए प्रभाव का मूल्यांकन किया जाए और फिर उन पर औसत किया जाए। व्याख्या तदनुसार भिन्न होती है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.