क्या कोई यह बता सकता है कि आम आदमी की शर्तों में प्रोबिट और लॉजिट मॉडल के मामूली प्रभाव की गणना कैसे की जाए?
मैं आंकड़ों के लिए नया हूं और इन दो मॉडलों के बारे में उलझन में हूं।
क्या कोई यह बता सकता है कि आम आदमी की शर्तों में प्रोबिट और लॉजिट मॉडल के मामूली प्रभाव की गणना कैसे की जाए?
मैं आंकड़ों के लिए नया हूं और इन दो मॉडलों के बारे में उलझन में हूं।
जवाबों:
मुझे लगता है कि किसी दिए गए चर के सीमांत प्रभाव को देखने के लिए एक बेहतर तरीका है, कहते हैं , ऊर्ध्वाधर अक्ष पर अनुमानित संभावना का एक बिखराव साजिश का उत्पादन करना है, और क्षैतिज अक्ष पर है। यह सबसे "आम आदमी" तरीका है जिससे मैं यह संकेत करने के बारे में सोच सकता हूं कि एक दिया गया चर कितना प्रभावशाली है। कोई गणित नहीं, सिर्फ तस्वीरें। यदि आपके पास बहुत सारे डेटा पॉइंट हैं, तो एक बॉक्सप्लॉट, या स्कैल्पलॉट स्मूथ, यह देखने में मदद कर सकता है कि अधिकांश डेटा कहां है (केवल अंकों के एक बादल के लिए विरोध के रूप में)।एक्स जे
यह निश्चित नहीं है कि अगला भाग "आम आदमी" कैसा है, लेकिन आपको यह उपयोगी लग सकता है।
यदि हम सीमांत प्रभाव को देखते हैं, तो इसे कहते हैं , यह देखते हुए कि , हम प्राप्त करते हैं जी ( पी ) = Σ कश्मीर एक्स कश्मीर β कश्मीर
इसलिए सीमांत प्रभाव बीटा के अलावा अनुमानित संभावना और लिंक फ़ंक्शन के ग्रेडिएंट पर निर्भर करता है। द्वारा विभाजित , विभेदीकरण के लिए चेन नियम से आता है, और यह तथ्य कि । यह स्पष्ट रूप से सही समीकरण दोनों किनारों को अलग-अलग करके दिखाया जा सकता है । हमारे पास यह भी है कि परिभाषा के अनुसार। एक लॉग मॉडल के लिए, हमारे पास , और सीमांत प्रभाव है:∂ जी - 1 ( जेड ) जेड=छ जी - 1 ( एक्स टी β)=पीजी(पी)=लॉग(पी)-लॉग(1-पी)
इसका क्या मतलब है? अच्छी तरह से और पर शून्य है , और यह पर इसके अधिकतम मान तक पहुंच जाता है । सीमांत प्रभाव तो जब संभावना के पास है सबसे बड़ी है , और सबसे छोटा जब के पास है या पास । हालांकि, अभी भी पर निर्भर करता है , इसलिए सीमांत प्रभाव जटिल हैं। वास्तव में, क्योंकि यह पर निर्भर करता है , आपको अलग-अलग लिए एक अलग सीमांत प्रभाव मिलेगाp = 0 p = 1 0.250.5 पी 0 1 पी ( 1 - पी ) एक्स जे पी एक्स कश्मीर ,मान। संभवतः एक साधारण कारण यह है कि साधारण बिखराव की साजिश - कोवरिएट्स का उपयोग करने के लिए कौन से मूल्यों को चुनने की आवश्यकता नहीं है।
एक प्रोबिट मॉडल के लिए, हमारे पास जहाँ मानक सामान्य CDF है, और मानक सामान्य पीडीएफ है। तो हमें मिलता है: Φ(।)φ(।)
ध्यान दें कि इसमें अधिकांश गुण हैं जो सीमांत प्रभाव के बारे में मैंने पहले चर्चा की है, और किसी भी लिंक फ़ंक्शन के लिए समान रूप से सच है जो (और समझदार, उदाहरण के लिए, बारे में सममित है )। पर निर्भरता अधिक जटिल है, लेकिन अभी भी सामान्य "कूबड़" आकार है (उच्चतम बिंदु , सबसे कम और )। लिंक फ़ंक्शन अधिकतम ऊंचाई के आकार को बदल देगा (उदाहरण के लिए प्रोबेट अधिकतम , लॉगिट ), और कितनी जल्दी सीमांत प्रभाव शून्य की ओर टैप किया जाता है। 0.5 जी ( पी ) = टी एक n ( πपी0.50110.25
effects
आर में पैकेज आसानी से क्षैतिज अक्ष पर ऊर्ध्वाधर अक्ष बनाम एक्स पर भविष्यवाणी की संभावना के इस तरह के भूखंडों का उत्पादन कर सकते हैं। Socialserv.socsci.mcmaster.ca/jfox/Misc/effects/index.html
लॉगिट और प्रोबेट मॉडल आमतौर पर एक संभावना का पता लगाने के लिए उपयोग किया जाता है कि निर्भर चर y 0 या 1 है जो कई इनपुट चर पर आधारित है।
अंग्रेजी में: मान लीजिए कि आप द्विआधारी मूल्य का अनुमान लगाने की कोशिश कर रहे हैं, जैसे कि किसी को उनके जीवन के दौरान हृदय रोग विकसित होगा या नहीं। आपके पास ब्लड प्रेशर, उम्र, चाहे वे धूम्रपान करने वाले हों, उनका बीएमआई, जहां वे रहते हैं, आदि जैसे कई इनपुट चर हैं। वे सभी चर किसी न किसी तरह से हृदय रोग के विकास की संभावना में योगदान कर सकते हैं।
एकल इनपुट चर का सीमांत प्रभाव यदि आप उस चर को थोड़ा बढ़ाते हैं, तो यह हृदय रोग होने की संभावना को कैसे प्रभावित करता है? मान लीजिए कि थोड़ी मात्रा में रक्तचाप बढ़ जाता है, तो इससे हृदय रोग होने की संभावना कैसे बदल जाती है? या यदि आप एक वर्ष तक उम्र बढ़ाते हैं?
इन प्रभावों में से कुछ गैर-रैखिक भी हो सकते हैं: बीएमआई को थोड़ी मात्रा में बढ़ाने से किसी ऐसे व्यक्ति के लिए बहुत अलग प्रभाव हो सकता है, जो किसी ऐसे व्यक्ति की तुलना में बहुत स्वस्थ बीएमआई रखता है जो नहीं करता है।
आप अभी भी अपने आम आदमी को कैलकुलस जानना चाहेंगे, क्योंकि सीमांत प्रभाव ब्याज के चर के संबंध में एक फिट संभावना की व्युत्पत्ति है। जैसा कि फिट होने की संभावना है लिंक फ़ंक्शन (लॉगिट, प्रोबेट या जो भी) फिट किए गए मानों पर लागू होता है, आपको इसे गणना करने के लिए श्रृंखला नियम की आवश्यकता है। तो, रैखिक सूचकांक मॉडल में (जहां पैरामीटर X'b की तरह कुछ दर्ज करते हैं) यह लिंक फ़ंक्शन के व्युत्पन्न समय के अनुमान के पैरामीटर के बराबर है। चूंकि रजिस्टरों के विभिन्न मूल्यों में व्युत्पन्न भिन्न है (रैखिक मॉडल के मामले के विपरीत), आपको यह तय करना होगा, जहां सीमांत प्रभाव का मूल्यांकन करना है। एक प्राकृतिक विकल्प सभी रजिस्टरों के मूल्य का मतलब होगा। एक और तरीका यह होगा कि प्रत्येक अवलोकन के लिए प्रभाव का मूल्यांकन किया जाए और फिर उन पर औसत किया जाए। व्याख्या तदनुसार भिन्न होती है।