प्रभाव कार्यों और OLS


15

मैं यह समझने की कोशिश कर रहा हूं कि कार्य कैसे प्रभावित करते हैं। क्या कोई साधारण OLS प्रतिगमन के संदर्भ में व्याख्या कर सकता है

yi=α+βxi+εi

जहाँ मैं लिए प्रभाव कार्य करना चाहता हूँ ।β


2
यहां अभी तक कोई विशिष्ट प्रश्न नहीं है: क्या आप यह देखना चाहते हैं कि प्रभाव फ़ंक्शन की गणना कैसे की जाती है? क्या आप एक विशिष्ट अनुभवजन्य उदाहरण चाहते हैं? इसका क्या अर्थ है, इसका एक व्याख्यात्मक विवरण?
whuber

1
यदि आप फ्रैंक क्रिचले के 1986 के पेपर "प्रिंसिपल कंपोनेंट्स में प्रभाव कार्यों" को देखते हैं (पेपर का सटीक नाम याद नहीं कर सकते हैं)। वह यहां साधारण प्रतिगमन के लिए प्रभाव समारोह को परिभाषित करता है (जो मेरे उत्तर को गलत साबित कर सकता है या नहीं भी)।
प्रोबेबिलिसलॉजिक

जवाबों:


15

प्रभाव कार्य मूल रूप से एक विश्लेषणात्मक उपकरण है जिसका उपयोग उस सांख्यिकीय के पुन: गणना किए बिना किसी आंकड़े के मूल्य पर एक अवलोकन को हटाने के प्रभाव (या "प्रभाव") का आकलन करने के लिए किया जा सकता है । उनका उपयोग स्पर्शोन्मुख विचरण अनुमान बनाने के लिए भी किया जा सकता है। यदि प्रभाव बराबर होता है तो स्पर्शोन्मुख विचरण I 2 हैII2n

प्रभाव कार्यों को समझने का तरीका इस प्रकार है। आपके पास कुछ प्रकार की सैद्धांतिक CDF है, जिसे द्वारा निरूपित किया गया है । सरल OLS के लिए, आपके पास हैFi(y)=Pr(Yi<yi)

कहाँΦ(जेड)मानक सामान्य CDF है, औरσ2त्रुटि विचरण है। अब आप यह दिखा सकते हैं कि कोई भी आँकड़ा इस CDF का कार्य होगा, इसलिए संकेतनS(F)(अर्थातFका कुछ कार्य)। अब मान लीजिए कि हम समारोह बदलएफएक "छोटा सा" द्वारा, के लिएएफ(मैं)(z)=(1+ζ)एफ(जेड)-ζδ(मैं)(

Pr(Yi<yi)=Pr(α+βxi+ϵi<yi)=Φ(yi(α+βxi)σ)
Φ(z)σ2S(F)FF कहाँ δ मैं ( z ) = मैं ( y मैं < z ) , और ζ = 1F(i)(z)=(1+ζ)F(z)ζδ(i)(z)δi(z)=I(yi<z) । इस प्रकारF(i)डेटा के CDF को "ith" डेटा बिंदु के साथ हटा देता है। हम की एक टेलर श्रृंखला कर सकते हैंएफ(मैं)(जेड)के बारे मेंζ=0। यह देता है:ζ=1n1F(i)F(i)(z)ζ=0

S[F(i)(z,ζ)]S[F(i)(z,0)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

ध्यान दें कि इसलिए हम प्राप्त करते हैं: S [ F ( i ) ( z , ) ] ζ S [ F ( z ) ] + ζ [ S [ F ( i ) ( z , ζ ) ]F(i)(z,0)=F(z)

S[F(i)(z,ζ)]S[F(z)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

यहां आंशिक व्युत्पन्न को प्रभाव समारोह कहा जाता है। तो यह "ith" अवलोकन को हटाने के कारण एक सांख्यिकीय के लिए किए जाने वाले लगभग "पहले क्रम" सुधार का प्रतिनिधित्व करता है। ध्यान दें कि प्रतिगमन में शेष असममित रूप से शून्य नहीं जाता है, ताकि यह उन परिवर्तनों का एक अनुमान हो जो आपको वास्तव में मिल सकते हैं। अब as: लिखेंβ

β=1nj=1n(yjy¯)(xjx¯)1nj=1n(xjx¯)2

इस प्रकार बीटा दो आँकड़ों का एक कार्य है: X और Y के बीच X और सहसंयोजी का विचरण। इन दोनों आँकड़ों का CDF के रूप में प्रतिनिधित्व है:

और v a r ( X ) = ( X - μ x ( F ) ) 2 d एफ जहां μ एक्स = एक्स डी एफ

cov(X,Y)=(Xμx(F))(Yμy(F))dF
var(X)=(Xμx(F))2dF
μx=xdF

FF(i)=(1+ζ)Fζδ(i)

μx(i)=xd[(1+ζ)Fζδ(i)]=μxζ(xiμx)
Var(X)(i)=(Xμx(i))2dF(i)=(Xμx+ζ(xiμx))2d[(1+ζ)Fζδ(i)]

ζ2

वीआर(एक्स)(मैं)वीआर(एक्स)-ζ[(एक्समैं-μएक्स)2-वीआर(एक्स)]
Cov(X,Y)(i)Cov(X,Y)ζ[(xiμx)(yiμy)Cov(X,Y)]

β(i)ζ

β(i)(ζ)Cov(X,Y)ζ[(xiμx)(yiμy)Cov(X,Y)]Var(X)ζ[(xiμx)2Var(X)]

अब हम टेलर श्रृंखला का उपयोग कर सकते हैं:

β(i)(ζ)β(i)(0)+ζ[β(i)(ζ)ζ]ζ=0

इसे सरल बनाता है:

β(i)(ζ)βζ[(xiμx)(yiμy)Var(X)β(xiμx)2Var(X)]

μyμxvar(X)ζ=1n1

β(i)βxix¯n1[yiy¯1nj=1n(xjx¯)2βxix¯1nj=1n(xjx¯)2]

x~=xx¯sx

β(i)βxi~n1[yi~sysxxi~β]

तो कहानी अतिरिक्त डेटा बिंदु के प्रभाव के बारे में है? मैंने समय श्रृंखला के आंकड़ों के लिए आवेग प्रतिक्रिया का अधिक इस्तेमाल किया, सांख्यिकीय संदर्भ में सभी प्रभाव सीमांत प्रभाव या मानकीकृत प्रतिगमन से बीटा गुणांक द्वारा वर्णित किया जाएगा। वैसे मुझे वास्तव में प्रश्न और उत्तर का न्याय करने के लिए अधिक संदर्भ की आवश्यकता है, लेकिन यह एक अच्छा है, मुझे लगता है (+1 अभी तक नहीं है लेकिन इंतजार कर रहा है)।
१६:४३ पर १६:११ पर पापेल सेलोव

@dmitrij - यह वही है जो लिंक से निहित था (या मुझे क्या पता था) - यह एक आंकड़े की मजबूती गुणों के बारे में है। प्रभाव फ़ंक्शन 1 डेटा बिंदु की तुलना में थोड़ा अधिक सामान्य हैं - आप डेल्टा फ़ंक्शन को उनमें से एक राशि (इसलिए कई अवलोकन) को फिर से परिभाषित कर सकते हैं। मैं इसे कुछ हद तक "सस्ते जैकनेफ" के रूप में सोचूंगा - क्योंकि आपको मॉडल के पुन: फिटिंग की आवश्यकता नहीं है।
प्रोबेबिलिसलॉजिक

10

एक प्रतिगमन के प्रभाव कार्यों के बारे में बात करने के लिए यहां एक सुपर सामान्य तरीका है। पहले मैं प्रभाव कार्यों को प्रस्तुत करने के एक तरीके से निपटने जा रहा हूँ:

एफΣएफε(एक्स)

एफε(एक्स)=(1-ε)एफ+εδएक्स
δएक्सΣ{एक्स}Σ

इससे हम प्रभाव फ़ंक्शन को आसानी से परिभाषित कर सकते हैं:

θ^एफψमैं:एक्सΓ

ψθ^,एफ(एक्स)=लिमε0θ^(एफε(एक्स))-θ^(एफ)ε

θ^एफδएक्स

OLS अनुमान समस्या का हल है:

θ^=आर्गमिनटθ[(Y-एक्सθ)टी(Y-एक्सθ)]

(एक्स,y)

θ^ε=आर्गमिनटθ(1-ε)[(Y-एक्सθ)टी(Y-एक्सθ)]+ε(y-एक्सθ)टी(y-एक्सθ)

पहले आदेश की स्थिति लेना:

{(1-ε)[एक्सटीएक्स]+εएक्सटीएक्स}θ^ε=(1-ε)[एक्सटीY]+εएक्सटीy

चूंकि प्रभाव समारोह सिर्फ गैटॉक्स व्युत्पन्न है, जिसे हम अब कह सकते हैं:

-([एक्सटीएक्स]+एक्सटीएक्स)θ^ε+[एक्सटीएक्स]ψθ(एक्स,y)=-[एक्सटीY]+एक्सटीy

ε=0θ^ε=θ^=[एक्सटीएक्स]-1[एक्सटीY]

ψθ(एक्स,y)=[एक्सटीएक्स]-1एक्सटी(y-एक्सθ)

इस प्रभाव समारोह का परिमित नमूना प्रतिरूप है:

ψθ(एक्स,y)=(1एनΣमैंएक्समैंटीएक्समैं)-1एक्सटी(y-एक्सθ)

सामान्य तौर पर मुझे यह ढांचा (प्रभाव कार्यों के साथ काम करने के लिए गैटॉक्स डेरिवेटिव के रूप में) से निपटने के लिए आसान लगता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.