क्या सहसंबंध डेटा की स्थिरता को मानता है?


27

अंतर-बाजार विश्लेषण विभिन्न बाजारों के बीच संबंधों को खोजने के माध्यम से बाजार के व्यवहार को मॉडलिंग करने की एक विधि है। S & P 500 और 30-साल के अमेरिकी कोषों के अनुसार, कई बार, दो बाजारों के बीच एक संबंध की गणना की जाती है। ये गणना अधिक बार मूल्य डेटा पर आधारित नहीं होती हैं, जो सभी के लिए स्पष्ट है कि यह स्थिर समय श्रृंखला की परिभाषा में फिट नहीं होती है।

संभावित समाधान एक तरफ (रिटर्न का उपयोग करके), सहसंबंध की गणना है जिसका डेटा गैर-स्थिर भी एक वैध सांख्यिकीय गणना है?

क्या आप कहेंगे कि इस तरह के सहसंबंध की गणना कुछ अविश्वसनीय है, या सिर्फ सादा बकवास है?


1
"वैध सांख्यिकीय गणना" से आपका क्या तात्पर्य है, आपको किसी चीज़ की वैध सांख्यिकीय (अनुमान) गणना कहनी चाहिए। यहाँ कुछ बहुत महत्वपूर्ण है। सहसंबंध डेटा के दो सेट के बीच रैखिक संबंध की एक वैध गणना है। मैं यह नहीं देखता कि आपको स्थिरता की आवश्यकता क्यों है, क्या आपका मतलब ऑटो-सहसंबंध है?
रोबिन जिरार्ड

2
एक नई साइट है जो आपके प्रश्न के लिए अधिक उपयुक्त हो सकती है: quant.stackexchange.com । अब आप स्पष्ट रूप से व्याख्या के साथ गणना भ्रमित कर रहे हैं।
एमपिकटस

@mpiktas, क्वांट समुदाय रिटर्न की स्थिरता और कीमतों की गैर-स्थिरता के कारण रिटर्न बनाम कीमतों का उपयोग करने पर बसा है। मैं यहाँ एक सहज व्याख्या की तुलना में कुछ के लिए पूछ रहा हूँ कि ऐसा क्यों होना चाहिए।
मिल्कट्रैडर

@robin, कई चीजें हैं जो आपके सांख्यिकीय विश्लेषण पर सवाल उठा सकती हैं। नमूना का आकार समझ में आता है, जैसे कि अधिक स्पष्ट चीजें जैसे कि हेरफेर किए गए डेटा। क्या डेटा की गैर-स्थिरता प्रश्न में सहसंबंध की गणना है?
मिल्कट्रैडर

गणना नहीं, शायद व्याख्या यदि सहसंबंध अधिक नहीं है। यदि यह उच्च है तो इसका अर्थ है उच्च सहसंबंध (यानी उच्च रैखिक संबंध), दो गैर स्थिर समय श्रृंखला कहती हैं और ( Y t ) संभावित रूप से अत्यधिक सहसंबद्ध हो सकती हैं (उदाहरण के लिए जब X t = Y t(Xt)(Yt)Xt=Yt
रॉबिन गिर्ल

जवाबों:


37

सहसंबंध रैखिक संबंध को मापता है। अनौपचारिक संदर्भ में संबंध का अर्थ कुछ स्थिर है। जब हम स्थिर चरों के लिए नमूना सहसंबंध की गणना करते हैं और उपलब्ध डेटा बिंदुओं की संख्या में वृद्धि करते हैं तो यह नमूना सहसंबंध सही संबंध में बदल जाता है।

यह दिखाया जा सकता है कि कीमतों के लिए, जो आमतौर पर यादृच्छिक चलता है, नमूना सहसंबंध यादृच्छिक चर के लिए जाता है। इसका मतलब यह है कि हमारे पास कितना भी डेटा हो, परिणाम हमेशा अलग होगा।

नोट मैंने गणित के बिना गणितीय अंतर्ज्ञान व्यक्त करने की कोशिश की। गणितीय दृष्टिकोण से स्पष्टीकरण बहुत स्पष्ट है: स्थिर प्रक्रियाओं के नमूना क्षणों को स्थिरांक में संभावना में परिवर्तित किया जाता है। यादृच्छिक चलता का नमूना क्षण ब्राउनियन गति के अभिन्न अंग में परिवर्तित होता है जो यादृच्छिक चर हैं। चूँकि रिश्ते को आमतौर पर एक संख्या के रूप में व्यक्त किया जाता है और एक यादृच्छिक चर के रूप में नहीं, गैर-स्थिर चर के लिए सहसंबंध की गणना नहीं करने का कारण स्पष्ट हो जाता है।

अपडेट चूंकि हम दो चर के बीच सहसंबंध में रुचि रखते हैं, इसलिए पहले यह मान लें कि वे स्थिर प्रक्रिया । स्टेशनरी का तात्पर्य है कि जेड टी और सी वी ( जेड टी , जेड टी - एच ) टी पर निर्भर नहीं करते हैं । तो सहसंबंधZt=(Xt,Yt)EZtcov(Zt,Zth)t

corr(Xt,Yt)=cov(Xt,Yt)DXtDYt

यह भी पर निर्भर नहीं करता है , क्योंकि सूत्र में सभी मात्राएं मैट्रिक्स सी वी ( जेड टी ) से आती हैं, जो टी पर निर्भर नहीं करती हैं । तो नमूना सहसंबंध की गणनाtcov(Zt)t

बनाता है भावना, क्योंकि हम उचित उम्मीद है कि नमूना सहसंबंध का अनुमान लगाएगी हो सकता हैρ=आरआर(एक्सटी,वाईटी)। ऐसा लगता है कि इस आशा, निराधार नहीं है, क्योंकि कुछ शर्तों को पूरा स्थिर प्रक्रियाओं के लिए हम उस राशिρ

ρ^=1Tt=1T(XtX¯)(YtY¯)1T2t=1T(XtX¯)2t=1T(YtY¯)2
ρ=corr(Xt,Yt) , के रूप में टी संभावना। इसके अलावाρ^ρTवितरण में है, तो हम के बारे में परिकल्पना परीक्षण कर सकते हैंρT(ρ^ρ)N(0,σρ2)ρ

अब मान लीजिए कि स्थिर नहीं है। फिर c o r r ( X t , Y t ) t पर निर्भर हो सकता है । तो जब हम आकार का एक नमूना निरीक्षण टी हम अनुमान लगाने के लिए potentialy जरूरत टी अलग सहसंबंध ρ टी । यह निश्चित रूप से अलग है, इसलिए सर्वोत्तम स्थिति में हम केवल ρ t के कुछ कार्यात्मक का अनुमान लगा सकते हैं जैसे कि माध्य या विचरण। लेकिन परिणाम की समझदार व्याख्या नहीं हो सकती है।Ztcorr(Xt,Yt)tTTρtρt

अब हम जांचते हैं कि संभवतः सबसे अधिक अध्ययन की गई गैर-स्थिर प्रक्रिया के यादृच्छिक संबंध के साथ क्या होता है। हम प्रक्रिया फोन एक यादृच्छिक की पैदल दूरी पर है, तो जेड टी = Σ टी एस = 1 ( यू टी , वी टी ) , जहां सी टी = ( यू टी , वी टी ) एक स्थिर प्रक्रिया है। सरलता के लिए मान लें कि E C t = 0 । फिरZt=(Xt,Yt)Zt=s=1t(Ut,Vt)Ct=(Ut,Vt)ECt=0

corr(XtYt)=EXtYtDXtDYt=Es=1tUts=1tVtDs=1tUtDs=1tVt

आगे के मामलों को सरल बनाने के लिए, मान लें कि एक सफेद शोर है। इसका मतलब यह है कि सभी सहसंबंध ( सी टी सी टी + एच ) एच > 0 के लिए शून्य हैं । ध्यान दें कि यह c o r r ( U t , V t ) को शून्य तक सीमित नहीं करता है।Ct=(Ut,Vt)E(CtCt+h)h>0corr(Ut,Vt)

फिर

corr(Xt,Yt)=tEUtVtt2DUtDVt=corr(U0,V0).

अब तक बहुत अच्छा है, हालांकि प्रक्रिया स्थिर नहीं है, सहसंबंध समझ में आता है, हालांकि हमें एक ही प्रतिबंधात्मक धारणाएं बनानी पड़ीं।

अब यह देखने के लिए कि नमूना सहसंबंध क्या होता है, हमें यादृच्छिक वाक के बारे में निम्नलिखित तथ्य का उपयोग करने की आवश्यकता होगी, जिसे कार्यात्मक केंद्रीय सीमा प्रमेय कहा जाता है:

1TZ[Ts]=1Tt=1[Ts]Ct(cov(C0))1/2Ws,
s[0,1]Ws=(W1s,W2s)Ms=(M1s,M2s)=(cov(C0))1/2Ws

सादगी के लिए फिर से हम नमूना सहसंबंध को परिभाषित करते हैं

ρ^=1Tt=1TXtYt1Tt=1TXt21Tt=1TYt2

आइए हम variances से शुरू करते हैं। हमारे पास है

E1Tt=1TXt2=1TEt=1T(s=1tUt)2=1Tt=1TtσU2=σUT+12.

T

1T2t=1TXt2=t=1T1T(1Ts=1tUt)201M1s2ds
T

इसी प्रकार हम प्राप्त करते हैं

1T2t=1TYt201M2s2ds
1T2t=1TXtYt01M1sM2sds

तो अंत में हमारे यादृच्छिक चलना के नमूना सहसंबंध के लिए हमें मिलता है

ρ^01M1sM2sds01M1s2ds01M2s2ds
T

इसलिए, हालांकि सहसंबंध को अच्छी तरह से परिभाषित किया गया है, नमूना सहसंबंध स्थिर प्रक्रिया के मामले में, इसकी ओर नहीं बढ़ता है। इसके बजाय यह एक निश्चित यादृच्छिक चर में परिवर्तित होता है।


1
देखने की व्याख्या का गणितीय बिंदु वह है जो मैं खोज रहा था। यह मुझे कुछ चिंतन करने और आगे की खोज करने के लिए देता है। धन्यवाद।
मिल्कट्रैडर

1
यह प्रतिक्रिया मूल प्रश्न को दरकिनार करती प्रतीत होती है: क्या आप केवल यह नहीं कह रहे हैं कि हां, सहसंबंध की गणना स्थिर प्रक्रियाओं के लिए समझ में आती है?
whuber

1
@ जब भी, मैं टिप्पणी को ध्यान में रखते हुए सवाल का जवाब दे रहा था, लेकिन मैं फिर से सवाल को फिर से पढ़ता हूं और जहां तक ​​मैं समझता हूं कि ओपी गैर-स्थिर डेटा के लिए सहसंबंध की गणना के बारे में पूछता है। स्थिर प्रक्रियाओं के लिए सहसंबंध की गणना समझ में आती है, सभी मैक्रोकोनोमेट्रिक विश्लेषण (VAR, VECM) उस पर निर्भर करते हैं।
mpiktas

मैं एक प्रतिक्रिया के साथ अपने प्रश्न को स्पष्ट करने की कोशिश करूंगा।
whuber

3
@ मेरे उत्तर से दूर ले जाने पर गैर-स्थिर डेटा पर आधारित सहसंबंध एक यादृच्छिक चर प्राप्त करता है, जो उपयोगी हो सकता है या नहीं भी हो सकता है। स्थिर डेटा पर आधारित सहसंबंध एक स्थिरांक में परिवर्तित हो जाता है। यह समझा सकता है कि व्यापारियों को "एक्स-डे रोलिंग सहसंबंध" के लिए क्यों आकर्षित किया जाता है क्योंकि सहसंबंधित व्यवहार क्षणभंगुर और सहज है। क्या "एक्स-डे रोलिंग सहसंबंध" वैध है या उपयोगी एक और प्रश्न के लिए है।
मिल्कट्रैडर

13

... सहसंबंध की गणना है जिसका डेटा गैर-स्थिर भी एक वैध सांख्यिकीय गणना है?

WhPVP(0)=1P(t+1)=P(t)V(t)>hP(t+1)=P(t)V(t)=P(t)W(t)VWVhW

यहाँ छवि विवरण दर्ज करें

h=5WV

VWVW

आंकड़ा बनाने के लिए गणितज्ञ कोड:

With[{h=5},
pv[{p_, v_}, w_] := With[{q=If[v > h, -p, p]}, {q, q w}];
w = Accumulate[RandomInteger[{-1,1}, 25 h^2]];
{p,v} = FoldList[pv, {1,0}, w] // Transpose;
ListPlot[{w,v}, Joined->True]]

यह अच्छा है कि आपका उत्तर बताता है कि लेकिन मैं यह नहीं कहूंगा कि प्रक्रिया सहसंबद्ध है, मैं कहूंगा कि वे निर्भर हैं। यह सही बात है। सहसंबंध की गणना वैध है और यहाँ यह "कोई सहसंबंध नहीं" कहेगा और हम सभी जानते हैं कि इसका अर्थ "कोई निर्भरता नहीं" है।
रॉबिन जिरार्ड

1
@robin यह एक अच्छा बिंदु है, लेकिन मैंने इस उदाहरण का विशेष रूप से निर्माण किया है ताकि संभावित रूप से लंबे समय तक ये दोनों प्रक्रियाएं पूरी तरह से परस्पर संबंधित हों। मुद्दा निर्भरता बनाम सहसंबंध में से एक नहीं है, लेकिन स्वाभाविक रूप से एक सबटलर घटना से संबंधित है: कि प्रक्रियाओं के बीच संबंध यादृच्छिक अवधियों में बदल जाता है। यह संक्षेप में, वास्तव में वास्तविक बाजारों में क्या हो सकता है (या कम से कम हमें यह चिंता करनी चाहिए कि यह हो सकता है!)।
whuber

@whubert हाँ, और यह दिखाते हुए एक बहुत अच्छा उदाहरण है कि ऐसी प्रक्रियाएँ हैं जो संभावित रूप से लंबे समय तक बहुत अधिक सहसंबंध रखती हैं और फिर भी बड़े लौकिक पैमाने के संबंध में सभी (लेकिन अत्यधिक निर्भर) पर सहसंबद्ध नहीं होती हैं।
रॉबिन जिरार्ड

2
@robin जिरार्ड, मुझे लगता है कि यहां महत्वपूर्ण यह है कि गैर-स्थिर प्रक्रियाओं के लिए सैद्धांतिक सहसंबंध समय के साथ बदलता रहता है, जब स्थिर प्रक्रियाओं के लिए सैद्धांतिक सहसंबंध समान रहता है। तो नमूना सहसंबंध के साथ जो मूल रूप से एक नंबर है, गैर-स्थिर प्रक्रियाओं के मामले में सच्चे सहसंबंधों की भिन्नता को पकड़ना असंभव है।
mpiktas
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.