वास्तविक जीवन स्वतंत्रता और सहसंबंध के बीच अंतर का उदाहरण है


9

यह सर्वविदित है कि यादृच्छिक चर की स्वतंत्रता शून्य सहसंबंध का अर्थ है लेकिन शून्य सहसंबंध को स्वतंत्रता की आवश्यकता नहीं है।

मैं शून्य सहसंबंध के बावजूद निर्भरता प्रदर्शित करते हुए बहुत सारे गणितीय उदाहरणों के साथ आया था। क्या इस तथ्य का समर्थन करने के लिए कोई वास्तविक जीवन उदाहरण हैं?


2
सावधान रहें, केवल शून्य सहसंबंध और संयुक्त रूप से सामान्य चर स्वतंत्रता का अर्थ है।
फ्रांसिस

2
@ सिद्देश "लेकिन मात्रा लंबाई का रैखिक कार्य नहीं है क्योंकि वे सहसंबद्ध नहीं हैं।" ठीक है, पूरी तरह से सहसंबद्ध नहीं है । लेकिन वे सकारात्मक रूप से सहसंबद्ध होंगे।
सिल्वरफिश

1
@ सिध्देश: कि तभी काम होगा जब[एलnजीटी4]-[एलnजीटी][एलnजीटी3]=0...
फ्रांसिस

1
यदि आप मेरे संपादन से असहमत हैं, तो सामान्य वितरण के बारे में टिप्पणी करने के लिए स्वतंत्र महसूस करें। लेकिन मुझे लगा कि यह (1) बेहतर होगा क्योंकि यह आपके मुख्य प्रश्न के लिए एक विचलित करने वाला पक्ष है, (2) यह (मुझे लगता है) पहले ही सीवी पर पूछा जा चुका है, इसलिए यहां मौजूदा सामग्री का एक डुप्लिकेट होगा, ( 3) मैं नहीं चाहता था कि यह भविष्य के पाठकों के बीच भ्रम पैदा करे। मैंने प्रश्न को इस तरह से संपादित करने की कोशिश की है जिससे उसके फिर से खुलने की संभावना बढ़ जाएगी: मुझे लगता है कि यह सवाल उसी विषय पर "गणितीय आँकड़ों" से काफी अलग है।
सिल्वरफिश

2
मुझे अभी भी लगता है कि यह प्रश्न वास्तव में अच्छा है, और यदि इसे फिर से खोला जा सकता है तो कुछ और दिलचस्प उत्तरों को आकर्षित कर सकता है (जिसमें कुछ संपादन शामिल हो सकते हैं स्पष्ट रूप से इसे थ्रेड से अलग करने के लिए इसे वर्तमान में डुप्लिकेट माना जाता है)। मैंने मेटा पर एक धागा उठाया है कि इस प्रश्न को फिर से खोलने के लिए क्या होगा। सभी टिप्पणियों का स्वागत है।
सिल्वरफिश

जवाबों:


6

स्टॉक रिटर्न एक वास्तविक वास्तविक जीवन का उदाहरण है जो आप पूछ रहे हैं। आज और कल के एसएंडपी 500 रिटर्न के बीच शून्य सहसंबंध के बहुत करीब है। हालांकि, स्पष्ट निर्भरता है: चुकता रिटर्न सकारात्मक रूप से स्वतःसंबंधित हैं; उच्च अस्थिरता की अवधि समय में क्लस्टर होती है।

आर कोड:

library(ggplot2)
library(grid)
library(quantmod)

symbols   <- new.env()
date_from <- as.Date("1960-01-01")
date_to   <- as.Date("2016-02-01")
getSymbols("^GSPC", env=symbols, src="yahoo", from=date_from, to=date_to)  # S&P500

df <- data.frame(close=as.numeric(symbols$GSPC$GSPC.Close),
                 date=index(symbols$GSPC))
df$log_return     <- c(NA, diff(log(df$close)))
df$log_return_lag <- c(NA, head(df$log_return, nrow(df) - 1))

cor(df$log_return,   df$log_return_lag,   use="pairwise.complete.obs")  # 0.02
cor(df$log_return^2, df$log_return_lag^2, use="pairwise.complete.obs")  # 0.14

acf(df$log_return,     na.action=na.pass)  # Basically zero autocorrelation
acf((df$log_return^2), na.action=na.pass)  # Squared returns positively autocorrelated

p <- (ggplot(df, aes(x=date, y=log_return)) +
      geom_point(alpha=0.5) +
      theme_bw() + theme(panel.border=element_blank()))
p
ggsave("log_returns_s&p.png", p, width=10, height=8)

S & P 500 पर लॉग रिटर्न का समय:

लॉग रिटर्न समय

यदि रिटर्न समय (और स्थिर) के माध्यम से स्वतंत्र थे, तो क्लस्टर किए गए अस्थिरता के उन पैटर्नों को देखने की बहुत संभावना नहीं होगी, और आपको चुकता लॉग रिटर्न में ऑटोक्रेलेशन नहीं दिखाई देगा।


3

एक और उदाहरण एक परीक्षा पर तनाव और ग्रेड के बीच का संबंध है। संबंध एक उलटा आकार है और सह-संबंध बहुत कम है, हालांकि कार्य-कारण स्पष्ट है।


2
यह एक साफ उदाहरण है। क्या आपके पास डेटा है या यह सिर्फ आत्मनिरीक्षण / शिक्षण अनुभव पर आधारित है?
एड्रियन

1
मैंने इसका एक अध्ययन देखा, लेकिन मैंने इसे कई साल पहले देखा था इसलिए मेरे पास उद्धरण या वास्तविक डेटा नहीं है।
पीटर Flom
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.