परीक्षण करने के लिए कैसे "पिछले राज्य" आर में "बाद के राज्य" पर प्रभाव है


10

एक स्थिति की कल्पना करें: हमारे पास तीन खानों के ऐतिहासिक रिकॉर्ड (20 वर्ष) हैं। क्या चांदी की उपस्थिति अगले साल सोने की संभावना को बढ़ाती है? ऐसे प्रश्न का परीक्षण कैसे करें?


यहां छवि विवरण दर्ज करें

यहाँ उदाहरण डेटा है:

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)


1
आप संक्रमण मेट्रिसेस की गणना में रुचि ले सकते हैं ।
एंडी डब्ल्यू

हाय @AndyW! टिप्पणी के लिए धन्यवाद। मैं संक्रमण मैट्रीक पैकेज से परिचित हूं: makkovchain - markovchainFit ()। क्या मैं पी-वैल्यू के रूप में ट्रांज़िशन मैट्रिक्स से प्रायिकता मानों का उपयोग कर सकता हूँ? क्या परिकल्पना का परीक्षण करने का कोई तरीका है: "एक" सिल्वर-गोल्ड "संबंध है।" (p-value = xx)?
लादिस्लाव नाओ

1
@LadislavNado संक्रमण संभावनाओं की व्याख्या p-मानों के रूप में नहीं की जा सकती है (वे आपको किसी भी H0 को अस्वीकार करने के बारे में कुछ भी नहीं बताते हैं), पी। मानों के बारे में अधिक जानने के लिए आँकड़े.stackexchange.com/questions/31/… देखें ।
टिम

1
मुझे आपके डेटा को निकालने के तरीके के साथ एक समस्या दिखाई देती है। अपने "चांदी: नहीं" और "सोना: हाँ" परिदृश्य पर विचार करें, आपको तर्क के मानदंडों को पूरा करने के बाद से "सोने" के अपने निरंतर रन भी गिनने चाहिए।

1
1 से 14 तक सही किए गए एक सेल के साथ, मॉडल में परिवर्तन होता है: गुणांक: अनुमानित एसटीडी। त्रुटि z मान Pr (> | z |) (अवरोधन) -1.2528 0.8018 -1.562 0.118 as.factor (c (0, 1)) 1 0.3655 0.8624 0.424 0.672

जवाबों:


4

मेरी सबसे अच्छी कोशिश: ... @AndyW द्वारा सुझाए गए संक्रमण मैट्रिसेस का उपयोग शायद वह समाधान नहीं है जिसकी मुझे तलाश है (@ टिम की टिप्पणी पर आधारित)। इसलिए मैंने एक अलग दृष्टिकोण की कोशिश की है। मुझे यह लिंक मिला जो लॉजिस्टिक रिग्रेशन करने के लिए डील करता है, जहां रिस्पांस वेरिएबल y और एक प्रेडिक्टर वेरिएबल x दोनों बाइनरी हैं

उदाहरण के अनुसार मुझे अपने डेटा के आधार पर 2 × 2 तालिका बनानी चाहिए:

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

मैंने मान कैसे निकाले: यहां छवि विवरण दर्ज करें

और एक मॉडल का निर्माण करें:

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

क्या यह एक अच्छा समाधान है? क्या पी-मूल्य (0.673) का मतलब है कि चांदी की उपस्थिति से सोने की संभावना नहीं बढ़ती है?


आपने ये अच्छे चार्ट कैसे बनाए? Tikz?
छायाकार

हाय @ssdecontrol! Inkscape में हाथ से चार्ट बनाए गए थे।
लादिस्लाव नाओ

हां, यह एक अच्छी व्याख्या है। इसके अलावा, यदि आप अपनी 2x2 तालिका की पंक्तियों को देखते हैं, तो शीर्ष पंक्ति पर (चांदी: हाँ) आपके पास 9 मामले हैं, जिनमें से 2 में सोना था, इसलिए अगले वर्ष सोने की चांदी की संभावना 2/9 = 0.222 है। नीचे की पंक्ति में (चांदी: नहीं) आपके पास 48 मामले हैं, जिनमें से 14 में अगले साल सोना था, इसलिए सोने की कोई चांदी संभावना 14 / (14 + 34) = 0.292 है। यह सब देखते हुए, ऐसा लगता है कि चांदी सोने को खोजने के आपके अवसर को नुकसान पहुंचाती है , हालांकि आपके पी-मूल्यों से "सांख्यिकीय रूप से महत्वपूर्ण" नहीं है।
ग्रेगर थॉमस

अपने कोडिंग के प्रति भी सचेत रहें, आप शुरुआत करते हैं yes = c(2, 14), no = c(7, 34), जिसका अर्थ है कि आपका सिल्वर लगाना: हाँ पहले। इसलिए जब आप as.factor(c(0, 1))0 करते हैं तो चांदी से मेल खाती है: हाँ, जो कि आपका संदर्भ स्तर है और इस प्रकार आपका अवरोधन है। 0.67 पी-वैल्यू छोटे सकारात्मक बंप से मेल खाता है जो आपको सोने से चांदी की ओर बढ़ने की संभावना में मिलता है: हां, सिल्वर से: नहीं।
ग्रेगर थॉमस

एक अंतिम टिप्पणी: आप संक्रमण मैट्रिस का उपयोग कर रहे हैं । आपका 2, 7, 14, 34 मैट्रिक्स एक ट्रांजिशन मैट्रिक्स है।
ग्रेगर थॉमस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.