बिंदु-प्रक्रियाओं के बीच क्रॉस सहसंबंध का विश्लेषण


15

मैं एक विश्लेषण विधि पर एक सलाह चाहूंगा जिसका उपयोग कर रहा हूं, यह जानने के लिए कि क्या यह सांख्यिकीय रूप से ध्वनि है।

मैं दो बिंदु मापा जाता है प्रक्रियाओं और टी 2 = टी 2 1 , टी 2 2 , , टी 2 मीटर और मैं यह निर्धारित करना चाहता हूं कि क्या टी 1 में घटनाओं को किसी तरह से टी 2 में घटनाओं से संबंधित है ।T1=t11,t21,...,tn1T2=t12,t22,...,tm2T1T2

साहित्य में मुझे जो एक विधि मिली है, उनमें से एक क्रॉस-सहसंबंध हिस्टोग्राम का निर्माण करना है: प्रत्येक हम टी 2 की सभी घटनाओं में देरी पाते हैं जो समय की एक खिड़की में गिरती हैं (पहले और बाद में टी) 1 एन ), और फिर हम इन सभी देरी के हिस्टोग्राम का निर्माण करते हैं।tn1T2tn1

दो प्रक्रियाओं सहसंबद्ध नहीं रहे हैं, तो मैं एक फ्लैट हिस्टोग्राम उम्मीद होती है, में एक घटना होने की संभावना के रूप में के बाद (या पहले) में एक घटना टी 1 सब देरी पर बराबर है। दूसरी ओर यदि हिस्टोग्राम में कोई शिखर होता है, तो यह बताता है कि दो बिंदु प्रक्रिया किसी न किसी तरह एक दूसरे को प्रभावित कर रही है (या कम से कम, कुछ सामान्य इनपुट है)।T2T1

अब, यह अच्छा और अच्छा है, लेकिन मैं यह कैसे निर्धारित करूं कि हिस्टोग्राम्स की चोटी है (मुझे कहना होगा कि मेरे डेटा के विशेष सेट के लिए वे स्पष्ट रूप से सपाट हैं, लेकिन फिर भी यह एक सांख्यिकीय तरीका होना अच्छा होगा उस की पुष्टि)?

इसलिए, यहां मैंने क्या किया है: मैंने को कई 1 (1000) बार रखने के लिए हिस्टोग्राम उत्पन्न करने की प्रक्रिया को दोहराया है और यह टी 2 के "फेरबदल" संस्करण का उपयोग कर रहा है । टी 2 को फेरबदल करने के लिए, मैं सभी घटनाओं के बीच के अंतराल की गणना करता हूं, उन्हें फेरबदल करता हूं और उन्हें एक नई बिंदु प्रक्रिया को पुनर्गठित करने के लिए योग करता हूं। आरआई में बस इसके साथ करें:T1T2T2

times2.swp <- cumsum(sample(diff(times2)))

T2T1

T2T1

मैं तब के सभी देरी के लिए इस 95% मूल्य लेता हूँ और इसे कुछ "आत्मविश्वास सीमा" (शायद यह सही शब्द नहीं है) के रूप में उपयोग करता है ताकि मूल हिस्टोग्राम में इस सीमा पर जाने वाली किसी भी चीज़ को "सही" माना जा सके पीक "।

प्रश्न 1 : क्या यह विधि सांख्यिकीय रूप से सही है? यदि नहीं तो आप इस समस्या से कैसे निपटेंगे?

प्रश्न 2 : एक और बात जो मैं देखना चाहता हूं कि क्या मेरे डेटा का "लंबा" प्रकार का सहसंबंध है। उदाहरण के लिए, दो बिंदु प्रक्रियाओं में घटनाओं की दर में समान परिवर्तन हो सकते हैं (ध्यान दें कि उनकी दरें काफी भिन्न हो सकती हैं), लेकिन मुझे यकीन नहीं है कि यह कैसे करना है। मैंने किसी प्रकार की चौरसाई कर्नेल का उपयोग करके प्रत्येक बिंदु प्रक्रिया का "लिफाफा" बनाने का सोचा और फिर दो लिफाफे का क्रॉस-सहसंबंध विश्लेषण किया। क्या आप किसी अन्य संभावित प्रकार के विश्लेषण का सुझाव दे सकते हैं?

धन्यवाद और इस बहुत लंबे प्रश्न के लिए खेद है।

जवाबों:


11

दो या दो से अधिक आयामों में इस समस्या का विश्लेषण करने के लिए एक मानक तरीका रिप्लेज़ (क्रॉस) K फ़ंक्शन है , लेकिन इसका कोई कारण नहीं है कि यह एक आयाम में भी उपयोग न हो। (Google खोज संदर्भों को खोदने का एक अच्छा काम करता है।) अनिवार्य रूप से, यह उन दूरीों के पीडीएफ में हिस्टोग्राम सन्निकटन के बजाय दो वास्तविकताओं में बिंदुओं के बीच सभी दूरी के सीडीएफ को प्लॉट करता है। (एक प्रकार, L फ़ंक्शन, K और दो समान असम्बद्ध प्रक्रियाओं के लिए शून्य वितरण के बीच के अंतर को प्लॉट करता है।) यह बड़े पैमाने पर उन अधिकांश मुद्दों को दरकिनार कर देता है जिन्हें आप बिन चुनने के लिए, चिकनी, कॉन्फिडेंस बैंड K के लिए चुनने की आवश्यकता के साथ सामना कर रहे हैं। आमतौर पर सिमुलेशन के माध्यम से बनाया जाता है। यह आर में करना आसान है। आर के लिए कई स्थानिक आँकड़े पैकेज सीधे या आसानी से इस 1 डी मामले के लिए अनुकूलित किए जा सकते हैं। रोजर बिवांड काCRAN पर अवलोकन पृष्ठ इन पैकेजों को सूचीबद्ध करता है: "प्वाइंट पैटर्न विश्लेषण" पर अनुभाग देखें।


दिलचस्प ... मैं इस समय थोड़ा व्यस्त हूँ, लेकिन मैं निश्चित रूप से उस पर एक नज़र डालूंगा!
निको
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.