मैं एक विश्लेषण विधि पर एक सलाह चाहूंगा जिसका उपयोग कर रहा हूं, यह जानने के लिए कि क्या यह सांख्यिकीय रूप से ध्वनि है।
मैं दो बिंदु मापा जाता है प्रक्रियाओं और टी 2 = टी 2 1 , टी 2 2 , । । । , टी 2 मीटर और मैं यह निर्धारित करना चाहता हूं कि क्या टी 1 में घटनाओं को किसी तरह से टी 2 में घटनाओं से संबंधित है ।
साहित्य में मुझे जो एक विधि मिली है, उनमें से एक क्रॉस-सहसंबंध हिस्टोग्राम का निर्माण करना है: प्रत्येक हम टी 2 की सभी घटनाओं में देरी पाते हैं जो समय की एक खिड़की में गिरती हैं (पहले और बाद में टी) 1 एन ), और फिर हम इन सभी देरी के हिस्टोग्राम का निर्माण करते हैं।
दो प्रक्रियाओं सहसंबद्ध नहीं रहे हैं, तो मैं एक फ्लैट हिस्टोग्राम उम्मीद होती है, में एक घटना होने की संभावना के रूप में के बाद (या पहले) में एक घटना टी 1 सब देरी पर बराबर है। दूसरी ओर यदि हिस्टोग्राम में कोई शिखर होता है, तो यह बताता है कि दो बिंदु प्रक्रिया किसी न किसी तरह एक दूसरे को प्रभावित कर रही है (या कम से कम, कुछ सामान्य इनपुट है)।
अब, यह अच्छा और अच्छा है, लेकिन मैं यह कैसे निर्धारित करूं कि हिस्टोग्राम्स की चोटी है (मुझे कहना होगा कि मेरे डेटा के विशेष सेट के लिए वे स्पष्ट रूप से सपाट हैं, लेकिन फिर भी यह एक सांख्यिकीय तरीका होना अच्छा होगा उस की पुष्टि)?
इसलिए, यहां मैंने क्या किया है: मैंने को कई 1 (1000) बार रखने के लिए हिस्टोग्राम उत्पन्न करने की प्रक्रिया को दोहराया है और यह टी 2 के "फेरबदल" संस्करण का उपयोग कर रहा है । टी 2 को फेरबदल करने के लिए, मैं सभी घटनाओं के बीच के अंतराल की गणना करता हूं, उन्हें फेरबदल करता हूं और उन्हें एक नई बिंदु प्रक्रिया को पुनर्गठित करने के लिए योग करता हूं। आरआई में बस इसके साथ करें:
times2.swp <- cumsum(sample(diff(times2)))
मैं तब के सभी देरी के लिए इस 95% मूल्य लेता हूँ और इसे कुछ "आत्मविश्वास सीमा" (शायद यह सही शब्द नहीं है) के रूप में उपयोग करता है ताकि मूल हिस्टोग्राम में इस सीमा पर जाने वाली किसी भी चीज़ को "सही" माना जा सके पीक "।
प्रश्न 1 : क्या यह विधि सांख्यिकीय रूप से सही है? यदि नहीं तो आप इस समस्या से कैसे निपटेंगे?
प्रश्न 2 : एक और बात जो मैं देखना चाहता हूं कि क्या मेरे डेटा का "लंबा" प्रकार का सहसंबंध है। उदाहरण के लिए, दो बिंदु प्रक्रियाओं में घटनाओं की दर में समान परिवर्तन हो सकते हैं (ध्यान दें कि उनकी दरें काफी भिन्न हो सकती हैं), लेकिन मुझे यकीन नहीं है कि यह कैसे करना है। मैंने किसी प्रकार की चौरसाई कर्नेल का उपयोग करके प्रत्येक बिंदु प्रक्रिया का "लिफाफा" बनाने का सोचा और फिर दो लिफाफे का क्रॉस-सहसंबंध विश्लेषण किया। क्या आप किसी अन्य संभावित प्रकार के विश्लेषण का सुझाव दे सकते हैं?
धन्यवाद और इस बहुत लंबे प्रश्न के लिए खेद है।