सामान्य रूप से वितरित घड़ी की खराबी के लिए सही


10

मेरे पास एक प्रयोग है जो दुनिया भर में वितरित सैकड़ों कंप्यूटरों पर निष्पादित किया जाता है जो कुछ घटनाओं की घटनाओं को मापता है। प्रत्येक घटना एक दूसरे पर निर्भर करती है इसलिए मैं उन्हें बढ़ते क्रम में आदेश दे सकता हूं और फिर समय के अंतर की गणना कर सकता हूं।

घटनाओं को तेजी से वितरित किया जाना चाहिए, लेकिन हिस्टोग्राम की साजिश रचते समय यह मुझे मिलता है:

घटनाओं का हिस्टोग्राम

कंप्यूटर पर घड़ियों की अपव्यय के कारण कुछ घटनाओं को पहले से तय किए जाने वाले टाइमस्टैम्प को सौंपा जा सकता है।

मैं सोच रहा हूँ कि क्या घड़ी के तुल्यकालन को इस तथ्य के लिए दोषी ठहराया जा सकता है कि पीडीएफ का शिखर 0 पर नहीं है (कि उन्होंने पूरी चीज़ को दाईं ओर स्थानांतरित कर दिया है)?

यदि घड़ियों के अंतर को सामान्य रूप से वितरित किया जाता है, तो क्या मैं सिर्फ यह मान सकता हूं कि प्रभाव एक दूसरे के लिए क्षतिपूर्ति करेंगे और इस प्रकार केवल गणना किए गए समय का उपयोग करेंगे?

जवाबों:


13

घड़ी के तुल्यकालन के मुद्दे वास्तव में शिखर को दाईं ओर स्थानांतरित करने का कारण बन सकते हैं। आर में निम्नलिखित सिमुलेशन इस घटना को दर्शाता है। मैं एक आकार है कि प्राप्त करने के लिए घातीय बार और सामान्य घड़ी मतभेद इस्तेमाल किया मोटे तौर पर अपनी तस्वीर जैसा दिखता है:

घड़ियों

बाईं ओर वितरण (त्रुटि के बिना मापा गया वास्तविक अंतर) का चरम शिखर 0 पर है, जबकि दाईं ओर वितरण (त्रुटि के साथ मापा गया अंतर) का शिखर लगभग 100 है।

आर-कोड:

set.seed(20120904)

# Generate exponential time differences:
x<-rexp(100000,1/900)

# Generate normal clock differences:
y<-rnorm(100000,0,50)

# Resulting observations:
xy<-x+y

# Truncate at 500:
xy<-xy[xy<=500]

# Plot histograms:
par(mfrow=c(1,2))
hist(x[x<=500],breaks=100,col="blue",main="Actual differences")
hist(xy,breaks=100,col="blue",main="Observed differences")
lines(c(0,0),c(0,550),col="red")

यदि घड़ी अंतर 0 के साथ सामान्य हैं , तो अंतर को इस अर्थ में रद्द कर देना चाहिए कि अवलोकन किए गए अंतर का मतलब वास्तविक अंतर के बराबर होना चाहिए। क्या यह मामला इस बात पर निर्भर करता है कि क्या उन कंप्यूटरों के बीच एक व्यवस्थित अंतर है जहां पहली घटना होती है और दूसरी घटना जहां कंप्यूटर होते हैं।


4
+1 अच्छी तरह से सचित्र। गणितीय रूप से, डेटा त्रुटि वितरण के योग और (प्रकल्पित) घातांक वितरण से लिया गया है। यह त्रुटि वितरण का अनुमान लगाने के लिए लुभाता है और सही वितरण का अनुमान लगाने के लिए डेटा को विघटित करता है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.