दो समान रूप से वितरित बिंदुओं के बीच अपेक्षित दूरी कैसे पता करें?


9

यदि मैं निर्देशांक को परिभाषित करता (X1,Y1) तथा (X2,Y2) कहाँ पे

X1,X2Unif(0,30) and Y1,Y2Unif(0,40).

मुझे उनके बीच की दूरी का अपेक्षित मूल्य कैसे मिलेगा?

मैं सोच रहा था, क्योंकि दूरी की गणना अपेक्षित मान होगा बस ?(X1X2)2+(Y1Y2)2)(1/30+1/30)2+(1/40+1/40)2


आपका LaTeX कोड सही तरीके से प्रस्तुत नहीं हो रहा था। मुझे आशा है कि मेरे ठीक है कि तुम क्या इरादा है
पीटर Flom

लगभग, लेकिन इससे मुझे अंत में वहां पहुंचने में मदद मिली, बहुत धन्यवाद।
मैथिल

2
गणित साइट पर समतुल्य प्रश्न: एक आयत में रैंडम पॉइंट्स के बीच औसत दूरी । एक संबंधित प्रश्न: संभावना है कि एक आयत में समान रूप से यादृच्छिक बिंदुओं में यूक्लिडियन दूरी किसी दिए गए सीमा से कम है । (दुर्भाग्य से, मैं वहाँ उनके सुझावों पर @whuber लेने के लिए कभी नहीं मिला। मैं ऐसा करने के लिए कुछ समय खोजने की कोशिश करूँगा।)
कार्डिनल

1
उन लिंक के लिए धन्यवाद, @cardinal। यद्यपि गणित संस्करण उत्तर की व्याख्या नहीं करता है - यह सिर्फ इसे प्रस्तुत करता है - इसमें एक व्युत्पत्ति के लिंक शामिल हैं, जो समीक्षा के लायक है।
whuber

जवाबों:


2
##problem
x <- runif(1000000,0,30)
y <- runif(1000000,0,40)
Uniform <- as.data.frame(cbind(x,y))
n <- nrow(Uniform)
catch <- rep(NA,n)
for (i in 2:n) {
      catch[i] <-((x[i+1]-x[i])^2 + (y[i+1]-y[i])^2)^.5
}
mean(catch, na.rm=TRUE)
18.35855

अगर मैं सही ढंग से समझूं कि आप क्या खोज रहे हैं, तो शायद यह मदद करता है। आप यादृच्छिक बिंदुओं के बीच की दूरी का पता लगाने की कोशिश कर रहे हैं, जो X मान यूनिफ़ (0,30) से उत्पन्न होते हैं और Y मान एक यूनिफ़ (0,40) से उत्पन्न होते हैं। मैंने बस उन वितरणों में से प्रत्येक से एक लाख आर.वी. बनाया और फिर उनमें से प्रत्येक के लिए एक बिंदु बनाने के लिए x और y को बाध्य किया। फिर मैंने बिंदु 2 और 1 के बीच की दूरी की गणना सभी बिंदुओं 1,000,000 और 999,999 के बीच की दूरी से की। औसत दूरी 18.35855 थी। मुझे पता है अगर यह तुम क्या देख रहे थे नहीं है।


स्वरूपण के लिए संपादन की स्वतंत्रता ली।
उत्सुक_काट

2
आप काफी करीब आए - शायद संयोग से। सही जवाब है1108(871+960log(2)+405log(3)) = 18.345919। आपके कोड में दो समस्याएं हैं: (1) पुनरावृत्तियों परस्पर स्वतंत्र नहीं हैं; और (2) उचित परिशुद्धता प्राप्त करने के लिए, यह तेजी से कोडित होना चाहिए। क्यों नहीं सिमुलेशन सीधे, के रूप में में n <- 10^7; distance <- sqrt((runif(n,0,30)-runif(n,0,30))^2 + (runif(n,0,40)-runif(n,0,40))^2)। आपको चार महत्वपूर्ण आंकड़े (कम समय में) मिलेंगे, जैसा कि आप मानक त्रुटि की गणना करके देख सकते हैं sd(distance) / sqrt(n)
whuber

@ शुभकर्ता: क्या आप अपने # 1 की व्याख्या कर सकते हैं? उदाहरण के लिए (केस- I) मैंने किसी भी वितरण और गणना के अंतर से यादृच्छिक संख्याओं के जोड़े आकर्षित किए और एक साधन लिया। वर्सस (केस- II) मैं एक समय में एक नंबर खींचता रहा और अंतिम संख्या ड्रा के संबंध में चल रहे मतभेदों की गणना करता रहा और फिर औसत हो गया। क्या केस- I और केस- II द्वारा रिपोर्ट की गई औसत व्यवस्थित रूप से भिन्न होगी?
जिज्ञासु_काट

1
@curious_cat नहीं, औसत लगभग एक ही होगा: लेकिन मानक त्रुटि की गणना अलग होगी। हमें उस गणना की आवश्यकता है ताकि अनुमान लगाया जा सके कि वास्तविक मूल्य के करीब आने की कितनी संभावना है। अधिक जटिल एसई गणना का काम करने के बजाय, यह केवल एक दूसरे से पूरी तरह से स्वतंत्र रूप से बिंदुओं के जोड़े उत्पन्न करने के लिए सरल है, बिल्कुल सवाल में निर्धारित के रूप में। (- मैं अनुभव से पता है - वहाँ कई मायनों अनुकरण गलत हो सकता है कर रहे हैं। यह है कि यह बुद्धिमान है बारीकी से संभव के रूप में वास्तविकता की नकल अनुकरण करने के लिए)
whuber

@ शुभकर्ता: स्पष्ट करने के लिए धन्यवाद। तो, अगर क्लार्क ने अपना कोड लंबे समय तक चलाया था, तो वह अधिक दशमलव स्थानों को प्राप्त कर सकता था?
जिज्ञासु_काट

16

यह स्पष्ट रूप से, ज्यामितीय रूप से प्रश्न को देखने से स्पष्ट है कि एक उत्तल सेट के भीतर दो स्वतंत्र, एकसमान, यादृच्छिक बिंदुओं के बीच की अपेक्षित दूरी इसके व्यास से थोड़ा कम होने वाली है । (यह कम होना चाहिए क्योंकि यह दो बिंदुओं के लिए अपेक्षाकृत दुर्लभ है जैसे कोनों जैसे चरम क्षेत्रों के भीतर और अधिक बार वे केंद्र के पास होंगे, जहां वे करीब हैं।) इस आयत के व्यास के बाद से।50, इस तर्क से अकेले हम उत्तर की अपेक्षा थोड़ा कम होंगे 25

दूरी की संभाव्यता-भारित मान के रूप में एक सटीक उत्तर अपेक्षा की परिभाषा से प्राप्त होता है। सामान्य तौर पर, पक्षों की एक आयत पर विचार करें1 तथा λ; हम बाद में इसे सही आकार में सेट कर देंगेλ=40/30 और अपेक्षा से गुणा करना 30)। इस आयत के लिए, निर्देशांक का उपयोग करते हुए(x,y), समान संभावना घनत्व है 1λdxdy। इस आयत के भीतर औसत दूरी तब दी जाती है

0λ010λ01(x1x2)2+(y1y2)21λdx1dy11λdx2dy2.

प्राथमिक एकीकरण विधियों का उपयोग करना यह सीधा लेकिन दर्दनाक है; मैंने उत्तर प्राप्त करने के लिए एक कंप्यूटर बीजगणित प्रणाली ( गणितज्ञ ) को नियोजित किया

[2+2λ521+λ2+6λ21+λ22λ41+λ2+5λArcSinh(λ)+5λ4log(1+1+λ2λ)]/(30λ2).

की उपस्थिति 1+λ2इनमें से कई शब्दों में कोई आश्चर्य नहीं है: यह आयत का व्यास है (इसके भीतर किसी भी दो बिंदुओं के बीच अधिकतम संभव दूरी)। यदि आप कभी भी सरल विमान के आंकड़ों के भीतर औसत दूरियों की जांच करते हैं, तो लॉगरिथम (जिसमें आर्किसिंह भी शामिल है) की उपस्थिति अनिश्चित है: किसी भी तरह यह हमेशा दिखाई देता है (इस का एक संकेत सेकेंट फ़ंक्शन के अभिन्न अंग में प्रकट होता है)। संयोग से, की उपस्थिति30 हर में पक्षों की एक आयत शामिल समस्या की बारीकियों से कोई लेना देना नहीं है 30 तथा 40: यह एक सार्वभौमिक स्थिरांक है।)

साथ में λ=4/3 और के एक कारक द्वारा स्केलिंग 30, यह करने के लिए मूल्यांकन करता है 1108(871+960log(2)+405log(3))18.345919


स्थिति को अधिक गहराई से समझने का एक तरीका व्यास के सापेक्ष औसत दूरी की साजिश करना है1+λ2 के भिन्न मूल्यों के लिए λ। चरम मूल्यों के लिए (निकट0 या इससे अधिक है 1), आयत अनिवार्य रूप से एक-आयामी हो जाती है और एक अधिक प्राथमिक एकीकरण इंगित करता है कि दूरी को एक तिहाई व्यास तक कम करना चाहिए। इसके अलावा, क्योंकि आयतों के आकारλ तथा 1/λसमान हैं, परिणाम का लघुगणकीय पैमाने पर प्लॉट करना स्वाभाविक हैλ, जहां इसके बारे में सममित होना चाहिए λ=1(चौराहा)। यह रहा:

Plot

इसके साथ हम अंगूठे का एक नियम सीखते हैं : एक आयत के भीतर औसत दूरी1/30.33 और (लगभग) 0.37इसके व्यास के साथ, स्क्वैरिश आयतों से जुड़े बड़े मूल्य और लंबी स्कीनी (रैखिक) आयतों से जुड़े छोटे मूल्य हैं। इन छोरों के बीच के मध्य बिंदु को मोटे तौर पर आयतों के पहलू अनुपात के लिए प्राप्त किया जाता है3:1। इस नियम को ध्यान में रखते हुए, आप केवल एक आयत पर नज़र डाल सकते हैं और इसकी महत्वपूर्ण दूरी का अनुमान लगा सकते हैं।


क्या "व्यास" के बजाय "विकर्ण" होना चाहिए? क्षमा करें अगर मैं नाइटपिटिंग हूं।
जिज्ञासु_काट

@curious_cat परिभाषा के अनुसार, किसी भी दो बिंदुओं के बीच की दूरी के किसी भी बिंदु पर (किसी भी मीट्रिक स्थान में) बिंदुओं का व्यास है। एक आयत के लिए यह (स्पष्ट रूप से) एक विकर्ण की लंबाई है।
whuber

धन्यवाद! मुझे यह महसूस नहीं हुआ कि। मैं व्यास की एक भोली अवधारणा का उपयोग कर रहा था।
जिज्ञासु_काट

एक तरफ के रूप में: दिए गए क्षेत्र के सभी आयतों के लिए एक वर्ग के लिए औसत दूरी कम से कम होगी?
जिज्ञासु_काट

2
की भावना में इस , मैं आपके साथ "यह है क्या यह उत्तर शुरू हो चुका होता इच्छा विमान ..." (+1)
कार्डिनल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.