केंद्र-सेंसर्ड सामान्य नमूनों का अनुमानित विचरण


11

मेरे पास सामान्य रूप से वितरित प्रक्रियाएं हैं जिनसे मुझे छोटे नमूने मिलते हैं ( n आमतौर पर 10-30) जो मैं विचरण का अनुमान लगाने के लिए उपयोग करना चाहता हूं। लेकिन अक्सर नमूने एक साथ इतने करीब होते हैं कि हम केंद्र के पास अलग-अलग बिंदुओं को माप नहीं सकते।

मेरे पास यह अस्पष्ट समझ है कि हमें ऑर्डर किए गए नमूनों का उपयोग करके एक कुशल अनुमानक का निर्माण करने में सक्षम होना चाहिए: उदाहरण के लिए, अगर मुझे पता है कि नमूने में 20 अंक हैं, और यह कि 10 केंद्र के पास क्लस्टर किए गए हैं व्यक्तिगत रूप से मापने के लिए बहुत कसकर, लेकिन मेरे पास असतत माप है 5 या तो पूंछ पर, प्रक्रिया के विचरण का आकलन करने के लिए एक मानक / सूत्रीय दृष्टिकोण है जो ऐसे नमूनों का इष्टतम उपयोग करता है?

(ध्यान दें कि मुझे नहीं लगता कि मैं केवल केंद्र औसत वजन कर सकता हूं। उदाहरण के लिए, यह 7 नमूनों के लिए कसकर क्लस्टर करना संभव है, जबकि एक अन्य तीन विषम रूप से एक तरफ तिरछे हैं, लेकिन पर्याप्त रूप से हम यह नहीं बता सकते कि बिना अधिक थकाऊ एकल नमूनाकरण ।)

यदि उत्तर जटिल है, तो मुझे जो भी शोध करना चाहिए, उसकी सराहना की जाएगी। उदाहरण के लिए, यह एक आदेश-सांख्यिकीय समस्या है? क्या कोई सूत्र उत्तर होने की संभावना है, या यह एक कम्प्यूटेशनल समस्या है?

अद्यतन विवरण: आवेदन शूटिंग के लक्ष्यों का विश्लेषण है। एक एकल अंतर्निहित नमूना लक्ष्य पर एकल शॉट के प्रभाव ( x, y ) का बिंदु है । अंतर्निहित प्रक्रिया में एक सममित द्विभाजित सामान्य वितरण होता है लेकिन कुल्हाड़ियों के बीच कोई संबंध नहीं होता है, इसलिए हम { x } और { y } नमूनों को समान सामान्य वितरण से स्वतंत्र ड्रॉ के रूप में व्यवहार करने में सक्षम हैं । (हम यह भी कह सकते हैं कि अंतर्निहित प्रक्रिया रेले-डिस्ट्रिब्यूटेड है, लेकिन हम नमूना रेलेइग वेरिएंट को माप नहीं सकते क्योंकि हम प्रक्रिया के "सही" केंद्र के निर्देशांक से निश्चित नहीं हो सकते, जो कि छोटे n के लिए महत्वपूर्ण हो सकता है। नमूना केंद्र (से दूर , ˉ y )।)x¯y¯

हमें एक लक्ष्य दिया गया है और इसमें जितने शॉट्स दागे गए हैं। समस्या यह है कि n >> 3 के लिए सटीक बंदूकें आम तौर पर अलग-अलग शॉट्स से घिरे "रैग्ड होल" की शूटिंग करेंगी। हम छेद के x - और y -टीव्यू का निरीक्षण कर सकते हैं , लेकिन हम यह नहीं जानते हैं कि छेद में गैर-विशिष्ट शॉट्स कहां से प्रभावित हुए हैं।

यहाँ अधिक समस्याग्रस्त लक्ष्यों के कुछ उदाहरण दिए गए हैं:

[N = 10 के साथ नमूना लक्ष्य]

N = 100 के साथ नमूना लक्ष्य

(दी गई, एक आदर्श दुनिया में हम प्रत्येक शॉट के बाद लक्ष्य बदल / बदल देंगे और फिर विश्लेषण के लिए नमूने एकत्र करेंगे। कई कारण हैं जो अक्सर अव्यवहारिक होते हैं, हालांकि यह संभव होने पर किया जाता है ।)

xi

समाधान मेरा मानना है कि यह सबसे आसान हो जाएगा चौड़ाई के एक केंद्रीय अंतराल के साथ, सामान्य से एक आयामी नमूने का एक सेट करने के लिए इस कम करने के लिए सुविधाजनक बनाने के लिए डब्ल्यू > , जहां फेंकने व्यास है, जिसमें < n "सेंसर" नमूने हैं।


(१) क्या सामान्य वितरण एक धारणा है या क्या आपके पास इसके समर्थन में अच्छे प्रमाण हैं? (२) क्या समस्या यह है कि आप केंद्र के पास डेटा की सही गणना नहीं कर सकते हैं? (यही कारण है कि का सामान्य अर्थ "रोक," जो है कि आप से अलग होगी कर सकते हैं उन डेटा गिनती लेकिन आप केवल पता है कि उनके मूल्यों निश्चित अंतराल के भीतर झूठ बोलते हैं।)
whuber

@ वाउचर: हां, हमारे पास मौलिक और अनुभवजन्य साक्ष्य हैं, प्रक्रिया सामान्य रूप से वितरित की जाती है। और हाँ, हम कुल समूह में अंकों की सही गणना जानते हैं , और हम अंतराल (ओं) का निरीक्षण कर सकते हैं जहां व्यक्तिगत मूल्यों को निर्धारित करने के लिए बहुत सारे नमूने झूठ बोलते हैं।
फीटवेट

धन्यवाद, यह मददगार है। अनिश्चितता की प्रकृति अभी भी स्पष्ट नहीं है, और इसके लिए एक अच्छा मॉडल एक अच्छा समाधान प्रेरित कर सकता है। क्या आप शायद एक उदाहरण या उदाहरण प्रदान कर सकते हैं या कम से कम माप प्रक्रिया का थोड़ा और विस्तार से वर्णन कर सकते हैं?
whuber

@whuber: अपडेट किया गया। यदि यह मदद करेगा तो मैं कुछ वास्तविक नमूनों के लिंक पोस्ट करने पर भी काम करूंगा।
फीटवेट

xi,(μ,σ2)σiB(xi,r)rB(x,r)rx

जवाबों:


2

यह एक दिलचस्प समस्या है। सबसे पहले, मैं एक सामान्य वितरण की धारणा नहीं बनाऊंगा। ऐसा लगता है कि आप वास्तव में जिस चीज की तलाश कर रहे हैं, वह फैलाव का कुछ अनुमान है जो आप कई अलग-अलग निशानेबाजों या बंदूकों या बारूद या जो भी हो, पर लागू करते हैं।

मैं इसे चारों ओर मोड़ने की कोशिश करूँगा। जब तक आप 10 अलग-अलग छेद (10 शॉट्स मानकर) नहीं देख लेते, आपको ठीक-ठीक पता नहीं होता। लेकिन आप जानते हैं कि वे कहां नहीं गए थे। यदि आप वितरण के साथ शुरुआत करना चाहते हैं, तो इसका उपयोग बायेसियन आंकड़ों के आधार पर वितरण में बाधा डालने के लिए किया जा सकता है।

एक विचार जो यहां सबसे अच्छा हो सकता है, वह है इसे गणितीय रूप से करने की कोशिश को रोकना और कुछ इस तरह समझदार बनाना। लक्ष्य ले लो और क्षेत्र के माध्यम से शॉट को चिह्नित करने के लिए एक छवि प्रसंस्करण रूटीन चलाएं जो असंबद्ध हो सकता है। इस का अर्थ और दूसरा क्षण मापें और इनका उपयोग एक अनुमानक करें। यदि आप थोड़ा आगे जाना चाहते हैं और इसे गॉसिसाइज़ करने की कोशिश करते हैं, तो आप एक साधारण कारक प्राप्त करने के लिए सरल मोंटे कार्लो प्रयोग चला सकते हैं।


मुझे थोड़ा और समझाएं। मान लीजिए कि आपके पास 10 शॉट्स हैं और 6 स्पष्ट छेद हैं जहां आपको पता है कि गोलियां कहां गईं। पहले इन बिंदुओं को लें और गॉसियन की चौड़ाई को कम करने के लिए उनका उपयोग करें। सामान्य दिनचर्या के बाद, यह गॉसियन सिग्मा (कुछ ज्ञात वितरण होने का संकेत देता है
Dave31515

अब, एक बार जब आप ऐसा कर लेते हैं, तो आप उन 4 गोलियों पर विचार करना चाहते हैं जो नए छेद नहीं बनाती थीं। चूंकि गोलियां स्वतंत्र हैं, इसलिए यह नई संभावना (गॉसियन सिग्मा पर) बस गुणा की जा सकती है। तो मूल रूप से 4 गोलियों में से प्रत्येक के लिए, आप इस संभावना से गुणा करना चाहते हैं कि वे एक नया छेद नहीं बनाते हैं।
डेव ३१४१५

मोंटे कार्लो के साथ ऐसा करने का एक सरल तरीका यह है कि आपके विवश वितरण से सिग्मा का एक सेट तैयार किया जाए और इस सिग्मा का उपयोग करके, एक नया छेद न बनाने की संभावना की गणना करें। इस प्रकार, इस से कई सिम्युलेटेड शॉट्स ड्रा करें और गिनें कि कौन सा अंश नए छेद नहीं बनाता है। यह तब संभावना को अद्यतन करने के लिए इस्तेमाल किया जा सकता है। फिर अगले एक पर आगे बढ़ें और वही करें। अब आपकी अंतिम संभावना है।
डेव ३१४१५

अंतिम टिप्पणी व्यावहारिक दृष्टिकोण से, सिग्मा का अनुमान वास्तव में उस चीज से प्रभावित नहीं होना चाहिए जहां वास्तव में अनदेखी गोलियां तब तक चली गईं जब तक आप मानते हैं कि वे पिछले छेदों से गुजर चुके थे। यह ज्यादातर उन लोगों द्वारा विवश किया जाएगा जो आप देख सकते हैं कि किनारे को परिभाषित करते हैं। ऐसा इसलिए है क्योंकि एक गोली के छेद से गुजरने की संभावना दो बार है जो केंद्र से बहुत दूर है। तो यहां तक ​​कि एक कच्चे मोंटे कार्लो आपको इष्टतम अनुमानक के बहुत करीब पहुंच जाएगा।
डेव ३१४१५

यदि हम एक सामान्य (या अन्य) वितरण का दावा नहीं करते हैं तो ऐसा लगता है कि हम सेंसर क्षेत्र में क्या चल रहा है, इस पर ऊपरी या निचले हिस्से को बांधने से ज्यादा कुछ नहीं कह सकते। 1-आयामी मामले में जहां हमारे पास n शॉट्स हैं, जिन्होंने विचरण पर एक कम-बाउंड सेंसर लगाया है, यह मानकर कि वे सभी समान बिंदु के सबसे करीब एक ही आंतरिक बिंदु से टकराते हैं, और (मतलब मानकर इंटीरियर में केंद्रित है) एक ऊपरी-सीमा में है मान लें कि सेंसर अंक समान रूप से इंटीरियर की परिधि पर वितरित किए गए हैं। लेकिन अगर हम मानते हैं कि अंतर्निहित प्रक्रिया सामान्य है तो ऐसा लगता है कि हमें कुछ बेहतर करने में सक्षम होना चाहिए।
फीटवेट

0

एक अन्य सहूलियत बिंदु से, कोई इसे स्थानिक सांख्यिकी के क्षेत्र की रोशनी में देख सकता है, जिसने मैट्रिक्स का वर्गीकरण बनाया है, जिनमें से कई टूलबॉक्स में रखे गए हैं (उदाहरण के लिए, https://www.google.com /url?sa=t&source=web&rct=j&ei=SG31U5j4BormsASc5IHgCw&url=http://resources.arcgis.com/en/help/main/10.1/005p/005p00000002000000.htm&cd=13&ved=0CE4QFjAM&usg=AFQjCNFw9AkAa-wo1rgNmx53eclQEIT1pA&sig2=PN4D5e6tyN65fLWhwIFOYA )।

विकिपीडिया (लिंक: http://en.m.wikipedia.org/wiki/Spatial_descriptive_statistics ) वास्तव में एक अच्छा परिचयात्मक पृष्ठ है जिसमें स्थानिक केंद्रीय प्रवृत्ति और स्थानिक फैलाव के उपायों के रूप में ऐसी अवधारणाओं पर चर्चा की गई है। बाद में विकिपीडिया को उद्धृत करने के लिए:

"अधिकांश अनुप्रयोगों के लिए, स्थानिक फैलाव को इस तरह से निर्धारित किया जाना चाहिए, जो घुमाव और प्रतिबिंबों के लिए अपरिवर्तनीय हो। एक बिंदु सेट के लिए स्थानिक फैलाव के कई सरल उपायों को बिंदुओं के निर्देशांक के सहसंयोजक मैट्रिक्स का उपयोग करके परिभाषित किया जा सकता है। ट्रेस, निर्धारक। , और सहसंयोजक मैट्रिक्स का सबसे बड़ा प्रतिजन स्थानिक फैलाव के उपायों के रूप में इस्तेमाल किया जा सकता है। स्थानिक फैलाव का एक उपाय जो सहसंयोजक मैट्रिक्स पर आधारित नहीं है, निकटतम पड़ोसियों के बीच औसत दूरी है। [1] "

संबंधित अवधारणाओं में स्थानिक समरूपता, रिप्ले के के और एल कार्यों के उपाय शामिल हैं, और शायद गोली समूहों के विश्लेषण के लिए सबसे अधिक प्रासंगिक है, क्लूजेड आबादी के भीतर उप-आबादी के क्लस्टरिंग के लिए क्यूजिक-एडवर्ड्स परीक्षण। बाद का परीक्षण एक नियंत्रण आबादी के लिए तुलना ("निकटतम-पड़ोसी" विश्लेषणों को सारणीबद्ध करने के लिए विश्लेषण का उपयोग) पर आधारित है, जो वर्तमान संदर्भ में क्लस्टरिंग को प्रदर्शित नहीं करने या सैद्धांतिक सिमुलेशन के अनुसार वर्गीकृत किए गए वास्तविक लक्षित लक्ष्यों पर आधारित हो सकता है। रेले का वितरण कहें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.