बम कहां है: संभावना का अनुमान कैसे लगाया जाए, दिए गए पंक्ति और स्तंभ योग?


14

यह सवाल पोकेमॉन सोलसिल्वर के एक मिनी-गेम से प्रेरित है:

कल्पना कीजिए कि इस 5x6 क्षेत्र (EDIT: अधिकतम 1 बम / सेल) पर 15 बम छिपे हैं:

रकम

अब, आप पंक्ति / स्तंभ योगों को देखते हुए किसी विशिष्ट क्षेत्र पर बम खोजने की संभावना का अनुमान कैसे लगाएंगे?

यदि आप कॉलम 5 (कुल बम = 5) को देखते हैं, तो आप सोच सकते हैं: इस कॉलम के भीतर पंक्ति 2 में बम खोजने का मौका पंक्ति 1 में एक को खोजने का मौका दोगुना है।

यह (गलत) प्रत्यक्ष आनुपातिकता की धारणा, जिसे मूल रूप से मानक स्वतंत्रता-परीक्षण संचालन (जैसे ची-स्क्वायर में) को गलत संदर्भ में चित्रित किया जा सकता है, निम्न अनुमानों को जन्म देगा:

ची-स्क्वायर

जैसा कि आप देख सकते हैं, प्रत्यक्ष आनुपातिकता 100% से अधिक संभावना अनुमानों की ओर जाता है, और इससे पहले भी, गलत होगा।

इसलिए मैंने सभी संभावित क्रमपरिवर्तन का कम्प्यूटेशनल अनुकरण किया, जिसके कारण 15 बम रखने की 276 अद्वितीय संभावनाएँ थीं। (दी गई पंक्ति और स्तंभ योग)

यहां 276 समाधानों का औसत है: कम्प्यूटेशनल समाधान

यह सही समाधान है, लेकिन घातीय कम्प्यूटेशनल कार्य के कारण, मैं एक अनुमान विधि ढूंढना चाहूंगा।

मेरा सवाल अब यह है: क्या इसका आकलन करने के लिए एक स्थापित सांख्यिकीय तरीका है? मैं सोच रहा था कि क्या यह एक ज्ञात समस्या थी, इसे कैसे कहा जाता है और यदि कोई कागजात / वेबसाइट हैं तो आप सिफारिश कर सकते हैं!


1
तेज और आसान तरीका: अधिक संख्या में पंक्तियों और स्तंभों के लिए, आप एक मोंटे कार्लो सिमुलेशन का संचालन कर सकते हैं, जहां आप संभावित कॉन्फ़िगरेशन की यादृच्छिक सबमिशन की जांच करेंगे, जो कि तब की संभावनाओं की कुल संख्या कम है। यह आपको एक अनुमानित समाधान देगा।
टिम

1
मैं आपके कम्प्यूटेशनल समाधान को नहीं समझता। कोशिकाओं में संख्याएँ क्या हैं? वे निश्चित रूप से 100% तक नहीं जोड़ते हैं, यह पीएमएफ नहीं है। वे भी CDF की तरह नहीं दिखते हैं, सही / निचला सेल 100% नहीं है
अक्कल

2
@ अक्षल ये सीमांत संभावनाएं हैं कि किसी भी सेल में बम होता है। बोर्ड पर संख्या 15, कुल बमों की संख्या को जोड़ती है।
डगल

2
यदि आप मान रहे हैं कि दो मार्जिन स्वतंत्र हैं, तो मार्जिन पर टेबल सशर्त के वितरण से (पैटेफील्ड के एल्गोरिथ्म के माध्यम से) नमूने के लिए इसका अपेक्षाकृत सीधा है। यह आर के मानक वितरण में लागू r2dtableकिया जाता है (और यह भी chisq.testऔर fisher.testकुछ परिस्थितियों में उपयोग किया जाता है )।
Glen_b -Reinstate Monica

2
@Glen_b लेकिन Patefield एल्गोरिथ्म में प्रति सेल घटनाओं की संख्या एक तक सीमित नहीं है।
जरीले तुफतो

जवाबों:


4

समाधान स्थान (वैध बम विन्यास) को दिए गए डिग्री अनुक्रम के साथ द्विदलीय ग्राफ़ के सेट के रूप में देखा जा सकता है। (ग्रिड बायडेजेंसी मैट्रिक्स है।) उस स्थान पर एक समान वितरण उत्पन्न करना मार्कोव चेन मोंटे कार्लो (एमसीएमसी) विधियों का उपयोग करके संपर्क किया जा सकता है: हर समाधान किसी अन्य से "स्विच" के अनुक्रम का उपयोग करके प्राप्त किया जा सकता है, जो आपके पहेली निर्माण में है। हमशक्ल:

(xx)(xx)

यह साबित हो गया है कि यह एक तेजी से मिश्रण संपत्ति है। इसलिए, किसी भी मान्य कॉन्फ़िगरेशन के साथ शुरू करने और थोड़ी देर के लिए चलने वाली एमसीएमसी की स्थापना, आपको समाधानों पर एक समान वितरण के एक अनुमान के साथ समाप्त होना चाहिए, जिसे आप उन संभावनाओं के लिए औसत बिंदु समझ सकते हैं जिन्हें आप खोज रहे हैं।

मैं केवल इन दृष्टिकोणों और उनके कम्प्यूटेशनल पहलुओं से परिचित हूं, लेकिन कम से कम इस तरह से आप किसी भी गैर-समाधान की गणना करने से बचते हैं।

इस विषय पर साहित्य के लिए एक शुरुआत:
https://facademy.math.illipedia.edu/~mlavrov/seminar/2018-erdos.pdf
https://arxiv.org/pdf/1701.07101.pdf
https: // www। tandfonline.com/doi/abs/10.1198/016214504000001303


यह एक अद्भुत विचार है! मुझे लगता है कि मैंने इसे पा लिया है! मैं पुनरावृत्तियों की एक निर्धारित मात्रा के लिए किसी भी ज्ञात समाधान के माध्यम से मिश्रण करता हूं (कि मैं कागजात में खोजने की उम्मीद करता हूं) और बाद में अद्वितीय समाधानों पर औसत, उम्मीद है कि उनमें से अधिकांश पाए जाते हैं। बहुत बहुत धन्यवाद!
KaPy3141

2
एमसीएमसी वास्तव में जाने का रास्ता है और मैं भी इस पाया: arxiv.org/pdf/1904.03836.pdf
KaPy3141

@ KaPy3141 उपर्युक्त पंक्ति और स्तंभ रकम के लिए, आयत लूप एल्गोरिथ्म (arxiv प्रस्ताव में) का मेरा कार्यान्वयन केवल 276 अद्वितीय राज्यों का दौरा करता है, भले ही मैं एल्गोरिथ्म को पुनरावृत्तियों के लिए चलाऊं । 106
जरील टुट्टो सेप

जिससे पता चलता है कि @ अक्षल द्वारा सुझाई गई गणना अधिक कुशल हो सकती है।
जरील टुट्टो सेप

@ जरलेटूफ़ो, लेकिन ओपी कहते हैं कि केवल 276 अद्वितीय (वैध) राज्य हैं; आप उन सभी को मिल गया है!
बेन रेइनिगर

5

कोई अनूठा समाधान नहीं है

मुझे नहीं लगता है कि जब तक आप कुछ अतिरिक्त अनुमान नहीं लगाते हैं, तब तक सही असतत वितरण वितरण को वापस प्राप्त किया जा सकता है। आपकी स्थिति मूल रूप से मार्जिन से संयुक्त वितरण को पुनर्प्राप्त करने की समस्या है। कभी-कभी वित्तीय जोखिम प्रबंधन के लिए, लेकिन आमतौर पर निरंतर वितरण के लिए उद्योग में कॉप्लस का उपयोग करके इसे हल किया जाता है।

उपस्थिति, स्वतंत्र, के रूप में 205

उपस्थिति समस्या में एक सेल में एक से अधिक बम की अनुमति नहीं है। फिर, स्वतंत्रता के विशेष मामले के लिए, अपेक्षाकृत कुशल कम्प्यूटेशनल समाधान है।

यदि आप FORTRAN जानते हैं, तो आप इस कोड का उपयोग कर सकते हैं जो 205 एल्गोरिथम के रूप में लागू होता है: इयान सॉन्डर्स, एल्गोरिथ्म एएस 205: बार-बार रो टोटल, एप्लाइड सांख्यिकी, वॉल्यूम 33, नंबर 3, 1984, पृष्ठ 340-352 के साथ आर एक्स सी टेबल्स की गणना। यह Panefield के अहंकार से संबंधित है जिसे @Glen_B ने संदर्भित किया है।

यह एलगो सभी उपस्थिति तालिकाओं को समाहित करता है, अर्थात सभी संभावित तालिकाओं के माध्यम से जाता है जहां एक क्षेत्र में केवल एक बम होता है। यह बहुलता की गणना भी करता है, यानी कई सारणियां जो समान दिखती हैं, और कुछ संभावनाओं की गणना करती हैं (न कि वे जिन्हें आप रुचि रखते हैं)। इस एल्गोरिथ्म के साथ आप पहले की तुलना में पूरी गणना को तेजी से चलाने में सक्षम हो सकते हैं।

उपस्थिति, स्वतंत्र नहीं

एएस 205 एल्गोरिथ्म को उस मामले में लागू किया जा सकता है जहां पंक्तियां और स्तंभ स्वतंत्र नहीं हैं। इस मामले में आपको गणना तर्क द्वारा उत्पन्न प्रत्येक तालिका के लिए अलग-अलग वजन लागू करना होगा। वजन बम लगाने की प्रक्रिया पर निर्भर करेगा।

मायने रखता है, स्वतंत्रता

गिनती समस्या की अनुमति देता है एक से अधिक बम ज़ाहिर है, एक सेल में रखा गया। गिनती की समस्या की स्वतंत्र पंक्तियों और स्तंभों का विशेष मामला आसान है: Pij=Pi×Pj जहाँ Pi और Pj पंक्तियों और स्तंभों के मार्जिन हैं। उदाहरण के लिए, पंक्ति P6=3/15=0.2 और स्तंभ P3=3/15=0.2 , इसलिए संभावना है कि एक बम पंक्ति 6 में है और कॉलम 3 हैP63=0.04 । आपने वास्तव में अपनी पहली तालिका में इस वितरण का उत्पादन किया था।

मायने रखता है, स्वतंत्र नहीं, असतत कोपल्स

गिनती की समस्या को हल करने के लिए जहां पंक्तियाँ और स्तंभ स्वतंत्र नहीं हैं, हम असतत कोपलों को लागू कर सकते हैं। उनके पास मुद्दे हैं: वे अद्वितीय नहीं हैं। हालांकि यह उन्हें बेकार नहीं बनाता है। इसलिए, मैं असतत कोपलों को लागू करने का प्रयास करूंगा। आप जेनेस्ट, सी और जे नेस्लेहोवा (2007) में उनमें से एक अच्छा अवलोकन पा सकते हैं । गिनती के आंकड़ों के लिए सहकर्मियों पर एक प्राइमर। अस्टिन बुल। ३ 4 (२), ४–५-५१५

कोपल्स विशेष रूप से उपयोगी हो सकते हैं, क्योंकि वे आमतौर पर निर्भरता को स्पष्ट रूप से प्रेरित करने के लिए, या डेटा उपलब्ध होने पर डेटा से इसका अनुमान लगाने की अनुमति देते हैं। मेरा मतलब है कि बम रखते समय पंक्ति और स्तंभों की निर्भरता। उदाहरण के लिए, यह मामला हो सकता है जब बम पहली पंक्ति है, तो यह अधिक संभावना है कि यह पहला स्तंभ भी होगा।

उदाहरण

चलिए फिर से यह मानते हुए किमडेलफ़ोर्ड और सैम्पसन कोपला को अपने डेटा पर लागू करें, ताकि एक सेल में एक से अधिक बम रखे जा सकें। निर्भरता पैरामीटर के लिए योजक θ : के रूप में परिभाषित किया गया है

C(u,v)=(uθ+uθ1)1/θ
आप सोच सकते हैं θ सहसंबंध गुणांक का एक एनालॉग के रूप में।

स्वतंत्र

θ=0.000001

यहाँ छवि विवरण दर्ज करें

आप देख सकते हैं कि कैसे कॉलम 5 में दूसरी पंक्ति की संभावना पहली पंक्ति की तुलना में दोगुनी अधिक संभावना है। यह गलत नहीं है कि आप अपने प्रश्न में क्या लग रहे थे। सभी संभावना 100% तक जोड़ते हैं, निश्चित रूप से, पैनलों पर मार्जिन आवृत्तियों से मेल खाते हैं। उदाहरण के लिए, निचले पैनल में कॉलम 5 1/3 दिखाता है, जो अपेक्षित 15 में से 5 बमों से मेल खाता है।

सकारात्मक संबंध

θ=10

यहाँ छवि विवरण दर्ज करें

नकारात्मक सहसंबंध

θ=0.2

यहाँ छवि विवरण दर्ज करें

आप देख सकते हैं कि सभी संभावनाएं 100% तक हैं, निश्चित रूप से। इसके अलावा, आप देख सकते हैं कि पीएमएफ के आकार पर निर्भरता कैसे प्रभाव डालती है। सकारात्मक निर्भरता (सहसंबंध) के लिए आप विकर्ण पर केंद्रित उच्चतम पीएमएफ प्राप्त करते हैं, जबकि नकारात्मक निर्भरता के लिए यह ऑफ-विकर्ण है


आपके उत्तर के लिए बहुत बहुत धन्यवाद और पुलिस के लिए अपने दिलचस्प लिंक! दुर्भाग्य से, मैंने कभी भी पुलिस सूत्रों का उपयोग नहीं किया है, इसलिए मेरे लिए एक समाधान खोजना मुश्किल होगा जो प्रति सेल केवल 1 बम लागू करता है, लेकिन मैं एक बार बेहतर समझ रखने के बाद निश्चित रूप से कोशिश करूंगा!
KaPy3141

@ KaPy3141, मैंने उस कोड का संदर्भ दिया जिसका उपयोग आप समस्या को हल करने के लिए कर सकते हैं। यह F90 में है, लेकिन अपेक्षाकृत सीधा numpy साथ अजगर कन्वर्ट करने के लिए
Aksakal

θθ

आपको प्रक्रिया में मापदंडों को फिट करना होगा। समस्या शुद्ध दहनशील है यदि उत्पन्न करने की प्रक्रिया इसके अनुरूप है।
अक्कल

4

आपका प्रश्न यह स्पष्ट नहीं करता है, लेकिन मैं यह मानकर चल रहा हूं कि बमों को शुरू में कोशिकाओं पर प्रतिस्थापन के बिना सरल-यादृच्छिक-नमूने के माध्यम से वितरित किया जाता है (इसलिए सेल में एक से अधिक बम नहीं हो सकते)। आपके द्वारा उठाया गया प्रश्न अनिवार्य रूप से एक संभाव्यता वितरण के लिए एक अनुमान पद्धति के विकास के लिए पूछ रहा है जिसे वास्तव में (सिद्धांत रूप में) गणना की जा सकती है, लेकिन जो बड़े पैरामीटर मूल्यों की गणना करने के लिए कम्प्यूटेशनल रूप से व्यावहारिक है।


सटीक समाधान मौजूद है, लेकिन यह कम्प्यूटेशनल रूप से गहन है

n×mb

x=(x1,...,xnm)s=(r1,...,rn,c1,...,cm)S:xs, जो आवंटन सदिश से पंक्ति और स्तंभ रकम तक मैप करता है।

P(x)1

P(x|s)=P(x,s)P(s)=P(x)I(S(x)=s)xP(x)I(S(x)=s)=I(S(x)=s)xI(S(x)=s)=1|Xs|I(S(x)=s)=U(x|Xs),

Xs{x{0,1}nm|S(x)=s}sx|sU(Xs)। यही है, बमों के लिए आवंटन वेक्टर का सशर्त वितरण मनाया गया पंक्ति और स्तंभ योगों के साथ संगत सभी आवंटन वैक्टर के सेट पर समान है। किसी दिए गए सेल में एक बम की सीमांत संभावना तब इस संयुक्त वितरण पर सीमांत द्वारा प्राप्त की जा सकती है:

P(xij=1|s)=x:xij=1U(x|Xs)=|XijXs||Xs|.

Xij{x{0,1}nm|xij=1}ijXs|Xs|=276Xsnmb


अच्छे आकलन के तरीकों की खोज

Xs

भोले अनुभवजन्य अनुमानक: आपके ग्रीन टेबल में आपके द्वारा प्रस्तावित और उपयोग किए गए अनुमानक हैं:

P^(xij=1|s)=ribcjbb=ricjb.

b


आपके गहन उत्तर के लिए बहुत बहुत धन्यवाद! दरअसल, मेरे ग्रीन चार्ट में, पहले से ही 133% तक मान हैं। यह जानना अच्छा है कि इस समस्या के लिए कोई लोकप्रिय तरीका नहीं है और यह स्वयं के लिए प्रयोग करने के लिए स्वीकार्य है! मेरा सबसे सटीक अनुमानक "ग्रीन" दृष्टिकोण के समान है, लेकिन बमों को पी (पंक्ति) / योग (पी (पंक्तियाँ)) * पी (सी) / योग (पी (कोल)) के समानुपातिक आवंटित करने के बजाय, मैं एक का उपयोग करता हूं काल्पनिक P (r) / (1-P (r)) / sum (पंक्तियाँ) और उसके बाद उत्पाद को वापस लाते हैं: P (वास्तविक) = P (कल्पना) / (1 + P (कल्पना)। यह बलों P <1। अब मुझे लगता है, मैं बस कम्प्यूटेशनल रूप से (थोड़ा उल्लंघन) पंक्ति / स्तंभ रकम को लागू करने की आवश्यकता है।
KaPy3141

@ KaPy3141 आप मान का उपयोग कर सकते हैं कि एक विशिष्ट बम एक सेल में है (जिसमें 1 से ऊपर होने की समस्या नहीं है) और फिर इस समस्या का वर्णन उस वितरण के साथ 15 बमों के ड्रा के रूप में करें जो प्रत्येक सेल के पास है मान 0 या 1 (प्रतिस्थापन के बिना ड्राइंग)। यह आपको एक संभावना प्रदान करेगा जो कि 1 से अधिक नहीं है
सेक्स्टस एम्पिरिकस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.