मैं भी बूटस्ट्रैपिंग और बेयस प्रमेय दोनों द्वारा बहकाया गया था, लेकिन मैं बूटस्ट्रैपिंग के औचित्य का कोई मतलब नहीं बना सकता था जब तक कि मैं इसे बायेसियन दृष्टिकोण से नहीं देखता। फिर - जैसा कि मैं नीचे समझाता हूं - बूटस्ट्रैप वितरण को बायेसियन पश्च वितरण के रूप में देखा जा सकता है, जो बूटस्ट्रैपिंग के पीछे ((?) औचित्य स्पष्ट करता है, और बनाई गई मान्यताओं को स्पष्ट करने का भी लाभ था। नीचे दिए गए तर्क, और https://arxiv.org/abs/1803.06214 (पृष्ठ 22-26) में मान्यताओं का अधिक विवरण है ।
एक उदाहरण के रूप में, जो http://woodm.myweb.port.ac.uk/SL/resample.xlsx पर स्प्रैडशीट पर सेट किया गया है (स्क्रीन के निचले भाग में बूटस्ट्रैप टैब पर क्लिक करें), मान लें कि हमें मिल गया है 60 के एक साधन के साथ 9 मापों का एक नमूना। जब मैंने इस नमूने से प्रतिस्थापन के साथ 1000 resamples का उत्पादन करने के लिए स्प्रेडशीट का उपयोग किया और इसका मतलब निकटतम सम संख्या में बंद कर दिया, तो इनमें से 82 का मतलब 54 था। बूटस्ट्रैपिंग का विचार यह है कि हम नमूना को "दिखावा" जनसंख्या के रूप में उपयोग करें यह देखने के लिए कि 9 के नमूनों के साधन कितने परिवर्तनशील हैं, इसलिए इससे पता चलता है कि नमूने के जनसंख्या की औसत से 6 प्रतिशत कम होने की संभावना है (इस मामले में ढोंग आबादी के आधार पर 60 के माध्य से नमूना 8.2% है। और हम रेज़मैपलिंग हिस्टोग्राम में अन्य सलाखों के बारे में एक समान निष्कर्ष पर आ सकते हैं।
अब आइए कल्पना करें कि सच्चाई यह है कि वास्तविक जनसंख्या का अर्थ 66 है। यदि ऐसा है तो हमारे नमूने के 60 (अर्थात डेटा) होने की संभावना का अनुमान 8.2% है (याद में ऊपर दिए गए पैराग्राफ में निष्कर्ष का उपयोग करते हुए) वह ६०, ६६ की परिकल्पित जनसंख्या के नीचे ६ है)। आइए इसे लिखते हैं
पी (डेटा दिया गया मतलब = 66) = 8.2%
और यह संभावना पुनरुत्पादन वितरण पर 54 मूल्य के x मान से मेल खाती है। एक ही तरह का तर्क 0, 2, 4 ... 100 से प्रत्येक संभावित जनसंख्या माध्य पर लागू होता है। प्रत्येक मामले में संभावना पुनरुत्पादन वितरण से होती है - लेकिन यह वितरण 60 के माध्य से परिलक्षित होता है।
अब आइए बेयस की प्रमेय लागू करें। प्रश्न में माप केवल 0 और 100 के बीच मान ले सकता है, इसलिए निकटतम सम संख्या को पूर्णांक संख्या में जनसंख्या के लिए संभावनाएं 0, 2, 4, 6, .... 100 हैं। यदि हम मानते हैं कि पूर्व वितरण समतल है, तो इनमें से प्रत्येक में 2% (1 डीपी) की पूर्व संभावना है, और बेयस प्रमेय हमें बताता है कि
P (PopMean = 66 दिए गए डेटा) = 8.2% * 2% / P (डेटा)
कहाँ पे
P (डेटा) = P (PopMean = 0 दिया गया डेटा) * 2% + P (PopMean = 2 दिया गया डेटा) * 2% + ... + P (PopMean = 100 दिया गया डेटा) * 2%
हम अब 2% को रद्द कर सकते हैं और याद रख सकते हैं कि संभाव्यता का योग 1 होना चाहिए क्योंकि संभाव्यताएं बस पुनरुत्पादन वितरण से हैं। जो हमें इस निष्कर्ष के साथ छोड़ देता है कि
पी (PopMean = 66) = 8.2%
यह याद रखना कि 8.2% का पुनरुत्पादन वितरण से 54 (66 के बजाय) की संभावना है, पश्च वितरण केवल नमूना मतलब (60) के बारे में परिलक्षित होता है। इसके अलावा, यदि पुनरुत्पादन वितरण इस अर्थ में सममित है कि विषमता यादृच्छिक है - जैसा कि इस और कई अन्य मामलों में है, तो हम पुनरुत्पादन वितरण को पूर्ववर्ती वितरण वितरण के समान होने के रूप में ले सकते हैं।
यह तर्क विभिन्न धारणाएं बनाता है, मुख्य यह है कि पूर्व वितरण एक समान है। ये ऊपर उद्धृत लेख में अधिक विस्तार से लिखे गए हैं।