कोई 'यादृच्छिक' आत्मविश्वास या विश्वसनीय अंतराल का उपयोग क्यों करेगा?


16

मैं हाल ही में एक पेपर पढ़ रहा था जिसमें उसके आत्मविश्वास और विश्वसनीय अंतराल में यादृच्छिकता शामिल थी, और मैं सोच रहा था कि क्या यह मानक है (और, यदि हां, तो ऐसा क्यों करना उचित है)। अंकन सेट करने के लिए, मान लें कि हमारा डेटा और हम एक पैरामीटर लिए अंतराल बनाने में रुचि रखते हैं । मैं एक समारोह का निर्माण करके बनाए जा रहे आत्मविश्वास / विश्वसनीयता अंतराल के लिए उपयोग किया जाता हूं:xXθΘ

fx:Θ{0,1}

और हमारे अंतराल को ।I={θΘ:fx(θ)=1}

यह इस अर्थ में यादृच्छिक है कि यह डेटा पर निर्भर करता है, लेकिन डेटा पर सशर्त यह सिर्फ एक अंतराल है। इसके बजाय यह कागज परिभाषित करता है

gx:Θ[0,1]

और पर iid वर्दी रैंडम वेरिएबल्स एक संग्रह भी उपलब्ध है । यह संबंधित अंतराल को । ध्यान दें कि यह डेटा से जो कुछ भी आता है, उससे परे बेतरतीब यादृच्छिकता पर एक बड़ा सौदा निर्भर करता है।{Uθ}θΘ[0,1]I={θΘ:fx(θ)Uθ}

मैं बहुत उत्सुक हूं कि कोई ऐसा क्यों करेगा। मुझे लगता है कि `आराम 'से जैसे कार्यों के लिए जैसे कार्यों से एक अंतराल की धारणा कुछ समझ में आती है; यह भारित आत्मविश्वास अंतराल के कुछ प्रकार है। मैं इसके लिए कोई संदर्भ नहीं जानता (और किसी भी संकेत की सराहना करूंगा), लेकिन यह काफी स्वाभाविक है। हालाँकि, मैं अक्षीय यादृच्छिकता को जोड़ने के किसी भी कारण के बारे में नहीं सोच सकता। जी एक्सfxgx

साहित्य के किसी भी संकेत / ऐसा करने के कारणों की सराहना की जाएगी!


5
(+1) इसे यादृच्छिक प्रक्रिया कहा जाता है वे सांख्यिकीय अनुमान और परीक्षण ढांचे का एक मानक हिस्सा हैं, इसलिए आप स्पष्टीकरण प्रदान करने के लिए किसी भी कठोर पाठ्यपुस्तक के बारे में भरोसा कर सकते हैं। उनके उपयोग के लिए अतिरिक्त प्रेरणा खेल सिद्धांत साहित्य में पाई जा सकती है।
whuber

जवाब के लिए धन्यवाद। मैंने इस टिप्पणी को पढ़ने के बाद महसूस किया कि उदाहरण के लिए बूटस्ट्रैपिंग इस ढांचे में फिट बैठता है, लेकिन उस स्थिति में यादृच्छिकता का कारण स्पष्ट है (आपके पास f, सिर्फ g तक पहुंच नहीं है)। मेरे मामले में, लेखक स्पष्ट रूप से गणना करते हैं , और जी x पर देखते हैं । हालाँकि मेरे पास कई आँकड़े पाठ्यपुस्तकें हैं, मैं इसे कहीं नहीं देखता ... क्या आपके पास एक सुझाया गया पाठ है? fxgx
QQQ

3
दरअसल, बूटस्ट्रैपिंग एक यादृच्छिक प्रक्रिया नहीं है। यह एक निर्धारित प्रक्रिया है जिसकी अनुमानित गणना यादृच्छिक नमूने के माध्यम से की जाती है।
whuber

जवाबों:


4

सिद्धांत में कभी-कभी यादृच्छिक प्रक्रियाओं का उपयोग किया जाता है क्योंकि यह सिद्धांत को सरल करता है। ठेठ सांख्यिकीय समस्याओं में, यह अभ्यास में समझ में नहीं आता है, जबकि गेम-थ्योरी सेटिंग्स में यह समझ में आता है।

इसका एकमात्र कारण मैं इसे अभ्यास में उपयोग करने के लिए देख सकता हूं, अगर यह किसी भी तरह गणना को सरल करता है।

सैद्धांतिक रूप से, कोई यह तर्क दे सकता है कि इसका उपयोग पर्याप्तता सिद्धांत से नहीं किया जाना चाहिए : सांख्यिकीय निष्कर्ष केवल डेटा के पर्याप्त सारांश पर आधारित होना चाहिए, और यादृच्छिकता एक बाहरी यादृच्छिक की निर्भरता का परिचय देती है जो डेटा के पर्याप्त सारांश का हिस्सा नहीं है।U

UPDATE  

नीचे दिए गए व्हीबर की टिप्पणियों का जवाब देने के लिए, यहां उद्धृत किया गया है: "यादृच्छिक प्रक्रियाएं" व्यवहार में क्यों नहीं होती हैं "? जैसा कि अन्य ने उल्लेख किया है, प्रयोगकर्ता अपने प्रयोगात्मक डेटा के निर्माण में यादृच्छिकता का उपयोग करने के लिए पूरी तरह से तैयार हैं, जैसे कि उपचार और नियंत्रण के यादृच्छिक असाइनमेंट। , तो क्या डेटा के आगामी विश्लेषण में यादृच्छिककरण का उपयोग करने के बारे में इतना अलग (और अव्यवहारिक या आपत्तिजनक) है? "

खैर, डेटा प्राप्त करने के लिए प्रयोग का यादृच्छिककरण मुख्य रूप से कार्य-कारण श्रृंखलाओं को तोड़ने के लिए किया जाता है। यदि और जब वह प्रभावी है तो एक और चर्चा होगी। विश्लेषण के भाग के रूप में यादृच्छिककरण का उपयोग करने का उद्देश्य क्या हो सकता है? एकमात्र कारण जो मैंने कभी देखा है वह यह है कि यह गणितीय सिद्धांत को अधिक पूर्ण बनाता है! यह ठीक है जब तक यह जाता है। गेम-थ्योरी संदर्भों में, जब कोई वास्तविक विरोधी होता है, तो उसे भ्रमित करने में मेरी मदद करता है। वास्तविक निर्णय संदर्भों में (बेचते हैं, या नहीं बेचते हैं) एक निर्णय लिया जाना चाहिए, और यदि डेटा में सबूत नहीं है, तो शायद एक सिक्का फेंक सकता है। लेकिन एक वैज्ञानिक संदर्भ में, जहां सवाल यह है कि हम क्या सीख सकते हैंडेटा से, यादृच्छिककरण जगह से बाहर लगता है। मैं इससे कोई वास्तविक लाभ नहीं देख सकता! यदि आप असहमत हैं, तो क्या आपके पास एक तर्क है जो एक जीवविज्ञानी या एक रसायनज्ञ को मना सकता है? (और यहाँ मैं बूटस्ट्रैप या MCMC के भाग के रूप में अनुकरण के बारे में नहीं सोचता।)


1
यादृच्छिक प्रक्रियाएं "व्यवहार में समझ में नहीं आती" क्यों हैं? जैसा कि अन्य ने उल्लेख किया है, प्रयोगकर्ता अपने प्रयोगात्मक डेटा के निर्माण में यादृच्छिकता का उपयोग करने के लिए पूरी तरह से तैयार हैं , जैसे कि उपचार और नियंत्रण का यादृच्छिक कार्य, इसलिए डेटा के आगामी विश्लेषण में यादृच्छिककरण का उपयोग करने के बारे में इतना अलग (और अव्यवहारिक या आपत्तिजनक) क्या है। ?
whuber

1
@kjetil मुझे लगता है कि आपने पर्याप्तता सिद्धांत के बारे में अपना बयान पूरा नहीं किया होगा, ऐसा लगता है कि मध्य वाक्य ("सांख्यिकीय निष्कर्ष ...") को काट दिया गया है।
सिल्वर फिश

1
(+1) लेकिन मुझे लगता है कि यह पर्याप्तता सिद्धांत को लागू करने के लिए सवाल को भीख दे रहा है, जिसके लिए तर्क यह है कि एक बार जब आप पर्याप्त आंकड़े का अवलोकन मूल्य जानते हैं, तो डेटा के किसी अन्य पहलू को ध्यान में रखते हुए एक एक्सट्रैनेटल रैंडम पेश करने के बराबर है। U । तो कोई ऐसा करने का प्रस्ताव कर रहा है जो पर्याप्तता के सिद्धांत का अनुमान नहीं लगाएगा। इसके अलावा, बस्सु (1978), "सांख्यिकीय प्रयोगों में रेंडमाइजेशन ", एफएसयू सांख्यिकी रिपोर्ट M466 को बयाना में प्रस्तावित यादृच्छिक प्रक्रियाओं के एक जोड़े के लिए देखें।
Scortchi - को पुनः स्थापित मोनिका

1
@ वाउचर: यह एक स्पष्ट, राजसी तर्क है कि डेटा प्राप्त करने में यादृच्छिकता लाभप्रद हो सकती है। (यह कारण श्रृंखलाओं को तोड़ता है)। विश्लेषण के हिस्से के रूप में यादृच्छिककरण का उपयोग करने के लिए वह राजसी तर्क क्या है?
kjetil b halvorsen

1
Kjetil: यह आपको एक जोखिम फ़ंक्शन (अक्सर नाममात्र आकार और शक्ति के रूप में) को स्वीकार करने के बजाय इच्छित जोखिम फ़ंक्शन को प्राप्त करने में सक्षम बनाता है जो कि आप चाहते थे। इसके अलावा, अगर एक प्रक्रिया "सैद्धांतिक रूप से" उपयोगी है, तो निश्चित रूप से व्यवहार में इसके उपयोग पर कोई आपत्ति नहीं हो सकती है, अव्यवहारिकता के अलावा (जो आमतौर पर यादृच्छिक प्रक्रियाओं के साथ ऐसा नहीं है)। इस प्रकार आपके प्रश्न को उसके सिर पर रखा जाना चाहिए: बोझ आप पर यह प्रदर्शित करने के लिए है कि यादृच्छिक प्रक्रियाओं का उपयोग करने में कुछ गड़बड़ है। आप खुद को बिना विरोध किए कैसे पूरा करते हैं?
whuber

3

विचार परीक्षण को संदर्भित करता है, लेकिन परीक्षण और आत्मविश्वास अंतराल के द्वंद्व को देखते हुए, यही तर्क CI पर लागू होता है।

मूल रूप से, यादृच्छिक परीक्षण यह सुनिश्चित करते हैं कि परीक्षण के दिए गए आकार को असतत-मूल्यवान प्रयोगों के लिए भी प्राप्त किया जा सकता है।

मान लें कि आप परीक्षण करना चाहते हैं, स्तर , सिक्के की निष्पक्षता (अपनी पसंद का कोई भी उदाहरण यहां डालें जो कि एक द्विपद प्रयोग के साथ मॉडलिंग की जा सकती है) सिर के प्रायिकता पी का उपयोग करके । यही है, आप H 0 : p = 0.5 के खिलाफ (कहते हैं) H 1 : p < 0.5 का परीक्षण करते हैं । मान लीजिए कि आपने सिक्का n = 10 बार उछाला है ।α=0.05pH0:p=0.5H1:p<0.5n=10

H0k=2ppbinom(2,10,.5)k=1H0

k=2


α

खैर, मुझे लगता है कि हमें आंकड़ों के इतिहास में वापस लाया गया है, जब आरए फिशर ने कुछ मनमाने ढंग से 5% के महत्व के स्तर के साथ काम करने का फैसला किया, यह तय करने के लिए कि क्या कुछ प्रारंभिक सबूत वारंट आगे अध्ययन करते हैं। जैसा कि हम जानते हैं, 5% के बाद से कई क्षेत्रों में सोने के मानक के रूप में रूपांतरित किया गया है, अच्छे निर्णय-सिद्धांत की कमी के बावजूद।
बजे क्रिस्टोफ हनक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.