महत्व का नमूना क्या है?


22

मैं सुदृढीकरण सीखने की कोशिश कर रहा हूं और यह विषय वास्तव में मुझे भ्रमित कर रहा है। मैंने आँकड़ों का परिचय लिया है, लेकिन मैं इस विषय को सहजता से समझ नहीं पाया।

जवाबों:


15

महत्व नमूना ब्याज के वितरण से अलग वितरण से नमूने का एक रूप है ताकि ब्याज के वितरण से एक पैरामीटर के बेहतर अनुमानों को अधिक आसानी से प्राप्त किया जा सके। आमतौर पर यह पैरामीटर के अनुमान को कम संस्करण के साथ प्रदान करेगा, समान नमूना आकार के साथ मूल वितरण से सीधे नमूना लेने से प्राप्त होगा।

यह विभिन्न संदर्भों में लागू किया जाता है। अलग-अलग वितरण से सामान्य नमूने में ब्याज के वितरण के एक हिस्से में अधिक नमूने लेने की अनुमति मिलती है जो कि आवेदन (महत्वपूर्ण क्षेत्र) द्वारा तय की जाती है।

एक उदाहरण यह हो सकता है कि आप ऐसा नमूना लेना चाहते हैं जिसमें वितरण की पूंछ से अधिक नमूने शामिल हों, जो कि ब्याज के वितरण से शुद्ध यादृच्छिक नमूना प्रदान करेगा।

विकिपीडिया लेख है कि मैं इस विषय पर देखा है बहुत सार है। विभिन्न विशिष्ट उदाहरणों को देखना बेहतर है। हालाँकि इसमें दिलचस्प एप्लिकेशन जैसे लिंक शामिल हैं बायेसियन नेटवर्क ।

1940 और 1950 के दशक में महत्व के नमूने का एक उदाहरण एक विचरण कमी तकनीक (मोंटे कार्लो विधि का एक रूप) है। उदाहरण के लिए देखें हेमस्ले और हैंड्सकॉम्ब द्वारा मोंटे कार्लो मेथड्स 1964 में मैथ्यू मोनोग्राफ / चैपमैन और हॉल के रूप में प्रकाशित पुस्तक और 1966 में और बाद में अन्य प्रकाशकों द्वारा पुनर्मुद्रित। पुस्तक की धारा 5.4 में महत्व नमूनाकरण शामिल है


2
वास्तविक नीति के स्थान पर एक खोज नीति से जैसे नमूने कार्रवाई है कि आप वास्तव में चाहते हैं नमूना करने के लिए: यह करने के लिए जोड़ने के लिए: में आरएल आप आमतौर पर नीति को महत्व नमूना आवेदन कर रहे हैं
DaVinci

3
यह उत्तर अच्छी तरह से समझाता है कि नमूने का क्या महत्व है, लेकिन मुझे यह देखकर निराशा हुई कि वास्तव में कभी इस सवाल का जवाब नहीं दिया जाता है कि नमूना का महत्व क्या है : यह कैसे काम करता है?
whuber

@whuber यहाँ मेरा लक्ष्य एक उलझन में ओपी को अवधारणा की व्याख्या करना और उसे कुछ साहित्य की ओर इशारा करना था। यह एक बड़ा विषय है और इसे अलग-अलग अनुप्रयोगों में उपयोग किया जाता है। अन्य लोग सरल शब्दों में विवरणों को समझाने में सक्षम हो सकते हैं जो मैं कर सकता हूं। मुझे पता है कि जब आप किसी प्रश्न का उत्तर देने का फैसला करते हैं तो आप पूरे हॉग जाते हैं और अच्छे रेखांकन प्रदान करते हैं, सादे भाषा का उपयोग करके तकनीकी विवरणों पर जाएं। वे पोस्ट लगभग हमेशा अपनी स्पष्टता और पूर्णता के साथ समुदाय को संतुष्ट करते हैं और मैं कहता हूं कि ओपी कम से कम हिस्से में भी संतुष्ट करता है। जैसा कि आप सुझाव देते हैं शायद समीकरणों के साथ कुछ वाक्य पर्याप्त होंगे।
माइकल आर। चेर्निक

हो सकता है कि समुदाय के लिए बेहतर हो कि वह दूसरे स्रोतों की ओर इशारा करने या यहां तक ​​कि लिंक प्रदान करने के बजाय सवाल के जवाब में डाले। मुझे बस यह महसूस हुआ कि मैंने जो किया वह पर्याप्त था और ओपी जो एक आँकड़े के नौसिखिए होने की बात स्वीकार करते हैं, उन्हें पहले स्वयं कुछ प्रयास करने चाहिए।
माइकल आर। चेरिक

5
तुम्हारी बात तथ्य पूर्ण है। मुझे आश्चर्य है, हालांकि, क्या यह केवल एक या दो और वाक्यों में संभव हो सकता है - कोई गणित, कोई रेखांकन, शायद ही कोई अतिरिक्त काम - जैसा कि पूछा गया सवाल का जवाब प्रदान करना। इस मामले में विवरण पर जोर देना होगा कि कोई अपेक्षा (केवल "पैरामीटर" नहीं) का अनुमान लगा रहा है , तो शायद यह इंगित करें कि चूंकि उम्मीद मूल्यों और संभावनाओं का उत्पाद है, इसलिए संभावनाओं को बदलकर एक ही परिणाम प्राप्त होता है ( एक वितरण के उन लोगों के लिए जो से नमूना करना आसान है) और उसके लिए क्षतिपूर्ति करने के लिए मूल्यों को समायोजित करना।
whuber

33

महत्व का नमूना एक सिमुलेशन या मोंटे कार्लो विधि है जिसका उद्देश्य इंटीग्रेट करने के लिए किया जाता है। "नमूनाकरण" शब्द कुछ इस तरह से भ्रमित है कि यह किसी दिए गए वितरण से नमूने प्रदान करने का इरादा नहीं करता है।

पीछे अंतर्ज्ञान महत्व नमूना है कि एक अच्छी तरह से परिभाषित अभिन्न, की तरह है संभाव्यता वितरण की एक विस्तृत श्रृंखला के लिए एक उम्मीद के रूप में व्यक्त किया जा सकता है: मैं = [ एच ( एक्स ) ] = एक्स एच ( एक्स ) ( एक्स )

I=Xh(x)dx
जहां f एक प्रायिकता वितरण के घनत्व को दर्शाता है और H को h और f द्वारा निर्धारित किया जाता है(ध्यान दें कि एच ( ) आमतौर पर से अलग है( ) ।)वास्तव में, विकल्प एच ( एक्स ) = ( एक्स )
I=Ef[H(X)]=XH(x)f(x)dx
fHhfH()h() समानताओं की ओर जाता हैH(x)f(x)=h(x)औरI=Ef[H(X)]-fके समर्थन पर कुछ प्रतिबंधों के तहत, जिसका अर्थ हैf(x)>0जबh(x)0-
H(x)=h(x)f(x)
H(x)f(x)=h(x)I=Ef[H(X)]ff(x)>0h(x)0। इसलिए, जैसा कि डब्ल्यू। ह्यूबर ने अपनी टिप्पणी में बताया है, एक अभिन्न के प्रतिनिधित्व में एक उम्मीद के रूप में कोई एकता नहीं है, लेकिन इस तरह के अभ्यावेदन के एक अनंत सरणी के विपरीत, जिनमें से कुछ दूसरों की तुलना में बेहतर हैं एक बार तुलना करने के लिए एक मापदंड उन्हें अपनाया गया है। उदाहरण के लिए, माइकल चेरिक ने अनुमान लगाने वाले के विचरण को कम करने की दिशा में चुनने का उल्लेख किया है ।f

एक बार जब यह प्राथमिक संपत्ति समझ में आ जाती है, तो विचार का कार्यान्वयन अन्य मोंटे कार्लो विधियों के रूप में बड़ी संख्या के कानून पर भरोसा करना है, अर्थात, [एक छद्म यादृच्छिक जनरेटर के माध्यम से] एक iid नमूना से वितरित और सन्निकटन उपयोग करने के लिए मैं = 1(x1,,xn)fजो

I^=1ni=1nH(xi)
  1. की एक निष्पक्ष आकलनकर्ता है I
  2. लगभग निश्चित रूप से I में परिवर्तित हो जाता हैI

वितरण की पसंद पर निर्भर करता है , ऊपर आकलनकर्ता मैं या एक परिमित विचरण नहीं हो सकता है हो सकता है। हालांकि, वहाँ हमेशा च के विकल्प मौजूद होते हैं जो एक परिमित विचरण के लिए अनुमति देते हैं और यहां तक ​​कि एक मनमाने ढंग से छोटे विचरण के लिए (यद्यपि उन विकल्पों को व्यवहार में अनुपलब्ध हो सकता है)। और वहाँ भी के विकल्प मौजूद हैं कि महत्व नमूना आकलनकर्ता कर मैंfI^ffI^ एक बहुत ही गरीब सन्निकटन । यह सभी विकल्पों जहां विचरण, अनंत हो जाता है, भले ही शामिलI चटर्जी और डियाकोनिस द्वारा हाल एक पेपर का अध्ययन किया गया हो कि अनंत विचरण के साथ महत्व नमूने की तुलना कैसे करें। नीचे दिए गए चित्र से लिया गया हैकागज की मेरी ब्लॉग चर्चा और अनंत विचरण अनुमानकों के खराब अभिसरण को दिखाता है।

Importance sampling with importance distribution an Exp(1) distribution target distribution an Exp(1/10) distribution, and function of interest $h(x)=x$. The true value of the integral is $10$.

महत्व वितरण के साथ महत्व नमूनाकरण एक एक्सप (1) वितरण लक्ष्य वितरण एक एक्सप (1/10) वितरण, और ब्याज का कार्य करता है । अभिन्न का वास्तविक मूल्य 10 हैh(x)=x10

[निम्नलिखित हमारी पुस्तक मोंटे कार्लो सांख्यिकीय विधियों से पुन: प्रस्तुत किया गया है ।]

रिप्ले (1987) शो से निम्न उदाहरण कारण है कि यह वास्तव में (मूल) वितरण की तुलना में एक वितरण दूसरे से उत्पन्न करने के लिए भुगतान कर सकते हैं अभिन्न में प्रदर्शित होने एक्स एच ( एक्स ) ( एक्स )f ऑफ इंटरेस्ट या, दूसरे शब्दों में, दिए गए घनत्व के खिलाफ एक अपेक्षा के रूप में एक अभिन्न के प्रतिनिधित्व को संशोधित करने के लिए।

Xh(x)f(x)dx

उदाहरण (काऊची टेल प्रोबेबिलिटी) मान लीजिए कि ब्याज की मात्रा प्रायिकता, , कि एक कॉची सी ( 0 , 1 ) चर 2 से बड़ा है , अर्थात, पी = + 2pC(0,1)2 जब पी अनुभवजन्य औसत के माध्यम से मूल्यांकन किया जाता है पी 1 = 1

p=2+1π(1+x2)dx.
p
p^1=1mj=1mIXj>2
X1,,Xm C(0,1)p(1p)/m0.127/mp=0.15

C(0,1)

p^2=12mj=1mI|Xj|>2
p(12p)/2m0.052/m

[2,+)pp

p=12021π(1+x2)dx,
the integral above can be considered to be the expectation of h(X)=2/π(1+X2), where XU[0,2]. An alternative method of evaluation for p is therefore
p^3=121mj=1mh(Uj)
for UjU[0,2]. The variance of p^3 is (E[h2]E[h]2)/m and an integration by parts shows that it is equal to 0.0285/m. Moreover, since p can be written as
p=01/2y2π(1+y2)dy,
this integral can also be seen as the expectation of 14h(Y)=1/2π(1+Y2) against the uniform distribution on [0,1/2] and another evaluation of p is
p^4=14mj=1mh(Yj)
when YjU[0,1/2]. The same integration by parts shows that the variance of p^4 is then 0.95104/m.

Compared with p^1, the reduction in variance brought by p^4 is of order 103, which implies, in particular, that this evaluation requires 100032 times fewer simulations than p^1 to achieve the same precision.


5
Thank you @Xi' an for going to the trouble of illustrating importance sampling in a way that everyone can appreciate and I think more than satisfies Bill Huber's request. +1
Michael R. Chernick

2
I want to note that initially this post was put on hold and thanks to the contributions of several people. We have come up with an informative thread.
Michael R. Chernick

5
Christian, I want to extend my thanks and express a feeling of privilege that you are actively sharing such excellent material with us.
whuber

4
I just want to add a thank you to Xi'an who was kind enough to make a few edits to improve my answer even though he gave one of his own.
Michael R. Chernick

3
This has to be one of the best posts on stats.stackexchange. Thanks for sharing!
dohmatob
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.