अनुचित मिश्रण से सटीक नमूनाकरण


10

मान लीजिए कि मैं एक निरंतर वितरण से नमूना लेना चाहता हूं p(x)। यदि मेरे पास फॉर्म में अभिव्यक्ति हैp

p(x)=i=1aifi(x)

मैं पीai0,iai=1fip

  1. एक लेबल की जाँच प्रायिकता साथ करताएक मैंiai
  2. नमूनाकरणXfi

यदि कभी-कभी ऋणात्मक हो तो क्या इस प्रक्रिया को सामान्य बनाना संभव है ? मुझे संदेह है कि मैंने इसे कहीं भी देखा है - संभवतः एक पुस्तक में, संभवतः कोलमोगोरोव वितरण के लिए - इसलिए मैं एक उत्तर के रूप में एक संदर्भ को स्वीकार करने के लिए पूरी तरह से खुश हूं।ai

एक ठोस खिलौना उदाहरण उपयोगी है, तो चलो मैं से नमूना करना चाहते हैं का कहना है कि मैं तो हूँ ले तकनीकी कारणों से जो चाहिए बहुत ज्यादा बात नहीं, चीजों की भव्य योजना में।α ( 0 , 2 )

p(x,y)exp(xyαxy)x,y>0
α(0,2)

सिद्धांत रूप में, मैं फिर इसे निम्नलिखित योग के रूप में विस्तारित कर सकता हूं:

पी(एक्स,y)αΣn=0(-1)nαn(n2)!(n2)!n!(एक्सn/2-एक्स(n2)!)(yn/2-y(n2)!)

-नियम अंदर राशि फिर स्वतंत्र रूप से के रूप में गामा यादृच्छिक variates लिया जा सकता है। मेरा मुद्दा जाहिर है कि गुणांक "कभी-कभी" नकारात्मक होते हैं।(एक्स,y)

संपादित करें 1 : मैं स्पष्ट है कि मैं उत्पन्न करने की मांग कर रहा हूँ सटीक नमूने से बल्कि तहत उम्मीदों की गणना की तुलना में, । रुचि रखने वालों के लिए, ऐसा करने की कुछ प्रक्रियाएँ टिप्पणियों में बताई गई हैं।पीपीपी

संपादन 2 : मुझे वह संदर्भ मिला, जिसमें इस समस्या के लिए एक विशेष दृष्टिकोण शामिल है, देवरोई के 'नॉन-यूनिफ़ॉर्म रैंडम वेरिएट जनरेशन' में । एल्गोरिथ्म 'ए नोट ऑन सैंपलिंग फ्रॉम सैंपल ऑफ डिस्ट्रीब्यूशन', बिग्नमी और डी मैटिस का है । विधि प्रभावी रूप से योग की सकारात्मक शर्तों से ऊपर से घनत्व को बाध्य करने के लिए है, और फिर इस लिफाफे के आधार पर अस्वीकृति नमूने का उपयोग करें। यह @ शीआन के उत्तर में वर्णित विधि से मेल खाती है।


1
तुम सिर्फ का निरपेक्ष मान का उपयोग करके क्यों नमूना नहीं कर सकते , और फिर अपने को नकारने नमूना? दूसरे शब्दों में को परिभाषित करें(यह परिमित है), और फिर द्वारा अपनी राशि का नाम । एक्स ~ मैं जेड : = Σ मैं = 1 | a i | जेडमैंएक्स~मैंजेड: =Σमैं=1|मैं|जेड
एलेक्स आर।

2
@AlexR। अगर मैं आपको समझता हूं, तो इसका एक संस्करण तहत उम्मीदों की गणना के लिए व्यावहारिक होगा , लेकिन फिर भी से सटीक नमूने खींचने के लिए नहीं । निश्चित रूप से यह एक प्रासंगिक समस्या का जवाब है, हालांकि काफी नहीं है कि मैं क्या देख रहा हूं। पीपीपी
37r8

4
यह निर्भर करता है कि आप उस नमूने के साथ क्या करना चाहते हैं। उदाहरण के लिए, गणना के क्षणों के लिए, यह एक घटक को "नकारात्मक" बिंदु के रूप में नकारात्मक गुणांक के साथ चयनित किसी बिंदु से चिह्नित करके घनत्व के मिश्रण से नमूनाकरण को सामान्य बनाने के लिए सीधा लगता है और पल के अनुमान में नकारात्मक रूप से इसके योगदान को भारित करता है। इसी तरह आप ऐसे नकारात्मक भार के साथ एक केडीई का निर्माण कर सकते हैं, बशर्ते आप इस संभावना को स्वीकार कर सकते हैं कि इसके कुछ मूल्य नकारात्मक होंगे! (सीसी @ शीआन)
whuber

1
वितरण का "सटीक" नमूना क्या होगा? फिर, चाहे और कैसे आप नकारात्मक वजन के साथ एक मिश्रण का शोषण कर सकते हैं नीचे आता है कि आप कैसे नमूना का उपयोग करने का इरादा रखते हैं।
whuber

1
यह आपके सवाल का जवाब नहीं है, लेकिन आप लॉग संभावनाओं से नमूने के बारे में पढ़ने में रुचि हो सकती है stats.stackexchange.com/a/260248/35989
टिम

जवाबों:


5

मैं इस सवाल पर हैरान हूं, लेकिन कभी भी संतोषजनक समाधान नहीं आया।

एक गुण जो संभव उपयोग का है, वह है, यदि कोई घनत्व लिखता है, जहाँ है घनत्व जैसे कि , से अनुकरण और प्रायिकता साथ इन सिमुलेशन को अस्वीकार कर से बचाता है । वर्तमान मामले में, सकारात्मक भार घटकों के सामान्यीकृत संस्करण है और शेष जी जी ( x ) ω ( एक्स ) जी ω ( एक्स ) / जी ( x ) ( एक्स ) = Σ अल्फा मैं > 0 अल्फा मैं मैं ( एक्स ) / Σ अल्फा मैं > 0 अल्फा मैं ω ( एक्स ) = Σ अल्फा

(एक्स)=जी(एक्स)-ω(एक्स)1-ωω>0
जीजी(एक्स)ω(एक्स)जीω(एक्स)/जी(एक्स)जी
जी(एक्स)=Σαमैं>0αमैंमैं(एक्स)/Σαमैं>0αमैं
ω
(एक्स)=Σαमैं<0αमैंमैं(एक्स)/Σαमैं<0αमैं
यह वास्तव में Devroye, गैर-समान यादृच्छिक यादृच्छिक पीढ़ी , खंड II.7.4 के सिमुलेशन बाइबिल में पाया जाता है , लेकिन एक सरल स्वीकार-अस्वीकार तर्क से निम्नानुसार है।

इस दृष्टिकोण का पहला कम्प्यूटेशनल दोष यह है कि एक चुने हुए घटक से पहले अनुकरण करने के बावजूद , और दोनों में sums को अस्वीकृति चरण के लिए गणना की जानी चाहिए। यदि sums बंद फॉर्म संस्करण के साथ अनंत हैं, तो यह स्वीकार-अस्वीकार विधि को लागू करना असंभव बनाता हैमैंजी

एक दूसरी कठिनाई यह है, क्योंकि दोनों ही प्रकार के वज़न एक ही क्रम के होते हैं अस्वीकृति दरकोई ऊपरी सीमा नहीं है। वास्तव में अगर की श्रृंखला के साथ जुड़ा हुआ है, पूरी तरह से परिवर्तित नहीं हो रहा है, तो स्वीकृति की संभावना शून्य है! और इस स्थिति में विधि को लागू नहीं किया जा सकता है।1-ρस्वीकार= Σ अल्फा मैं < 0 | αi| / Σ मैं | αi| α मैं

Σαमैं>0αमैं=1-Σαमैं<0αमैं
1-ρस्वीकार करना=Σαमैं<0|αमैं|/Σमैं|αमैं|
αमैं

मिश्रण निरूपण के मामले में, यदि को रूप में लिखा जा सकता है घटक पहले चुना जा सकता है और फिर घटक के लिए लागू विधि। लेकिन इसे लागू करने के लिए नाजुक हो सकता है, जोड़ों पहचान करना जो फिट , संभवतः संभावित योग से संभव नहीं है।f ( x ) =( जी मैं

(एक्स)=Σमैं=1αमैंजीमैं(एक्स)-ωमैं(एक्समैं)1-ωमैंωमैं>0
जी मैं ( एक्स ) - ω मैं( एक्स मैं ) > 0(जीमैं,मैं)जीमैं(एक्स)-ωमैं(एक्समैं)>0

मुझे लगता है कि श्रृंखला प्रतिनिधित्व से ही अधिक कुशल संकल्प आ सकता है। Devroye, गैर-समान रैंडम वैरिएंट जनरेशन , सेक्शन IV.5, में श्रृंखला विधियों की एक बड़ी श्रृंखला है। उदाहरण के लिए, लक्ष्य का वैकल्पिक श्रृंखला प्रतिनिधित्व के लिए निम्न एल्गोरिथ्म जब ' s, और घनत्व के साथ शून्य में परिवर्तित होता है : एक मैं ( एक्स ) एन एच

(एक्स)=κ(एक्स){1-1(एक्स)+2(एक्स)-}
मैं(एक्स)nDevroye की वैकल्पिक श्रृंखला विधि

समस्या को हाल ही में MCMC के लिए दुर्बल पक्षपाती अनुमानकों के संदर्भ में माना गया है, उदाहरण के लिए Glynn-Rhein दृष्टिकोण । और रूसी रूलेट अनुमानक (बर्नौली कारखाने की समस्या के साथ एक कनेक्शन के साथ)। और निष्पक्ष MCMC कार्यप्रणाली । लेकिन साइन इश्यू से कोई बच नहीं सकता है ... जो छद्म सीमांत तरीकों के रूप में घनत्व का अनुमान लगाते समय इसका उपयोग चुनौतीपूर्ण बनाता है।

आगे की सोच पर, मेरा निष्कर्ष यह है कि इस श्रृंखला से एक वास्तविक अनुकरण उत्पन्न करने के लिए कोई सामान्य तरीका नहीं है [ मिश्रण के बजाय जो एक मिथ्या नाम हो जाता है], श्रृंखला के तत्वों के लिए आगे> संरचना लगाए बिना, जैसे एक Devroye की बाइबिल से उपरोक्त एल्गोरिथ्म । दरअसल, चूंकि अधिकांश (?) घनत्व ऊपर की श्रृंखला के विस्तार के लिए अनुमति देते हैं, यह अन्यथा सार्वभौमिक सिमुलेशन मशीन के एक प्रकार के अस्तित्व का अर्थ होगा ...


धन्यवाद! मैं अतिरिक्त संदर्भों की भी सराहना करता हूं।
.r8

1
बहुत गहन प्रतिक्रिया और संदर्भ के लिए अतिरिक्त धन्यवाद। मुझे इस उत्तर को स्वीकार करने में खुशी हो रही है क्योंकि यह से सटीक समय के रूप में सटीक नमूने उत्पन्न करने में सफल होता है । मैं कुछ हद तक इस समस्या के बारे में सोचना जारी रखूँगा; केवल अतिरिक्त विचार मैं मिला है जो वादा किया लगती से देखने नमूना है नमूने के रूप में , पर सशर्त वहाँ कुछ ज्यामितीय हो सकता है, और है कि अंतर्दृष्टि जो इस लक्षण वर्णन के लिए उपयोगी है (मैं ) पर एक स्लाइस सैंपलर की तरह सोच रहा हूं । चीयर्स! पी = λ जी - μ एक्स ~ जी λ जी μ { ( x , y ) :पीपी=λजी-μएक्स~जीλजीμ{(एक्स,y):μ(एक्स)<y<λजी(एक्स)}
.r8

1
मैंने सशर्त नमूना को बहुत खराब तरीके से समझाया; सेट-आधारित लक्षण वर्णन थोड़ा स्पष्ट है (मेरी राय में)। मेरा मुख्य बिंदु यह है कि यदि आप अंतिम पंक्ति में दो-आयामी सेट से समान रूप से नमूना कर सकते हैं , तो यह निम्नानुसार है कि -coordinate का सही वितरण है। क्या यह लक्षण वर्णन लंबे समय के लिए उपयोगी हो सकता है-आधारित अनुचित मिश्रण देखे जा सकते हैं। x(एक्स,y)एक्स
.r8

1
मैं एक स्लाइस सैंपलर के बारे में भी सोच रहा था, लेकिन सिमुलेशन अर्थ में यह "सटीक" नहीं है।
शीआन

1

मेरे पास एक विचार का मसौदा है जो काम कर सकता है। यह सटीक नहीं है , लेकिन उम्मीद है कि asymptotically सटीक है। इसे वास्तव में कठोर विधि में बदलने के लिए, जहां सन्निकटन को नियंत्रित किया जाता है, या इसके बारे में कुछ साबित किया जा सकता है, शायद बहुत काम की जरूरत है।

सबसे पहले, जैसा कि शीआन ने उल्लेख किया है कि आप एक ओर सकारात्मक भार और दूसरी ओर ऋणात्मक भार को समूहित कर सकते हैं, ताकि अंत में समस्या के केवल दो वितरण और :जी

पी=λजी-μ

with । ध्यान दें कि आपके पास ।λ-μ=1λ1

मेरा विचार निम्नलिखित है। आप से नमूना अवलोकन चाहते हैं । करना:एनपी

  • से नमूना मान और उन्हें एक सूची में संग्रहीत करेंλएनजी
  • से नमूना किए गए प्रत्येक मान के लिए, सूची से उनके निकटतम (शेष) पड़ोसी को हटा दें।μएन

अंत में आपको अंक मिलते हैं। यह बिल्कुल निकटतम पड़ोसी होने की आवश्यकता नहीं है, लेकिन सिर्फ एक बिंदु जो "करीब पर्याप्त" है। पहला कदम पदार्थ पैदा करने जैसा है। दूसरा कदम एंटीमैटर पैदा करने जैसा है और इसे पदार्थ से टकराने और रद्द करने दें। यह विधि सटीक नहीं है, लेकिन मेरा मानना ​​है कि कुछ शर्तों के तहत, यह बड़े लिए समान रूप से सटीक है (छोटे लिए लगभग सटीक बनाने के लिए आपको पहले एक बड़े का उपयोग करने की आवश्यकता है और फिर अंतिम सूची का एक छोटा यादृच्छिक हिस्सा लेना होगा) । मैं एक बहुत ही अनौपचारिक तर्क दे रहा हूं जो एक प्रमाण से अधिक स्पष्टीकरण है।एन एन एन(λ-μ)एन=एनएनnएन

अवलोकन स्थान में पर विचार करें और Lebesgue आयतन साथ चारों ओर एक छोटी मात्रा । से नमूना लेने के बाद , सूची में तत्वों की संख्या में भी होती है यह अनुमानित रूप से । दूसरे चरण के बाद, अनुमानित रूप से को इससे हटा दिया जाएगा, और आपके पास अनुमानित संख्या । इसके लिए आपको यह मानने की जरूरत है कि वॉल्यूम में अंकों की संख्या पर्याप्त रूप से बड़ी है।वी एक्स ε जी वी λ एन जी ( x ) ε μ एन एच ( एक्स ) ε एन पी ( एक्स ) εएक्सvएक्सεजीvλएनजी(एक्स)εμएन(एक्स)εएनपी(एक्स)ε

यह विधि बड़े आयाम या और कुछ विकृति का विरोध करने की संभावना नहीं है, लेकिन छोटे आयाम और पर्याप्त रूप से चिकनी, "पर्याप्त रूप से समान" वितरण में काम कर सकती है।एचजी

एक सटीक विधि के बारे में ध्यान दें:

मैंने पहले असतत वितरण के लिए इसके बारे में सोचा था, और स्पष्ट रूप से उस मामले में विधि सटीक नहीं है, क्योंकि यह ऐसे नमूने उत्पन्न कर सकता है जिनमें संभावना है। 0. मेरे पास मजबूत अंतर्ज्ञान है कि एक सटीक विधि परिमित प्रसंस्करण समय के साथ संभव नहीं है, और यह कि कम से कम असतत वितरण के लिए असंभवता सिद्ध की जा सकती है। खेल का नियम यह है कि आपको केवल और लिए सटीक "oracle" नमूने का उपयोग करने की अनुमति है लेकिन कार्यों के रूप में और को नहीं जानते हैं । सादगी के लिए बर्नौली वितरण के लिए प्रतिबंधित। एक सटीक विधि के गैर अस्तित्व से संबंधित है Bernoulli फैक्टरी सिद्धांत: यदि आप एक बना सकते हैं यदि एक से -coinh g h x ( λ p - μ q ) p q λ p p λ > 1जीजीएक्स(λपी-μक्ष)पी-coin और एक -coin, तो आप एक बना सकते हैं एक से -coin -coin जिसके लिए असंभव माना जाता है ।क्षλपीपीλ>1


1
मैंने इस पर विचार किया लेकिन इसे अस्वीकार कर दिया क्योंकि इसे प्रदर्शित करने के मेरे शुरुआती प्रयासों से यह अहसास हो सकता था कि यह कम से कम एक अनुमान और संभवतः एक गरीब होगा। हां, asymptotically यह काम कर सकता है, लेकिन यह वितरण से "सटीक" नमूने के लिए ओपी के अनुरोध को पूरा नहीं करेगा।
whuber

इस पद्धति की दक्षता ठीक-ठीक अस्वीकार-अस्वीकार विधि के समान ही है।
शीआन

1
जीएक्सजी

1
जी/(जी+)जी

@BenoitSanchez आपके गहन उत्तर के लिए धन्यवाद; मैं विशेष रूप से सटीकता की असंभवता के बारे में अंत में टिप्पणियों की सराहना करता हूं। मैं पिछले दिनों बर्नौली कारखानों में आया था और उन्हें काफी चुनौतीपूर्ण पाया; मैं इस विषय पर फिर से विचार करने की कोशिश करूंगा और देखूंगा कि क्या यह कोई अंतर्दृष्टि प्रदान करता है।
.r8
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.