मोंटे कार्लो सिमुलेशन अनुमान का सटीक पता लगाना


12

पृष्ठभूमि

मैं एक मोंटे कार्लो सिमुलेशन डिजाइन कर रहा हूं जो मॉडलों की श्रृंखला के आउटपुट को जोड़ती है, और मैं यह सुनिश्चित करना चाहता हूं कि सिमुलेशन मुझे नकली परिणाम की संभावना और उस संभावना अनुमान की सटीकता के बारे में उचित दावे करने की अनुमति देगा।

सिमुलेशन से यह संभावना मिलेगी कि एक निर्दिष्ट समुदाय से निकाला गया जूरी एक निश्चित प्रतिवादी को दोषी ठहराएगा। ये सिमुलेशन के चरण हैं:

  1. मौजूदा डेटा का उपयोग करते हुए, जनसांख्यिकीय भविष्यवाणियों पर "जूरर फर्स्ट बैलट वोट" प्राप्त करके एक लॉजिस्टिक प्रायिकता मॉडल ( एम ) उत्पन्न करें ।

  2. मोंटे कार्लो विधियों का उपयोग एम के 1,000 संस्करणों (यानी, मॉडल मापदंडों के लिए गुणांक के 1000 संस्करण) का अनुकरण करने के लिए करें।

  3. मॉडल ( एम i ) के 1,000 संस्करणों में से एक का चयन करें ।

  4. बेतरतीब ढंग से जनसांख्यिकीय जनसांख्यिकीय वितरण के साथ व्यक्तियों के "समुदाय" ( सी ) से 12 "ज्यूरर्स" के 1,000 सेटों का चयन करके बेमिसाल 1,000 जेंसे ।

  5. निश्चित रूप से एम i का उपयोग करके प्रत्येक जूरर के लिए पहले बैलेट दोषी वोट की संभावना की गणना करें ।

  6. प्रत्येक "जूरर" के संभावित वोट को एक निर्धारित वोट में रेंडर करें (इस आधार पर कि यह 0-1 के बीच यादृच्छिक रूप से चयनित मूल्य से अधिक या कम है)।

  7. प्रत्येक "जूरी के" "अंतिम वोट" का निर्धारण एक संभावना का मॉडल (अनुभवजन्य डेटा से प्राप्त) का उपयोग करके एक जूरी करेगा, जो पहले बैलट पर सजा के लिए मतदान करने वाले जुआरियों के अनुपात पर सशर्त होगा।

  8. 1000 जुआरियों ( पीजी i ) के लिए दोषी फैसले के अनुपात को स्टोर करें ।

  9. M के 1,000 नकली संस्करणों में से प्रत्येक के लिए चरण 3-8 दोहराएं ।

  10. पीजी के औसत मूल्य की गणना करें और रिपोर्ट करें कि सी में दोषी होने की संभावना के बिंदु अनुमान के रूप में  ।

  11. पीजी के लिए 2.5 और 97.5 प्रतिशत मूल्यों को पहचानें और 0.95 विश्वास अंतराल के रूप में रिपोर्ट करें।

मैं वर्तमान में 1,000 जूलर्स और 1,000 ज्यूरी का उपयोग इस सिद्धांत पर कर रहा हूं कि एक संभावित वितरण से 1,000 रैंडम ड्रॉ - M- will के C या संस्करणों के जनसांख्यिकीय लक्षण उस वितरण को भरते हैं।

प्रशन

क्या यह मुझे मेरे अनुमान की सटीकता का सही निर्धारण करने की अनुमति देगा? यदि हां, तो कितने निर्णायक मंडल मैं प्रत्येक के लिए सूचीबद्ध करने की आवश्यकता है पीजी मैं गणना कवर करने के लिए सी की प्रायिकता बंटन (तो मैं से बचने के चयन पूर्वाग्रह); क्या मैं 1,000 से कम का उपयोग कर सकता हूं?

किसी भी मदद के लिए आपका बहुत बहुत धन्यवाद!


जिज्ञासा से बाहर: इस मॉडल के सशर्त में कुछ भी है कि क्या आरोपी वास्तव में दोषी है ?
whuber

मॉडल एक एकल तथ्य पैटर्न के सर्वेक्षण प्रतिक्रियाओं पर आधारित है, इसलिए वास्तविक अपराध भिन्न नहीं होता है। मैं अनुमान लगा रहा हूं कि एकल प्रतियोगिता में अलग-अलग चोटें कैसे आएंगी।
मैगी

ठीक है, एक तरफ मजाक करते हुए, आप तीन अनुमानों की रिपोर्ट करते हैं: पीजी का मतलब और 2.5 और 97.5 प्रतिशत। किस के लिए आपको एक "सटीक" निर्धारण की आवश्यकता है और यह कितना सही होना चाहिए?
whuber

इसके अलावा, चरण (6) रहस्यमय है। क्या आप बता सकते हैं कि ऐसा करने का इरादा क्या है? क्या प्रत्येक जुआर (5), प्रत्येक जूरी (4), प्रत्येक मॉडल (3), या उसके कुछ संयोजन के लिए एक अलग "बेतरतीब ढंग से चयनित मूल्य" है?
whuber

1
(टिप्पणी के ऊपर देखें) मुझे लगता है कि मैं (ए) को कम कर सकता हूं, चोटों की संख्या। नमूनाकरण त्रुटि नमूनों की संख्या का एक कार्य है। प्रति मॉडल 1,000 चोटों के साथ, मेरे पास कुल एक मिलियन नमूने हैं। 10 ^ 6 नमूनों से जुड़ी नमूना त्रुटि ~ 0.1% है। यदि मैं प्रति मॉडल केवल 35 जिक्र का उपयोग करता हूं, तो मेरे पास 3.5 * 10 ^ 4 नमूने होंगे, और ~ 0.5% नमूनाकरण त्रुटि होगी। यह नमूना त्रुटि ~ 5.0% की मेरी माप त्रुटि से बहुत छोटी है। इसलिए, मुझे प्रति मॉडल 35 जूल का उपयोग करने में सक्षम होना चाहिए और मेरे आत्मविश्वास अंतराल का अनुमान लगाने के लिए माप त्रुटि का उपयोग करना चाहिए।
मैगी

जवाबों:


4

मोंटे कार्लो की भलाई के लिए एक सामान्य और "इन-ब्रह्मांड" मानदंड है - अभिसरण।

एक एम से चिपके रहें और जांचें कि पीजी किस तरह की संख्या के साथ व्यवहार करता है - इसे अभिसरण करना चाहिए, इसलिए आपको कई पुनरावृत्तियां दिखाई देंगी, जिनके लिए आपके पास महत्वपूर्ण अंकों की एक उचित (आपके आवेदन के लिए) संख्या होगी। कुछ अन्य एमएस के लिए इस बेंचमार्क को दोहराएं सुनिश्चित करें कि आप एम चयन के साथ भाग्यशाली नहीं थे, फिर पूरे सिमुलेशन पर आगे बढ़ें।


1
यकीन है कि किसी को भी सवाल करने के लिए पूरी तरह से उत्तरदायी नहीं है। इसके दो भाग हैं: (1) क्या मॉडलिंग की रणनीति वर्णित समस्या का समाधान करने के लिए एक संवेदनशील समाधान की आपूर्ति करती है - अर्थात्, क्या संभावना है कि एक जूरी समुदाय से यादृच्छिक रूप से खींची गई, सी , निर्दिष्ट जनसांख्यिकीय विशेषताओं को खोजने के लिए वोट देगी। एक प्रतिवादी दोषी? और (2) यदि मॉडलिंग की रणनीति वाजिब है, तो उसे कितने "ज्यूरीज़" का चयन करना होगा, और सजा के लिए अनुमानों की कमी का अनुमान लगाने के लिए उसे प्रत्येक के लिए अनुकरण करना होगा? वह कंप्यूटिंग पर अर्थशास्त्र करना चाहता है। उसकी आखिरी टिप्पणी देखें
dmk38

0

यह मुझे लगता है कि समस्या यह है कि क्या मोंटे कार्लो सिमुलेशन का उपयोग किए बिना मॉडल बहुत जटिल है।

यदि मॉडल सभी अपेक्षाकृत सरल है, तो इसे कॉन्वेंटियोअनल आंकड़ों के माध्यम से देखना संभव है और कई बार फिर से मॉडल को फिर से चलाने के बिना, पूछे जाने वाले प्रश्न का हल प्राप्त करना चाहिए। यह थोड़ा सा सरलीकरण है, लेकिन अगर आपके सभी मॉडल ने सामान्य वितरण के आधार पर अंक बनाए थे, तो आप आसानी से उन उत्तरों को प्राप्त कर सकते हैं जिन्हें आप खोज रहे हैं। बेशक, अगर यह मॉडल सरल है, तो आपको मोंटे कार्लो सिमुलेशन को अपने जवाब खोजने की आवश्यकता नहीं है।

यदि समस्या जटिल है और इसे अधिक प्राथमिक तक तोड़ना संभव नहीं है, तो मोंटे-कार्लो उपयोग करने के लिए सही प्रकार का मॉडल है, लेकिन मुझे नहीं लगता कि मॉडल को चलाने के बिना आत्मविश्वास की सीमा को परिभाषित करने का कोई तरीका है। अंततः विश्वास की सीमा के प्रकार को प्राप्त करने के लिए, उन्होंने कहा कि मॉडल को कई बार चलाना होगा, एक संभावना वितरण को आउटपुट के लिए फिट होना होगा और वहां से विश्वास सीमा को परिभाषित किया जा सकता है। मोंटे-कार्लो सिमुलेशन के साथ चुनौतियों में से एक यह है कि मॉडल मध्य रेंज में वितरण के लिए अच्छे और नियमित उत्तर देते हैं, लेकिन पूंछ अक्सर अधिक चर परिणाम देते हैं, जिसका अर्थ है कि 2.5% और आउटपुट पर आउटपुट के आकार को परिभाषित करने के लिए अधिक रन। 97.5% प्रतिशत।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.