कम्प्यूटेशनल आंकड़ों में यादृच्छिक संख्या पीढ़ी के कुछ महत्वपूर्ण उपयोग क्या हैं?


15

कम्प्यूटेशनल आंकड़ों में यादृच्छिक संख्या जनरेटर (RNG) कैसे और क्यों महत्वपूर्ण हैं?

मैं समझता हूं कि किसी भी परिकल्पना की ओर पूर्वाग्रह से बचने के लिए कई सांख्यिकीय परीक्षणों के लिए नमूने चुनते समय यादृच्छिकता महत्वपूर्ण है, लेकिन क्या कम्प्यूटेशनल आंकड़ों के अन्य क्षेत्र हैं जहां यादृच्छिक संख्या जनरेटर महत्वपूर्ण हैं?


4
बारीकी से संबंधित: आंकड़े.स्टैकएक्सचेंज.com
टिम

1
आप क्या पूछ रहे हो? आपका प्रश्न वास्तव में बहुत मायने नहीं रखता है।
कार्ल विटथॉफ्ट

2
उन क्षेत्रों के लिए पूछना बेहतर हो सकता है जिनमें वे महत्वपूर्ण नहीं हैं । यह शायद एक छोटी सूची होगी।
जॉन कोलमैन

2
सवाल व्यापक है लेकिन शीर्षक आकर्षक है और मैथ्यू का जवाब एक अच्छा अवलोकन है। मैं फिर से खोलने के लिए मतदान किया!
बेनोइट सांचेज़

3
यह पारंपरिक एसई मानकों द्वारा स्पष्ट रूप से बहुत व्यापक है, और एक 'बड़ी सूची' प्रश्न के लिए राशियाँ हैं जो बहुत से छोटे, मुश्किल से विस्तृत उत्तरों कि अक्सर पहले से ही उपलब्ध कराए गए उत्तरों की संभावना है। हालाँकि, यहाँ कुछ वास्तविक मूल्य प्रतीत होता है। एक समझौता है इसके लिए CW और संरक्षित होना। भविष्य में, ऐसे उत्तर जो विस्तार के बिना कुछ का उल्लेख करते हैं और / या जो डुप्लिकेट उपयोग पहले से उल्लेख किए गए हैं, उन्हें तुरंत और टिप्पणी के बिना हटा दिया जाएगा।
गूँज - मोनिका

जवाबों:


17

कई, कई उदाहरण हैं। पूरी तरह से जानने के लिए बहुत से लोगों को सूचीबद्ध करने का तरीका, और शायद बहुत सारे (संभवतः @whuber के अलावा, जिन्हें कभी भी कम करके नहीं आंका जाना चाहिए)।

जैसा कि आप उल्लेख करते हैं, नियंत्रित प्रयोगों में हम उपचार और नियंत्रण समूहों में बेतरतीब ढंग से विभाजन करके पूर्वाग्रह से बचने के लिए।

में bootstrapping हम बेतरतीब ढंग से एक निश्चित नमूना से प्रतिस्थापन के साथ नमूने के द्वारा आबादी से दोहराया नमूना अनुमान लगाती है। इससे हम अपने अनुमानों के विचरण का अनुमान लगा सकते हैं, अन्य बातों के अलावा।

में पार सत्यापन हम बेतरतीब ढंग से स्लाइस में हमारे डेटा विभाजन और यादृच्छिक प्रशिक्षण कोडांतरण और सेट के परीक्षण से एक अनुमान के नमूने त्रुटि से बाहर का अनुमान है।

में क्रमचय परीक्षण हम शून्य परिकल्पना के तहत नमूने के यादृच्छिक क्रमपरिवर्तन का उपयोग करें, स्थितियों की एक विस्तृत विविधता में nonparametric परिकल्पना परीक्षण करने के लिए अनुमति देता है।

में जीतना हम बार-बार प्रशिक्षण डेटा की बूटस्ट्रैप नमूनों पर आकलन प्रदर्शन, और उसके बाद परिणाम औसत से एक अनुमान के विचरण नियंत्रित करते हैं।

में यादृच्छिक जंगलों हम आगे भी बेतरतीब ढंग से हर निर्णय बिंदु पर उपलब्ध भविष्यवक्ताओं से नमूने के द्वारा एक अनुमान के विचरण नियंत्रित करते हैं।

में सिमुलेशन हम एक फिट मॉडल पूछना बेतरतीब ढंग से नए डेटा सेट जो हम प्रशिक्षण या परीक्षण डेटा से तुलना कर सकते हैं, एक मॉडल में फिट और मान्यताओं की मदद करने सत्यापित करें उत्पन्न करने के लिए।

में मार्कोव श्रृंखला मोंटे कार्लो संभावित परिणामों (इस उदाहरण के लिए @Ben Bolker करने के लिए धन्यवाद) एक मार्कोव श्रृंखला का उपयोग करने का अंतरिक्ष की खोज से एक वितरण से नमूना हम।

वे सिर्फ सामान्य, रोज़मर्रा के अनुप्रयोग हैं जो तुरंत दिमाग में आते हैं। अगर मैं गहरी खाई, मैं शायद उस सूची की लंबाई दोगुनी हो सकती है। यादृच्छिकता अध्ययन का एक महत्वपूर्ण उद्देश्य है, और एक महत्वपूर्ण उपकरण है।


यह सब सच है लेकिन मुख्य समस्या को संबोधित नहीं करता है: किसी भी प्रकार के परिणामी संरचना या अनुक्रम में पूर्वानुमान के साथ एक PRNG सिमुलेशन विफल होने का कारण होगा।
कार्ल विटथॉफ्ट

3
जिन चीजों का उल्लेख योग्य है, उनमें से एक बड़ी संख्या में यादृच्छिक या छद्म आयामी संख्या पैदा करने की कम्प्यूटेशनल और मेमोरी लागत हैं। सांख्यिकी में RNG के कुछ अनुप्रयोगों के लिए सैकड़ों से लाखों यादृच्छिक संख्याओं की आवश्यकता होती है, लेकिन कुछ को परिमाण के कई आदेशों की आवश्यकता होती है जो दोनों लागतों पर अधिक होते हैं।
एलेक्सिस

5

यह सब सच है लेकिन मुख्य समस्या को संबोधित नहीं करता है: किसी भी प्रकार के परिणामी संरचना या अनुक्रम में पूर्वानुमान के साथ एक PRNG सिमुलेशन विफल होने का कारण होगा कार्ल विटथॉफ्ट 31 जनवरी को 15:51 बजे

यदि यह आपकी चिंता है, तो शायद सवाल का शीर्षक "मोंटे कार्लो परिणामों पर आरएनजी विकल्प का प्रभाव" में बदल दिया जाना चाहिए या ऐसा ही कुछ। इस मामले में, पहले से ही एसई क्रॉस सत्यापन पर विचार किया जाता है , यहां कुछ निर्देश दिए गए हैं

  • यदि आप कुख्यात RANDU की तरह खराब डिज़ाइन वाले RNG पर विचार कर रहे हैं तो वे मोंटे कार्लो सन्निकटन पर स्पष्ट रूप से नकारात्मक प्रभाव डालेंगे । आरएनजी में कमियों को दूर करने के लिए, मार्साग्लिया के डाहरड परीक्षणों जैसे बेंचमार्क के बैंक मौजूद हैं । (उदाहरण के लिए पार्क एंड मिलर (1988) में 16807 फैक्टर के साथ लेहमर कंफर्टेबल जेनरेटर के उपयोग में कमी पाई गई है , इसे 47271 या 69621 के साथ प्रतिस्थापित किया जाना चाहिए। निश्चित रूप से यह मेर्सेन ट्विस्टर PRNG जैसे बड़े अवधियों के द्वारा विस्थापित किया गया है ।)
  • गणित पर एक एसई प्रश्न अनुमान और सटीकता पर प्रभाव (या इसके अभाव) पर एक लिंक प्रदान करता है, यदि बहुत उपयोगी उत्तर नहीं है।
  • जेफ रोसेंथल (यू टोरंटो) के पास एक पेपर है जहां वह एक आरएनजी पर (मोंटे कार्लो) मार्कोव श्रृंखला के अभिसरण पर प्रभाव का अध्ययन करता है, लेकिन मुझे यह नहीं मिल रहा है। मैंने हाल ही में अपने ब्लॉग पर एक छोटा सा प्रयोग किया जिसमें RNG प्रकार का कोई भी प्रभाव नहीं दिखाई दिया।
    • एक तरफ के रूप में, ओंटारियो में एक लॉटरी योजना का उपयोग बेतरतीब ढंग से तैयार की गई पीढ़ी के लिए किया गया था, जिसे कनाडा के टोरंटो के एक सांख्यिकीविद, मोहन श्रीवास्तव ने देखा था, जिन्होंने ओंटारियो लॉटरी और गेमिंग कॉरपोरेशन को इस मुद्दे से लाभ कमाने के बजाय इस मुद्दे को अधिसूचित किया था। बचाव।
  • यहां एक ऐसे मामले का चित्रण है जहां एक क्लासिक नेटवर्क सिम्युलेटर एक खराब डिफ़ॉल्ट विकल्प (ऊपर पार्क और मिलर से जुड़ा हुआ) से प्रभावित होता है।
  • समानांतर कंप्यूटिंग में उपयोग किए जाने वाले आरएनजी की संरचना के साथ विशिष्ट समस्याएं हैं । कई बीजों का उपयोग आमतौर पर पर्याप्त रूप से अच्छा नहीं होता है, विशेष रूप से रैखिक बधाई देने वाले जनरेटर के लिए। कंप्यूटर साहित्य में कई दृष्टिकोण पाए जा सकते हैं, जिसमें माइकल मैस्कैग्नी (एक आर संस्करण सहित ) के स्केलेबल समानांतर रैंडम नंबर जनरेशन (SPRNG) पैकेज और मात्सुमोतो के डायनामिक निर्माता , एक सी प्रोग्राम जो Mersenne ट्विस्टर का उपयोग करते समय स्वतंत्र धाराओं के लिए शुरुआती मूल्य प्रदान करता है। । यह एसई स्टैक ओवरफ्लो पर भी संबोधित किया गया है ।
  • पिछले साल, मैंने पाउला व्हिटलॉक द्वारा जीएनयू साइंटिफिक लाइब्रेरी के प्रभाव पर उच्च आयाम रैंडम वॉक के अभिसरण पर एक बात देखी , लेकिन नहीं कर सका।
  • एक हल्के नोट पर समाप्त करने के लिए, सॉफ्टवेयर और हार्डवेयर आरएनजी के बीच अंतर पर कुछ साहित्य भी है , इस दावे के साथ कि मनोविज्ञान बाद में प्रभावित कर सकता है !
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.