सांख्यिकीय यादृच्छिकता के बारे में कुछ प्रश्न


15

से विकिपीडिया के सांख्यिकीय randoness :

वैश्विक यादृच्छिकता और स्थानीय यादृच्छिकता अलग हैं। यादृच्छिकता की अधिकांश दार्शनिक अवधारणाएं वैश्विक हैं - क्योंकि वे इस विचार पर आधारित हैं कि "लंबे समय में" एक अनुक्रम वास्तव में यादृच्छिक दिखता है, भले ही कुछ उप-क्रम यादृच्छिक न दिखें। उदाहरण के लिए, पर्याप्त लंबाई की संख्याओं के "सही मायने में" यादृच्छिक क्रम में, यह संभव है कि शून्य के अलावा और कुछ भी लंबे अनुक्रम न हों, हालांकि पूरे अनुक्रम में यादृच्छिक हो सकता है। स्थानीय यादृच्छिकता इस विचार को संदर्भित करती है कि न्यूनतम अनुक्रम लंबाई हो सकती है जिसमें यादृच्छिक वितरण अनुमानित हैं।समान अंकों के लंबे खंड, यहां तक ​​कि "सही मायने में" यादृच्छिक प्रक्रियाओं द्वारा उत्पन्न होने वाले, नमूना के "स्थानीय यादृच्छिकता" को कम कर देंगे (यह केवल 10,000 अंकों के अनुक्रम के लिए स्थानीय रूप से यादृच्छिक हो सकता है; 1,000 से कम के अनुक्रम लेना यादृच्छिक नहीं हो सकता है; सभी पर, उदाहरण के लिए)।

एक पैटर्न प्रदर्शित करने वाला अनुक्रम ऐसा नहीं है जो सांख्यिकीय रूप से यादृच्छिक नहीं साबित होता है। रैमसे सिद्धांत के सिद्धांतों के अनुसार, पर्याप्त रूप से बड़ी वस्तुओं में आवश्यक रूप से दिए गए उपप्रकार ("पूर्ण विकार असंभव है") होना चाहिए।

मुझे दो वाक्यों के अर्थ मोटे तौर पर समझ में नहीं आते हैं।

  1. क्या पहले वाक्य का मतलब यह है कि कोई चीज़ लंबी लंबाई में एक क्रमिक यादृच्छिक बनाता है, और एक छोटी लंबाई में स्थानीय यादृच्छिक नहीं?

    कोष्ठक के अंदर उदाहरण कैसे काम करता है?

  2. क्या दूसरे वाक्य का मतलब है कि एक पैटर्न को प्रदर्शित करने वाला अनुक्रम सांख्यिकीय रूप से यादृच्छिक नहीं साबित हो सकता है? क्यों?

धन्यवाद


1
अच्छा प्रश्न। मुझे यह पाठ अपने आप में थोड़ा अजीब लगा। मैंने सोचा होगा कि कोई क्रम यादृच्छिक है या नहीं, यह कैसे उत्पन्न होता है; परिणाम क्या नहीं है। मुझे संदेह है कि यहां एक भाषाई समस्या है - मेरे लिए यादृच्छिक अर्थ है कि यह कैसे उत्पन्न होता है; सामान्य ज्ञान के लिए (और संभवतः कम स्पष्ट सोच वाले दार्शनिकों के बारे में?) यह कुछ ऐसा है जो अव्यवस्थित दिखाई देता है?
पीटर एलिस

3
@ पैटर, आपके पास एक कठिन समय हो सकता है यहां तक ​​कि यादृच्छिकता को परिभाषित करना यदि आप केवल पीढ़ी तंत्र को संदर्भित कर सकते हैं। अंततः, क्योंकि यादृच्छिक अनुक्रमों की सभी उपयोगिता उनके पास मौजूद संख्याओं में निहित होती है - और यह नहीं कि उन संख्याओं का निर्माण कैसे हुआ - अनुक्रमों के संदर्भ में यादृच्छिकता को शुद्ध रूप से परिभाषित करने और परीक्षण करने का एक तरीका होना चाहिए, क्या आपको नहीं लगता है?
whuber

1
निश्चित रूप से मैं मानता हूं कि आप इसके परिणामों से यादृच्छिकता का परीक्षण कर सकते हैं - यादृच्छिकता की बहुलता के लिए, इसके प्रमाण के बिना। मुझे शायद पीढ़ी के आधार पर परिभाषा की दार्शनिक चुनौतियों पर कुछ और पढ़ने और सोचने की ज़रूरत है।
पीटर एलिस

मुझे लगता है कि यादृच्छिकता केवल अज्ञात का एक पर्याय है। मैं भी इस वाक्य bizzare मिल
संभावना

जवाबों:


15

अवधारणा को कुछ निष्पादन योग्य कोड द्वारा बड़े करीने से चित्रित किया जा सकता है। हम R10,000 शून्य और लोगों के अनुक्रम बनाने के लिए एक अच्छे छद्म यादृच्छिक संख्या जनरेटर का उपयोग करके (में ) शुरू करते हैं:

set.seed(17)
x <- floor(runif(10000, min=0, max=2))

यह कुछ बुनियादी यादृच्छिक संख्या परीक्षण पास करता है। उदाहरण के लिए, करने के लिए मतलब तुलना करने के लिए एक टी परीक्षण के एक पी-मूल्य है 40.09 जो हमें परिकल्पना है कि शून्य और समान रूप से होने की संभावना है स्वीकार करने के लिए अनुमति देता है%,।1/240.09

इन नंबरों से हम ५० value१ मूल्य पर शुरू होने वाले क्रमिक मूल्यों की परवर्ती निकालने के लिए आगे बढ़ते हैं :1000

x0 <- x[1:1000 + 5080]

यदि ये यादृच्छिक दिखते हैं, तो उन्हें समान यादृच्छिक संख्या परीक्षण भी पास करना चाहिए। उदाहरण के लिए, आइए परीक्षण करें कि उनका मतलब 1/2 है:

> t.test(x0-1/2)

    One Sample t-test

data:  x0 - 1/2 
t = 2.6005, df = 999, p-value = 0.009445
alternative hypothesis: true mean is not equal to 0 
95 percent confidence interval:
 0.01006167 0.07193833 
sample estimates:
mean of x 
    0.041 

कम पी-मूल्य (1% से कम) दृढ़ता से पता चलता है मतलब काफी है अधिक से अधिक की तुलना में । वास्तव में, इस परिणाम का संचयी योग एक मजबूत प्रवृत्ति है:1/2

> plot(cumsum(x0-1/2))

चहलकदमी?

यह यादृच्छिक व्यवहार नहीं है!

इस अनुक्रम के मूल अनुक्रम (एक संचयी राशि के रूप में प्लॉट किए गए) की तुलना करने से पता चलता है कि क्या चल रहा है:

चहलकदमी

लंबे अनुक्रम वास्तव में एक यादृच्छिक चलना की तरह व्यवहार करते हैं - जैसा कि यह होना चाहिए - लेकिन मेरे द्वारा निकाले गए विशेष बाद में एक ही लंबाई के सभी बाद के सबसे लंबे समय तक वृद्धि होती है। ऐसा लगता है कि मैं "गैर-आयामी" व्यवहार का प्रदर्शन करने वाले कुछ अन्य बाद के दृश्यों को भी निकाल सकता था, जैसे कि लगभग केंद्रित जहां एक पंक्ति में लगभग 20 व्यक्ति दिखाई देते हैं!9000


जैसा कि इन सरल विश्लेषणों से पता चला है, कोई भी परीक्षण "साबित" नहीं कर सकता है कि एक क्रम यादृच्छिक प्रतीत होता है। हम बस इतना कर सकते हैं कि क्या अनुक्रम यादृच्छिक व्यवहारों से अपेक्षित व्यवहारों से पर्याप्त रूप से विचलित हो जाते हैं ताकि वे यह सबूत दे सकें कि वे यादृच्छिक नहीं हैं । यह है कि यादृच्छिक संख्या परीक्षणों की बैटरी कैसे काम करती है: वे यादृच्छिक संख्या अनुक्रमों में उत्पन्न होने वाले पैटर्न की अत्यधिक संभावना देखते हैं। हर एक लंबे समय में एक बार जब वे हमें यह निष्कर्ष निकालने के लिए प्रेरित करेंगे कि संख्याओं का एक यादृच्छिक क्रम यादृच्छिक रूप से प्रकट नहीं होता है: हम इसे कुछ और करने की कोशिश को अस्वीकार कर देंगे।

लंबे समय में, हालांकि - जैसा कि हम सभी मर चुके हैं - किसी भी सही मायने में यादृच्छिक संख्या जनरेटर 1000 अंकों के हर संभव अनुक्रम उत्पन्न करेगा , और यह कई बार ऐसा असीम रूप से करेगा। एक तार्किक चतुराई से हमें जो बचाता है वह यह है कि हमें इस तरह के एक स्पष्ट विपथन के लिए एक भयानक समय का इंतजार करना होगा।


धन्यवाद! एक संबंधित प्रश्न: जब कुछ तरीकों से उत्पन्न छद्म यादृच्छिक संख्याओं की यादृच्छिकता का परीक्षण किया जाता है, तो क्या यादृच्छिकता का अर्थ है समान वितरण? दूसरे शब्दों में, क्या यादृच्छिकता केवल समान वितरण का परीक्षण करने के लिए परीक्षण करती है? मैंने यह पूछा क्योंकि उन अधिक पक्षपाती वितरण मुझे सहज रूप से कम यादृच्छिक लगते हैं।
टिम

@ समय: नहीं, गॉसियन यादृच्छिकता के लिए कई सामान्य परीक्षण हैं, और किसी भी वितरण के लिए परीक्षण का निर्माण करना संभव होना चाहिए।
naught101

1
[0,1)

2
मैं उत्तर के शीर्ष पर लगभग "देख" सकता हूं और "व्हीबर" कह सकता हूं :) वेरी नाइस!
पीएचडी

2

इस अंश में "स्थानीय यादृच्छिकता" और "वैश्विक यादृच्छिकता" शब्दों का उपयोग किया जाता है, जो एक यादृच्छिक चर के नमूनों की एक सीमित संख्या और यादृच्छिक चर की संभावना वितरण या अपेक्षा के साथ अंतर कर सकते हैं।

xi{0,1}θθlimn1ni=1nxi=θ

[0,1][a,b]0a<b1θ

यहां कुछ भी नया नहीं है।

n

इस प्रकार, मैं इस अंश के बारे में सोचते हुए कई मस्तिष्क कोशिकाओं को नहीं जलाऊंगा। यह गणितीय रूप से इतना सटीक नहीं है और वास्तव में यादृच्छिकता की प्रकृति के बारे में भ्रामक है।

टिप्पणी के आधार पर संपादित करें: @kjetilbhalvorsen +1 ऐतिहासिक ज्ञान के लिए अपनी टिप्पणी के लिए। हालाँकि, मुझे अभी भी लगता है कि इन शर्तों का मूल्य सीमित और भ्रामक है। आपके द्वारा वर्णित तालिकाएँ भ्रामक निहितार्थ बनाती प्रतीत होती हैं, जो कि छोटे नमूने हैं, उदाहरण के लिए, नमूना वास्तविक अपेक्षित मूल्य से दूर का मतलब है या शायद 0 के 0 (मेरे बर्नौली उदाहरण में) के दोहराए गए निश्चित रूप से संभव लंबे अनुक्रम का, किसी भी तरह से प्रदर्शित करता है। कम यादृच्छिकता (यह कहकर कि वे इस स्वर "स्थानीय यादृच्छिकता" का प्रदर्शन नहीं करते हैं)। मैं नवोदित सांख्यिकीविद् के लिए कुछ और भ्रामक नहीं सोच सकता!


यद्यपि "वैश्विक यादृच्छिकता" अज्ञात प्रतीत होती है, "स्थानीय यादृच्छिकता" का कम से कम 20 वर्ष का इतिहास है। उदाहरण के लिए, isiweb.ee.ethz.ch/papers/arch/umaure-mass-inspec-1991-1.pdf देखें ।
whuber

nn

2
मुझे याद है कि मैंने कभी-कभी इसे पढ़ा: ऐसे समय में जब लोगों ने अनुकरण, प्रयोग आदि के लिए इस्तेमाल होने वाली "यादृच्छिक संख्याओं" की तालिकाओं वाली पुस्तकों को प्रकाशित किया था, इनमें से कुछ ने छोटे सिमुलेशन में उपयोग के लिए उपयुक्त तालिकाओं के कुछ हिस्सों को चिह्नित किया था (प्रदर्शित "स्थानीय" randomness ") और अन्य भाग जिनका उपयोग केवल बड़े सिमुलेशन के लिए किया जाना चाहिए (" global randomness "प्रदर्शित करना) इसलिए अवधारणाएँ किसी मूल्यवान चीज़ की ओर संकेत करती हैं!
kjetil b halvorsen

1
क्षमा करें, मुझे याद नहीं है कि मैंने यह कहां पढ़ा है। लेकिन यह लगभग स्पष्ट है: यादृच्छिकता को परिभाषित करने में दार्शनिक समस्याओं के अलावा, यदि आपके पास बहुत छोटे सिमुलेशन हैं जहां आपको 1000 यादृच्छिक संख्याओं की आवश्यकता है, और आपका उच्च गुणवत्ता वाला यादृच्छिक जनरेटर आपको 1000 शून्य देता है, ¿आप क्या करते हैं? इस तथ्य के बावजूद कि "सही मायने में यादृच्छिक" अनुक्रम में ऐसे महासागर संभव हैं और वास्तव में आवश्यक हैं, आपका अनुकरण बर्बाद हो गया है!
kjetil b halvorsen 12

1
धन्यवाद दोस्तों, मैं शायद अपनी निंदा में बहुत कठोर था। मैं इस की भाषा को थोड़ा बदल दूंगा।
क्रिस ए।

-1

मुझे लगता है कि विकिपीडिया पोस्ट के लेखक यादृच्छिकता को गलत बता रहे हैं। हां, ऐसे स्ट्रेच हो सकते हैं जो रैंडम नहीं दिखते, लेकिन अगर सीक्वेंस बनाने वाली प्रक्रिया सही मायने में रैंडम है, तो आउटपुट होना ही चाहिए। यदि कुछ अनुक्रम गैर यादृच्छिक प्रतीत होते हैं, तो यह पाठक की एक गलत धारणा है (अर्थात मनुष्य पैटर्न खोजने के लिए डिज़ाइन किए गए हैं)। रात के आकाश में बिग डिपर और ओरियन आदि को देखने की हमारी क्षमता इस बात का कोई सबूत नहीं है कि तारों का पैटर्न गैर-आयामी है। मैं मानता हूं कि यादृच्छिकता अक्सर गैर-आयामी दिखाई देती है। यदि कोई प्रक्रिया वास्तव में लघु अनुक्रमों के लिए गैर-आयामी पैटर्न उत्पन्न करती है, तो यह एक यादृच्छिक प्रक्रिया नहीं है।

मुझे नहीं लगता कि यह प्रक्रिया विभिन्न नमूना आकारों में बदलती है। आप नमूना आकार बढ़ाते हैं, आप संभावना बढ़ाते हैं कि हम एक यादृच्छिक अनुक्रम देखते हैं जो हमें गैर-आयामी प्रतीत होता है। अगर 10% संभावना है कि हम 20 यादृच्छिक टिप्पणियों में एक पैटर्न देखेंगे, तो टिप्पणियों की कुल संख्या को 10000 तक बढ़ाने से संभावना बढ़ जाएगी कि हम गैर-आयामी, कहीं न कहीं देखेंगे।


2
"अगर एक प्रक्रिया वास्तव में छोटे अनुक्रमों के लिए गैर-आयामी पैटर्न उत्पन्न करती है, तो यह एक यादृच्छिक प्रक्रिया नहीं है", मुझे डर है, पूरी तरह से गलत है। उदाहरण के लिए, किसी निष्पक्ष सिक्के के किसी भी 100 झटके में, हम एक पंक्ति में छह सिर या छह पूंछों का निरीक्षण करने की अपेक्षा करेंगे - और यह "यादृच्छिक क्रम के लगभग किसी भी अर्थ" द्वारा "सही मायने में गैर-आयामी पैटर्न" है। " मुझे लगता है कि आपको कुछ लिखने का मतलब है कि अधिक सावधानी से योग्य होने की आवश्यकता है, जैसे "लघु अनुक्रम" से पहले "सभी" को लागू करना।
whuber

वास्तव में? मुझे लगता है कि, एक यादृच्छिक संख्या जनरेटर से पूंछ के सिर के तार को देखने की उम्मीद है, कि जब हम इसे देखते हैं, तो हमें आश्चर्य नहीं होना चाहिए। इसे गैर-आयामी क्यों मानते हैं? यदि एक एक संख्या जनरेटर है कि 100 flips किया था, और यह उद्देश्यपूर्ण एक पंक्ति में 4 या अधिक सिर या पूंछ से परहेज है, यह होगा देखो वास्तव में एक यादृच्छिक प्रक्रिया की तुलना में अधिक यादृच्छिक, लेकिन यह वास्तव nonrandom होगा। यादृच्छिकता का एक भोली दृश्य सभी पैटर्न की कमी है - लेकिन यह गैर-आयामी होगा।
P auritus

आपकी टिप्पणी सही है, लेकिन आपके जवाब में यह स्पष्ट नहीं है और इस बिंदु पर विरोधाभासी भी है। उदाहरण के लिए, "लघु अनुक्रमों के लिए सही मायने में गैर-आयामी पैटर्न" उत्पन्न करने के द्वारा और अधिक सटीक रूप से समझाने पर विचार करें।
whuber

मुझे कोई विरोधाभास नहीं दिखता। आपको लगता है कि यादृच्छिक जनरेटर गैर-आयामी पैटर्न बनाते हैं। वह विरोधाभास है। आप तर्क दे रहे हैं कि वास्तव में यादृच्छिक प्रक्रियाएं गैर यादृच्छिक अवलोकन उत्पन्न करेंगी। आप जो वर्णन कर रहे हैं, वह कुछ ऐसे हैं जिन्हें "क्लस्टरिंग इल्यूजन" कहा जाता है, जो कि बेतरतीब ढंग से समूहों को गलत तरीके से देखने की प्रवृत्ति है। मैं केवल यह कह रहा हूं कि यदि कोई प्रक्रिया गैर-आयामी अवलोकन बनाती है, तो यह यादृच्छिक नहीं है। आप तर्क देते हैं कि आप गैर-आयामी टिप्पणियों के तार बनाने के लिए एक यादृच्छिक प्रक्रिया की अपेक्षा करते हैं, फिर भी आप उस गैर-आयामी को कॉल करते हैं। एपोफेनिया का क्लासिक उदाहरण।
पी auritus

1
एक वार्ताकार के साथ बातचीत करना मुश्किल है, जो किसी की स्थिति को गलत करता है, इसलिए मैं इस एक से बाहर झुकूंगा। माफ़ करना।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.