क्या


33

मान लीजिए आप अनुक्रम का निरीक्षण करते हैं:

7, 9, 0, 5, 5, 5, 5, 4, 8, 0, 6, 9, 5, 3, 8, 7, 8, 5, 4, 0, 6, 4, 5, 3, 3, 3, 7, 5, 9, 8, 1, 8, 6, 2, 8, 4, 6, 4, 1, 9, 9, 0, 5, 2, 2, 4, 5, 2, 8। ..

यदि यह वास्तव में यादृच्छिक है, तो यह निर्धारित करने के लिए आप क्या सांख्यिकीय परीक्षण लागू करेंगे? FYI ये के वें अंक हैं । इस प्रकार, सांख्यिकीय रूप से यादृच्छिक अंक हैं ? क्या यह निरंतर बारे में कुछ कहता है ?π π πnπππ

यहाँ छवि विवरण दर्ज करें




10
यह एक दिलचस्प और भ्रामक प्रश्न है। कोई भी छात्र जिसने माप-सिद्धांत की संभावना में पहला कोर्स किया है, वह आसानी से यह साबित कर सकता है कि "लगभग सभी" वास्तविक संख्या सामान्य हैं । लेकिन बहुत कम स्पष्ट उदाहरण ज्ञात हैं, और मेरे (ऑफ-हैंड) ज्ञान के लिए, मामले को "प्रसिद्ध" तर्कहीन गणितीय स्थिरांक में से किसी के लिए भी नहीं सुलझाया गया है।
कार्डिनल

4
@ कार्डिनल की टिप्पणी के साथ (सख्त) कनेक्शन: सामान्य संख्या

6
ग्राफ क्या है? दस बार हैं, अजीब तरह से जगह है, और सभी 10% से अधिक मूल्यों के साथ हैं!
ज़ेन

जवाबों:


15

यूएस नेशनल इंस्टीट्यूट ऑफ स्टैंडर्ड ने परीक्षणों की एक बैटरी को एक साथ रखा है कि एक (छद्म) यादृच्छिक संख्या जनरेटर को पर्याप्त माना जाना चाहिए, http://csrc.nist.gov/groups/ST/toolkit/rng/stats_stests देखें । एचटीएमएल । परीक्षणों के डायहार्ड सूट के रूप में भी जाने जाने वाले परीक्षण हैं , जो एनआईएसटी परीक्षणों के साथ कुछ हद तक ओवरलैप होते हैं। स्टाटा स्टैटिस्टिकल पैकेज के डेवलपर्स अपने सर्टिफिकेट प्रक्रिया के एक भाग के रूप में अपने Diehard परिणामों की रिपोर्ट करते हैं। मैं आप में से अंक के ब्लॉक ले जा सकते हैं की कल्पना , लगातार 15 अंक के समूह में कहते हैं, के लिए तुलनीय होने के लिए डबल प्रकार सटीकता , और इस प्रकार प्राप्त की संख्या पर परीक्षण के इन बैटरियों को चलाते हैं।π


5

अपने प्रश्नों के पहले उत्तर देना: "यह निर्धारित करने के लिए कि आप क्या परीक्षण लागू करेंगे ? [अनुक्रम] वास्तव में यादृच्छिक है?"

समय-श्रृंखला के रूप में इसका इलाज कैसे करें, और ऑटो-सहसंबंधों के लिए जाँच करें? यहाँ कुछ आर कोड है। पहले कुछ परीक्षण डेटा (पहले 1000 अंक):

digits_string="1415926535897932384626433832795028841971693993751058209749445923078164062862089986280348253421170679821480865132823066470938446095505822317253594081284811174502841027019385211055596446229489549303819644288109756659334461284756482337867831652712019091456485669234603486104543266482133936072602491412737245870066063155881748815209209628292540917153643678925903600113305305488204665213841469519415116094330572703657595919530921861173819326117931051185480744623799627495673518857527248912279381830119491298336733624406566430860213949463952247371907021798609437027705392171762931767523846748184676694051320005681271452635608277857713427577896091736371787214684409012249534301465495853710507922796892589235420199561121290219608640344181598136297747713099605187072113499999983729780499510597317328160963185950244594553469083026425223082533446850352619311881710100031378387528865875332083814206171776691473035982534904287554687311595628638823537875937519577818577805321712268066130019278766111959092164201989"
digits=as.numeric(unlist(strsplit(digits_string,"")))

प्रत्येक अंक की गिनती की जाँच करें:

> table(digits)
digits
  0   1   2   3   4   5   6   7   8   9 
 93 116 103 102  93  97  94  95 101 106 

फिर इसे टाइम-सीरीज़ में बदल दें और बॉक्स-पियर्स टेस्ट चलाएं:

d=as.ts( digits )
Box.test(d)

जो मुझे बताता है:

X-squared = 1.2449, df = 1, p-value = 0.2645

आमतौर पर आप चाहते हैं कि स्वतः-सहसंबंध होने के लिए पी-मान 0.05 से कम हो।

acf(d)ऑटो-सहसंबंधों को देखने के लिए चलाएँ । मैंने यहां एक छवि को शामिल नहीं किया है क्योंकि यह एक सुस्त चार्ट है, हालांकि यह उत्सुक है कि सबसे बड़ी acf(d,lag.max=40)लैग 11 और 22 पर हैं। यह दिखाने के लिए भागो कि लैग = 33 पर कोई चोटी नहीं है, और यह सिर्फ संयोग था!


PS हम तुलना कर सकते हैं कि वास्तविक यादृच्छिक संख्याओं पर समान परीक्षण करके पाई के उन 1000 अंकों को कितनी अच्छी तरह से किया।

probs=sapply(1:100,function(n){
    digits=floor(runif(1000)*10)
    bt=Box.test(ts(digits))
    bt$p.value
    })

यह 1000 यादृच्छिक अंक उत्पन्न करता है, परीक्षण करता है और इस 100 बार दोहराता है।

> summary(probs)
    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
0.006725 0.226800 0.469300 0.467100 0.709900 0.969900 
> sd(probs)
[1] 0.2904346

इसलिए हमारा परिणाम पहले मानक विचलन के भीतर आराम से था, और पीआई एक यादृच्छिक बतख की तरह होता है। (मैं set.seed(1)उन सटीक संख्याओं को पुन: पेश करना चाहता हूं, तो मैंने इस्तेमाल किया ।)


0

अजीब सवाल है। नंबर यादृच्छिक नहीं हैं।

π

.१२१२१२१२१२...

πππ2222+1ππ


π

π

2
मैं वास्तव में इस उत्तर का पालन नहीं करता हूं। हां, पाई तय है, लेकिन अंकों की श्रृंखला अभी भी यादृच्छिक संख्याओं की एक श्रृंखला की तरह व्यवहार कर सकती है। मैं नहीं देखता कि कैसे 0.1212 ... किसी भी परिभाषा से यादृच्छिकता का प्रतिनिधित्व करता है। और जैसा कि आप अपनी टिप्पणी में बताते हैं, कि क्या pi में अंकों का कुछ मनमाना अनुक्रम है या नहीं, इसके अंकों के यादृच्छिक प्रकृति पर बहुत कम असर पड़ता है। तो उस पर ध्यान क्यों?
न्यूक्लियर वांग

π

@ अदमो आप केवल उस भविष्यवाणी को कर सकते हैं यदि आप पहले से जानते हैं कि आप जिस संख्या का वर्णन कर रहे हैं वह पाई है, जो धोखा देने जैसा लगता है। 3.141592 के अंक कोई संकेत नहीं देते हैं कि अगला अंक 6 है; एक ही रास्ता आप जानते हैं कि क्योंकि हम विशेष रूप से पी का वर्णन कर रहे हैं। जब तक आप पहले से ही एन अंकों के लिए पीआई की गणना नहीं करते हैं, तब तक डिजिट एन से किसी विशेष संख्या की उम्मीद करने का कोई कारण नहीं है। आपको लगता है कि संख्याओं के यादृच्छिक अनुक्रम जैसी कोई बात नहीं है, क्योंकि एक बार जब आप इसे लिखते हैं, तो यह तय हो जाता है।
परमाणु वांग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.