पाई के द्विआधारी मूल्य को प्राप्त करने के लिए http://www.befria.nu/elias/pi/binpi.html से खुदाई करें (ताकि दशमलव अंकों का उपयोग करने के बजाय बाइट में परिवर्तित करना आसान हो) और फिर इसे प्रवेश के माध्यम से चलाएं मैं बाइट्स के यादृच्छिक वितरण के विश्लेषण के लिए निम्नलिखित प्राप्त करता हूं:
एंट्री = 7.954093 बिट प्रति बाइट।
इष्टतम संपीड़न 4096 बाइट फ़ाइल के आकार को 0 प्रतिशत तक कम कर देगा।
4096 नमूनों के लिए ची वर्ग वितरण 253.00 है, और बेतरतीब ढंग से इस मूल्य को 52.36 प्रतिशत से अधिक होगा।
डेटा बाइट्स के अंकगणितीय माध्य मान 126.6736 (127.5 = यादृच्छिक) है।
पाई के लिए मोंटे कार्लो का मूल्य 3.120234604 (त्रुटि 0.68 प्रतिशत) है।
सीरियल सहसंबंध गुणांक 0.028195 (पूरी तरह से असंबंधित = 0.0) है।
तो हां, यादृच्छिक डेटा के लिए पाई का उपयोग करने से आपको काफी यादृच्छिक डेटा मिलेगा ... यह महसूस करते हुए कि यह यादृच्छिक डेटा है।
ऊपर एक टिप्पणी से ...
आप जो कर रहे हैं, उसके आधार पर, लेकिन मुझे लगता है कि आप किसी भी अभाज्य संख्या के वर्गमूल के दशमलव को यादृच्छिक संख्या जनरेटर के रूप में उपयोग कर सकते हैं। इन्हें कम से कम समान रूप से अंक वितरित करने चाहिए। - पैक्सिनम
इसलिए, मैंने समस्याओं के समान सेट को अंडरटेक करने के लिए द्विआधारी में 2 के वर्गमूल की गणना की। वुल्फराम के Iteration का उपयोग करते हुए मैंने एक सरल पर्ल स्क्रिप्ट लिखी
#!/usr/bin/perl
use strict;
use Math::BigInt;
my $u = Math::BigInt->new("2");
my $v = Math::BigInt->new("0");
my $i = 0;
while(1) {
my $unew;
my $vnew;
if($u->bcmp($v) != 1) { # $u <= $v
$unew = $u->bmul(4);
$vnew = $v->bmul(2);
} else {
$unew = ($u->bsub($v)->bsub(1))->bmul(4);
$vnew = ($v->badd(2))->bmul(2);
}
$v = $vnew;
$u = $unew;
#print $i," ",$v,"\n";
if($i++ > 10000) { last; }
}
open (BITS,"> bits.txt");
print BITS $v->as_bin();
close(BITS);
पहले 10 के लिए यह रनिंग A095804 से मेल खाता था इसलिए मुझे विश्वास था कि मेरे पास अनुक्रम है। पहले अंक के बाद रखे गए बाइनरी पॉइंट के साथ बाइनरी में लिखे जाने पर मान v n 2 के वर्गमूल का एक अनुमान देता है।
इस द्विआधारी डेटा के खिलाफ दर्ज का उपयोग कर उत्पादन:
Entropy = 7.840501 bits per byte.
Optimum compression would reduce the size
of this 1251 byte file by 1 percent.
Chi square distribution for 1251 samples is 277.84, and randomly
would exceed this value 15.58 percent of the times.
Arithmetic mean value of data bytes is 130.0616 (127.5 = random).
Monte Carlo value for Pi is 3.153846154 (error 0.39 percent).
Serial correlation coefficient is -0.045767 (totally uncorrelated = 0.0).