मेरे पास कई सौ माप हैं। अब, मैं हर उपाय के साथ हर उपाय को सहसंबद्ध करने के लिए कुछ प्रकार के सॉफ्टवेयर का उपयोग करने पर विचार कर रहा हूं। इसका मतलब है कि हजारों सहसंबंध हैं। इनमें (सांख्यिकीय रूप से) एक उच्च सहसंबंध होना चाहिए, भले ही डेटा पूरी तरह से यादृच्छिक हो (प्रत्येक उपाय में केवल लगभग 100 डेटा पॉइंट हैं)।
जब मैं एक सहसंबंध खोजता हूं, तो मैं इस बारे में जानकारी कैसे शामिल करूं कि मैंने एक सहसंबंध के लिए कितनी मेहनत की है, उसमें क्या है?
मैं आंकड़ों में उच्च स्तर पर नहीं हूं, इसलिए कृपया मेरे साथ रहें।
R
इस मशीन पर 18 सेकंड लेता है एक मैट्रिक्स 100 से 300 के लिए अधिकतम सहसंबंध गुणांक का अशक्त क्रमचय वितरण के 1000 प्रतीति प्राप्त करने के लिए x
:correl <- function(x, k=1) { n <- dim(x)[2] * (dim(x)[2]-1) / 2; v <- cor(x); sort(v[lower.tri(v)])[(n-k+1):n] }; sim <- replicate(1000, correl(apply(x,2,sample)))