मेरे पास कई सौ माप हैं। अब, मैं हर उपाय के साथ हर उपाय को सहसंबद्ध करने के लिए कुछ प्रकार के सॉफ्टवेयर का उपयोग करने पर विचार कर रहा हूं। इसका मतलब है कि हजारों सहसंबंध हैं। इनमें (सांख्यिकीय रूप से) एक उच्च सहसंबंध होना चाहिए, भले ही डेटा पूरी तरह से यादृच्छिक हो (प्रत्येक उपाय में केवल लगभग 100 डेटा पॉइंट हैं)।
जब मैं एक सहसंबंध खोजता हूं, तो मैं इस बारे में जानकारी कैसे शामिल करूं कि मैंने एक सहसंबंध के लिए कितनी मेहनत की है, उसमें क्या है?
मैं आंकड़ों में उच्च स्तर पर नहीं हूं, इसलिए कृपया मेरे साथ रहें।
Rइस मशीन पर 18 सेकंड लेता है एक मैट्रिक्स 100 से 300 के लिए अधिकतम सहसंबंध गुणांक का अशक्त क्रमचय वितरण के 1000 प्रतीति प्राप्त करने के लिए x:correl <- function(x, k=1) { n <- dim(x)[2] * (dim(x)[2]-1) / 2; v <- cor(x); sort(v[lower.tri(v)])[(n-k+1):n] }; sim <- replicate(1000, correl(apply(x,2,sample)))