कुछ विचार जो मैंने लिए हैं:
यह एक दो-नमूना टी-टेस्ट करने के लिए समान है - सिवाय इसके कि दूसरे नमूने के लिए मेरे पास केवल एक ही मूल्य है, और 30 मान आवश्यक रूप से सामान्य रूप से वितरित नहीं हैं।
सही बात। विचार एक मूल्य के साथ एक टी-टेस्ट जैसा है। चूंकि वितरण ज्ञात नहीं है, और केवल 30 डेटा बिंदुओं के साथ सामान्यता को निगलने में थोड़ा मुश्किल हो सकता है, यह किसी प्रकार के गैर-पैरामीट्रिक परीक्षण के लिए कहता है।
यदि 30 माप के बजाय मेरे पास 10000 माप थे, तो एकल माप की रैंक कुछ उपयोगी जानकारी प्रदान कर सकती है।
30 मापों के साथ भी रैंक जानकारीपूर्ण हो सकता है।
जैसा कि @whuber ने बताया है, आप किसी प्रकार का पूर्वानुमान अंतराल चाहते हैं। गैर-पैरामीट्रिक मामले के लिए, आप जो पूछ रहे हैं, अनिवार्य रूप से, निम्नलिखित है: क्या संभावना है कि किसी दिए गए डेटा बिंदु के पास मौका होगा जिससे हम आपके 31 वें माप के लिए अवलोकन करते हैं?
यह एक सरल क्रमचय परीक्षण के माध्यम से संबोधित किया जा सकता है। यहां 15 मूल्यों और एक उपन्यास (16 वीं अवलोकन) के साथ एक उदाहरण दिया गया है जो वास्तव में पिछले किसी भी से बड़ा है:
932
915
865
998
521
462
688
1228
746
433
662
404
301
473
647
new value: 1374
हम एन क्रमपरिवर्तन करते हैं, जहां सूची में तत्वों के क्रम को फेरबदल किया जाता है, फिर सवाल पूछते हैं: सूची (फेरबदल) सूची में पहले तत्व के मूल्य के लिए रैंक क्या है?
N = 1,000 प्रदर्शन करने से हमें 608 मामले मिलते हैं जिसमें सूची में पहले तत्व की रैंक नए मूल्य के रैंक के बराबर या बेहतर होती है (वास्तव में बराबर है, क्योंकि नया मूल्य सबसे अच्छा है)। 1,000 क्रमोन्नति के लिए फिर से सिमुलेशन चल रहा है, हम 658 ऐसे मामले प्राप्त करते हैं, फिर 663 ...
यदि हम N = 1,000,000 क्रमपरिवर्तन करते हैं, तो हम 62825 मामले प्राप्त करते हैं जिसमें सूची में पहले तत्व की रैंक नए मूल्य के रैंक के बराबर या बेहतर होती है (आगे सिमुलेशन 62871 मामले देते हैं, फिर 62840 ...)। यदि उन मामलों के बीच का अनुपात लें, जिनमें स्थिति संतुष्ट है और क्रमपरिवर्तन की कुल संख्या है, तो हमें 0.062825, 0.062871, 0.06284 जैसे नंबर मिलते हैं ...
आप इन मूल्यों को १ / १६ = ०.०६२५ (६.२५%) के लिए अभिसरण करते हुए देख सकते हैं, जो @whuber नोट्स के रूप में, संभावना है कि यादृच्छिक पर दिए गए एक मूल्य (१६ में से) उनके बीच सबसे अच्छा संभव रैंक है।
नए डेटासेट के लिए, जहां नया मान दूसरा सर्वोत्तम मूल्य है (यानी रैंक 2):
6423
8552
6341
6410
6589
6134
6500
6746
8176
6264
6365
5930
6331
6012
5594
new value: 8202
हम (एन = 1,000,000 क्रमपरिवर्तन के लिए) प्राप्त करते हैं: 125235, 124883 ... अनुकूल मामलों में, फिर से, संभावना है कि एक दिए गए मान (16 में से) यादृच्छिक पर उनके बीच दूसरा सबसे अच्छा संभव रैंक है: 2/16 = 0.125 (12.5%)।