एकाधिक रैंक सूचियों से कुल मिलाकर रैंक


13

मैंने ऑनलाइन बहुत सारे साहित्य उपलब्ध हैं, जिसमें बिना किसी भाग्य के इस मंच को शामिल किया गया है और किसी को उम्मीद है कि मैं वर्तमान में सामना कर रहे सांख्यिकीय मुद्दे की मदद कर सकता हूं:

मेरे पास रैंक किए गए डेटा की 5 सूचियां हैं, जिनमें से प्रत्येक में 10 आइटम हैं जिन्हें 1 (सर्वश्रेष्ठ) से स्थिति 10 (सबसे खराब) स्थान दिया गया है। संदर्भ के लिए, प्रत्येक सूची में 10 आइटम समान हैं, लेकिन अलग-अलग क्रमबद्ध क्रम में क्योंकि उनकी रैंक तय करने के लिए उपयोग की जाने वाली तकनीक अलग है।

उदाहरण डेटा:

            List 1      List 2      List 3     ... etc
Item 1     Ranked 1    Ranked 2    Ranked 1     
Item 2     Ranked 3    Ranked 1    Ranked 2
Item 3     Ranked 2    Ranked 3    Ranked 3
... etc

मैं उपरोक्त डेटा की व्याख्या और विश्लेषण करने का एक तरीका ढूंढ रहा हूं ताकि मुझे प्रत्येक परीक्षण और उसकी स्थिति के आधार पर प्रत्येक आइटम की समग्र रैंक दिखाते हुए एक अंतिम परिणाम प्राप्त हो, जैसे

Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc

अब तक मैंने पियर्सन के सहसंबंध, स्पीयरमैन के सहसंबंध, केंडल ताऊ के बी, और फ्रीडमैन परीक्षणों के प्रदर्शन से इस जानकारी की व्याख्या करने का प्रयास किया है। हालाँकि, मैंने पाया है कि इन परिणामों ने आम तौर पर मेरी सूची (यानी सूची 1 से सूची 2 की तुलना की है, तो सूची 1 से सूची 3 .. आदि तक), या कुल मिलाकर लगभग ची-स्क्वायर, पी-वैल्यू आदि जैसे परिणाम उत्पन्न किए हैं। डेटा।

क्या किसी को पता है कि मैं इस डेटा को सांख्यिकीय रूप से ध्वनि विधि (एक पोस्ट ग्रेजुएट / पीएचडी लागू स्तर पर) की व्याख्या कैसे कर सकता हूं ताकि मैं 5 परीक्षणों के दौरान सूची में प्रत्येक आइटम के महत्व को इंगित करने वाले समग्र रैंक को समझ सकूं? या, यदि कोई अन्य प्रकार की तकनीक या सांख्यिकीय परीक्षण है तो मैं देख सकता हूं कि मैं किसी संकेत या मार्गदर्शन की सराहना करूंगा।

(यह शायद ध्यान देने योग्य भी है, मैंने सरल गणितीय तकनीकों जैसे कि रकम, औसत, न्यूनतम - अधिकतम परीक्षण आदि का भी प्रदर्शन किया है, लेकिन ऐसा नहीं लगता कि ये इस स्तर पर सांख्यिकीय रूप से महत्वपूर्ण हैं)।

किसी भी मदद या सलाह की बहुत सराहना की जाएगी, आपके समय के लिए धन्यवाद।


1
मुझे दो प्रश्न मिलते हैं, जो उचित रूप से व्याख्या किए गए हैं, डुप्लिकेट प्रतीत होते हैं (और इसलिए पहले से ही उत्तर प्रदान करते हैं) : ysts.stackexchange.com/search ? q=valuation+rank । क्या ये पर्याप्त हैं? यदि नहीं, तो कृपया हमें यह समझने में मदद करें कि आपकी स्थिति के बारे में क्या खास है।
whuber

आपके प्रतिक्रिया के लिए धन्येवाद। मैंने इन लेखों पर एक नज़र डाली है, और मुझे यकीन नहीं है कि वे नहीं हैं कि मैं क्या देख रहा हूं, या क्या यह मेरी समझ में गलती है। मुझे इन लेखों में यह धारणा मिलती है कि प्रत्येक डेटा सेट के विभिन्न अर्थों के कई चर होते हैं, और यह कि रैंक अलग-अलग हो सकते हैं या केवल रैंक की तुलना में अधिक विवरण पूर्णांक मान हो सकते हैं। मैं सिर्फ एक सांख्यिकीय रूप से सिद्ध तरीके की तलाश में हूं जो 'कुल मिलाकर सबसे महत्वपूर्ण आइटम X है, उसके बाद Y ... और अंतिम रूप से (या कम से कम महत्वपूर्ण) आइटम Z' कह सकता है। मैं इन रैंकों के 1-10 को सादे संख्याओं के रूप में विश्लेषण करने पर विचार कर रहा हूं
Liam

1
उन धागों का एक प्रमुख बिंदु यह है कि ऐसा कोई "सांख्यिकीय रूप से सिद्ध तरीका" नहीं है। यह मूल्यांकन का प्रश्न है : आपके परिणामों का कोई भी सांख्यिकीय संयोजन उनके बीच व्यापार की भावना को दर्शाता है। उदाहरण के लिए , आपकी "वस्तुएं" कारें हो सकती हैं और "तकनीक" उन्हें विभिन्न विशेषताओं के अनुसार रैंक कर सकती हैं: लागत, ईंधन दक्षता, शक्ति, आराम, आदि "सर्वश्रेष्ठ" की आपकी व्यक्तिगत भावना किसी और की भावना से काफी भिन्न हो सकती है " आप दोनों सही होंगे।
whuber

क्या आपको जवाब मिला? छुट्टी टिप्पणी यहाँ कृपया stats.stackexchange.com/questions/347336/...
रे सांकेतिक शब्दों में बदलनेवाला

जवाबों:


7

मुझे यकीन नहीं है कि आप सहसंबंध और समान उपायों को क्यों देख रहे थे। वहाँ कुछ भी नहीं लगता है सहसंबंधी।

इसके बजाय, कई विकल्प हैं, वास्तव में दूसरे से बेहतर कोई नहीं है , लेकिन आप जो चाहते हैं उसके आधार पर:

औसत रैंक लें और फिर औसत रैंक लें (लेकिन यह डेटा को अंतराल के रूप में मानता है)

मंझला रैंक ले लो और फिर मंझला रैंक (लेकिन यह संबंधों में हो सकता है)

प्रत्येक आइटम को मिले 1 स्थान के वोटों की संख्या लें, और इसके आधार पर उन्हें रैंक करें

अंतिम स्थान के वोटों की संख्या लें और उसी के आधार पर उन्हें (उलटा, स्पष्ट रूप से) रैंक दें।

आप जो उचित समझते हैं, उसके आधार पर रैंकों के कुछ भारित संयोजन बनाएं।


4
थ्रेड्स में एक महत्वपूर्ण बिंदु जिसे मैंने एक टिप्पणी में संदर्भित किया है - और मुझे लगता है कि यह पूरे मुद्दे का क्रुक्स है - क्या ये सभी तरीके मनमाने हैं । वस्तुनिष्ठ तरीके मौजूद हैं लेकिन उन्हें डेटा में निहित जानकारी के उपयोग की आवश्यकता होती है। यही आंकड़े इसके बजाय मूल्यांकन की समस्या बनाता है ।
whuber

आप रैंक के भारित संयोजन का क्या सुझाव देंगे?
आर्ची

4

जैसा कि दूसरों ने बताया है, ऐसे बहुत से विकल्प हैं जिनका आप अनुसरण कर सकते हैं। मेरे द्वारा सुझाया गया तरीका औसत रैंक पर आधारित है, अर्थात पीटर का पहला प्रस्ताव।

इस मामले में, अंतिम रैंकिंग के सांख्यिकीय महत्व की जांच दो-चरणीय सांख्यिकीय परीक्षण द्वारा की जा सकती है। इस से मिलकर एक गैर पैरामीट्रिक प्रक्रिया है फ्राइडमैन परीक्षण एक इसी पद-हॉक परीक्षण, साथ Nemenyi परीक्षण । ये दोनों ही औसत रैंक पर आधारित हैं। फ्राइडमैन परीक्षण का उद्देश्य शून्य परिकल्पना को अस्वीकार करना और निष्कर्ष निकालना है कि वस्तुओं के बीच कुछ अंतर हैं । यदि ऐसा है, तो हम Nemenyi परीक्षण के साथ यह पता लगाने के लिए आगे बढ़ते हैं कि वास्तव में कौन से आइटम अलग हैं। (हम सीधे मौके के बाद महत्व से बचने के लिए पोस्ट-हॉक टेस्ट के साथ शुरू नहीं करते हैं।)

अधिक विवरण, जैसे इन दोनों परीक्षणों के लिए महत्वपूर्ण मान, पेपर में डेमसर द्वारा पाया जा सकता है ।


2

ताउ-एक्स का उपयोग करें (जहां "x" "eXtended" ताऊ-बी को संदर्भित करता है)। ताउ-एक्स, कोमेनी-स्नेल दूरी मीट्रिक के सह-संबंध है - रैंक की गई मीट्रिक की सभी आवश्यकताओं को पूरा करने वाले रैंक किए गए आइटमों की सूची के बीच अद्वितीय दूरी मीट्रिक साबित होती है। Kemeny और Snell द्वारा "सामाजिक विज्ञान में गणितीय मॉडल" का अध्याय 2 देखें, "आम सहमति रैंकिंग समस्या के लिए आवेदन के साथ एक नया रैंक सहसंबंध गुणांक, एडवर्ड एमॉन्ड, डेविड मेसन, जर्नल ऑफ़ मल्टी-क्रिटिसल डिसीजन एनालिसिस, 11: 17- 17 28 (2002)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.