साधारण डेटा प्रदर्शित करना - मीन्स, मेडियन और मीन रैंक


11

मेरे पास कुछ क्रमिक डेटा हैं जो सामान्य रूप से वितरित नहीं होते हैं, इसलिए मैंने मान-व्हिटनी यू टेस्ट का उपयोग करके गैर-पैरामीट्रिक परीक्षण करने का निर्णय लिया। मैं सात अंकों के समूहों के बीच अंतर देख रहा हूं - ये स्कोर प्रत्येक विषय के लिए 0, 1, 2 या 3 हैं। मुझे यह पता लगाने में कठिनाई हो रही है कि मुझे अपना डेटा कैसे दिखाना है!

यदि मैं मध्यस्थों (और मध्यस्थों के आईक्यूआर) का उपयोग करके डेटा प्रस्तुत करता हूं , तो यह बिल्कुल स्पष्ट नहीं है कि अंतर कहां हैं क्योंकि अधिकांश भाग के लिए या तो 0 या 1 पर मध्यस्थ गिर जाते हैं। इसलिए मैन-व्हिटनी यू टेस्ट के बावजूद महत्वपूर्ण अंतर दिखाते हुए, तालिका सिर्फ निर्बाध दिखती है।

मैं साधनों का उपयोग करके डेटा भी प्रस्तुत कर सकता था । वहाँ कुछ वैज्ञानिक कागजात हैं जो कहते हैं कि आप क्रमिक डेटा के साथ साधनों का उपयोग कर सकते हैं, लेकिन आप एक ही प्रकार की धारणाओं के बीच अंतर के बारे में अनुमान नहीं लगा सकते हैं (जैसे 0 और 1 के बीच का अंतर 1 के बीच के समान नहीं है। 2)। साधनों का उपयोग करना थोड़ा विवादास्पद होगा, हालाँकि जब मैं उनका उपयोग करता हूँ तो तालिका की संख्याएँ कहानी को अच्छी तरह बताती हैं।

एक तीसरा विकल्प मीन रैंकों का उपयोग कर रहा है जो SPSS मुझे मैन-व्हिटनी के आउटपुट में देता है। मतलब रैंक वे हैं जो समूहों के बीच तुलना की जा रही हैं, इसलिए शायद मुझे बस उन का उपयोग करना चाहिए? मेरे पास केवल समस्या यह है कि वास्तविक डेटा के संबंध में माध्य रैंकों का वास्तव में कोई मतलब नहीं है (उदाहरण के लिए मैं यह नहीं देख सकता कि विषय 3 के करीब हैं जबकि नियंत्रण 1 रैन का उपयोग करने के करीब है।)

और एक अंतिम विकल्प ची-वर्ग विश्लेषण का प्रदर्शन कर रहा था, जिसमें विषयों और नियंत्रणों को दो समूहों (0 और 1 के लिए कम और 2 और 3 के लिए उच्च) में विभाजित किया गया था। हालाँकि, जब मैंने ऐसा किया, तो मतभेद स्पष्ट नहीं थे (शायद कई कारणों से)।


क्या आप अपने डेटा को पाठ में, किसी तालिका में, या किसी आकृति में प्रस्तुत करने के लिए सबसे अच्छा है?
गूँग - मोनिका

पाठ और तालिका दोनों। पाठ में मैं यह कहने जा रहा हूं कि मेरे नींद सर्वेक्षण के कई घटकों पर समूहों के बीच महत्वपूर्ण अंतर थे। वे अंतर मान-व्हिटनी परीक्षण के माध्यम से हैं, इसलिए वे औसत रैंक की तुलना कर रहे हैं। मुझे नहीं पता कि मुझे इन अंतरों को एक तालिका में कैसे प्रस्तुत करना चाहिए। मध्यस्थों का उपयोग करना काम नहीं करता है क्योंकि वे बहुत समान हैं और आप अंतर नहीं देख सकते हैं। साधन बेहतर तरीके से काम करते हैं, लेकिन तालिका में पैरामीट्रिक उपायों का उपयोग करना अजीब लगता है जो गैर-पैरामीट्रिक मध्यस्थों के बारे में होना चाहिए। और मतलब है कि रैंक काम करेगा, लेकिन वे वास्तविक मूल्यों का प्रतिनिधित्व नहीं करते हैं।
एरिक

1
मुझे आश्चर्य है कि क्या दो क्रमिक चर के बीच संबंध के लिए ग्राफ से कुछ उत्तर आपके उद्देश्यों के लिए अनुकूलित किए जा सकते हैं? उदाहरण रेखांकन पांच स्तरों के साथ प्रत्येक के बीच दो चर के बीच संबंध दिखाते हैं, लेकिन यदि आप उदाहरण के लिए दो समूहों की तुलना कर रहे हैं और आपके पास चार संभावित स्तर हैं, तो आप कुछ दृश्यों को 5-बाय -2 के बजाय 4-बाय -2 के रूप में फिर से कल्पना कर सकते हैं- 5, शायद।
सिल्वरफिश

यह उपयोगी हो सकता है यदि आप कुछ (संभवतः पूरी तरह से फर्जी) उदाहरण डेटा पोस्ट कर सकते हैं, ताकि जो लोग संभव तकनीक का प्रदर्शन करना चाहते हैं उनके पास काम करने के लिए कुछ हो।
सिल्वरफिश

1
एरिक, एक nonparametric परीक्षण की परिभाषा से, मान-व्हिटनी विशेष रूप से, (प्रभुत्व के लिए) दो वितरणों की तुलना करता है, यह किसी वितरण के विशिष्ट पैरामीटर मान की तुलना नहीं करता है, जैसे कि माध्य या माध्य। कोई एकल संख्या मौजूद नहीं है जो एक वितरण की विशेषता है और एक ही समय में इस मामले में तुलना की जा रही है। आप हॉजेस-लेहमन 2-नमूना अनुमानक का उपयोग कर सकते हैं, लेकिन यह दो वितरणों के बीच अंतर की विशेषता है और प्रत्येक दो वितरणों में से नहीं है।
ttnphns

जवाबों:


8

1,2,=3

क्रमिक चर को संक्षेप करने के लिए माध्य का उपयोग करने की शुद्धता शायद ही कभी डेटा से आ सकती है। यह व्यक्तिपरक है।

Dxyγxy


1
हाय फ्रैंक, आपकी विचारशील प्रतिक्रिया के लिए धन्यवाद। यदि आपको कोई आपत्ति नहीं है, तो मेरे पास कुछ अनुवर्ती प्रश्न हैं। साधनों के बारे में - मेरा मानना ​​है कि श्रेणियां कम से कम आधी सार्थक हैं, क्योंकि वे मूल रूप से "नहीं, हल्के, मध्यम और गंभीर हानि" का उल्लेख करते हैं। क्या कोई संदर्भ है जो आप जानते हैं कि मैं इसके लिए मिसाल के रूप में उपयोग करने में सक्षम हो सकता हूं? मैं भी केवल एक तालिका में साधनों का उपयोग करने में हिचकिचाता हूं, और स्थिरता के लिए दूसरों में मध्यस्थता करता हूं। और मीन रैंकों के लिए - मेरा मानना ​​है कि मैं समूहों की तुलना कर रहा हूं - विषयों बनाम 7 स्कोर पर नियंत्रण। क्या तुलना का मतलब स्वीकार्य / उपयोगी है?
एरिक

कुछ स्तरों के साथ संख्यात्मक क्रमिक डेटा के लिए, जैसे कि मायने रखता है और शायद आपकी हानि का उदाहरण है, साधन उपयोगी हैं और मध्यस्थ (बहुत अधिक संबंधों के कारण) नहीं हैं। ऐसे कई अवसर हैं जब मैंने तिरछे निरंतर लोगों के लिए सामान्य डेटा के लिए साधनों का उपयोग किया है, उसी तालिका में।
फ्रैंक हरेल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.