क्रमिक डेटा के लिए उपयोग करने के लिए अच्छे बुनियादी आँकड़े क्या हैं?


67

मेरे पास सर्वेक्षण के सवालों से प्राप्त कुछ क्रमिक डेटा हैं । मेरे मामले में वे लिकर शैली की प्रतिक्रियाएँ हैं (दृढ़ता से असहमत-असहमत-तटस्थ-सहमत-मजबूत-सहमत)। मेरे डेटा में उन्हें 1-5 के रूप में कोडित किया गया है।

मुझे नहीं लगता कि इसका मतलब यहाँ बहुत होगा, इसलिए बुनियादी सारांश आँकड़े क्या उपयोगी माने जाते हैं?


2
सामान्य विकल्पों में शामिल हैं - प्रत्येक समूह में मध्यस्थ, मोड, अनुपात या संचयी अनुपात
Glen_b

जवाबों:


29

एक आवृत्ति तालिका शुरू करने के लिए एक अच्छी जगह है। आप प्रत्येक स्तर के लिए गिनती, और सापेक्ष आवृत्ति कर सकते हैं। इसके अलावा, कुल गणना और लापता मूल्यों की संख्या उपयोग की हो सकती है।

आप एक बार में दो चर की तुलना करने के लिए एक आकस्मिक तालिका का उपयोग कर सकते हैं। मोज़ेक प्लॉट का उपयोग करके भी प्रदर्शित कर सकते हैं।


32

मैं एक लागू दृष्टिकोण से यह तर्क देने जा रहा हूं कि लिक आइटम की केंद्रीय प्रवृत्ति को सारांशित करने के लिए यह अक्सर सबसे अच्छा विकल्प है। विशेष रूप से, मैं छात्र संतुष्टि सर्वेक्षण, बाजार अनुसंधान तराजू, कर्मचारी राय सर्वेक्षण, व्यक्तित्व परीक्षण आइटम और कई सामाजिक विज्ञान सर्वेक्षण आइटम जैसे संदर्भों के बारे में सोच रहा हूं।

ऐसे संदर्भों में, अनुसंधान के उपभोक्ता अक्सर सवालों के जवाब चाहते हैं जैसे:

  • किन बयानों में कमोबेश दूसरों के सापेक्ष समझौता होता है?
  • दिए गए कथन से कौन से समूह अधिक या कम सहमत हुए?
  • समय के साथ, समझौता ऊपर या नीचे चला गया है?

इन उद्देश्यों के लिए, माध्य के कई लाभ हैं:

1. गणना करना आसान है:

  • कच्चे डेटा और माध्य के बीच के संबंध को देखना आसान है।
  • यह व्यावहारिक रूप से गणना करने में आसान है। इस प्रकार, मतलब को आसानी से रिपोर्टिंग सिस्टम में एम्बेड किया जा सकता है।
  • यह संदर्भों, और सेटिंग्स में तुलनीयता की सुविधा भी देता है।

2. मीन अपेक्षाकृत अच्छी तरह से समझा और सहज है:

  • माध्य का उपयोग अक्सर लिक्वेर्ट आइटम की केंद्रीय प्रवृत्ति की रिपोर्ट करने के लिए किया जाता है। इस प्रकार, अनुसंधान के उपभोक्ता माध्य को समझने की अधिक संभावना रखते हैं (और इस तरह उस पर भरोसा करते हैं, और उस पर कार्य करते हैं)।
  • कुछ शोधकर्ता पसंद करते हैं, यकीनन, 4 या 5. का जवाब देने वाले नमूने के प्रतिशत को रिपोर्ट करने का अधिक सहज विकल्प, यह "प्रतिशत समझौते" की अपेक्षाकृत सहज व्याख्या है। संक्षेप में, यह 0, 0, 0, 1, 1कोडिंग के साथ माध्य का एक वैकल्पिक रूप है ।
  • इसके अलावा, समय के साथ, अनुसंधान के उपभोक्ता संदर्भ के फ्रेम का निर्माण करते हैं। उदाहरण के लिए, जब आप अपने शिक्षण प्रदर्शन की वर्ष-दर-वर्ष, या विषयों से तुलना कर रहे हों, तो आप 3.7, 3.9 या 4.1 का मतलब क्या है, इसकी बारीक समझ बनाते हैं।

3. माध्य एक एकल संख्या है:

  • एक एकल संख्या विशेष रूप से मूल्यवान है, जब आप दावे करना चाहते हैं जैसे "छात्र विषय वाई की तुलना में विषय एक्स से अधिक संतुष्ट थे।"
  • मुझे यह भी पता चलता है कि अनुभवजन्य रूप से, एक एकल संख्या वास्तव में लिकर आइटम में रुचि की मुख्य जानकारी है। मानक विचलन उस सीमा से संबंधित होता है, जिस पर केंद्रीय स्कोर करीब होता है (जैसे, 3.0)। बेशक, आनुभविक रूप से, यह आपके संदर्भ में लागू नहीं हो सकता है। उदाहरण के लिए, मैंने कहीं पढ़ा कि जब यू-ट्यूब रेटिंग में स्टार सिस्टम था, तो बड़ी संख्या में सबसे कम या उच्चतम रेटिंग थी। इस कारण से, श्रेणी आवृत्तियों का निरीक्षण करना महत्वपूर्ण है।

4. इससे बहुत फ़र्क नहीं पड़ता

  • हालाँकि, मैंने इसका औपचारिक रूप से परीक्षण नहीं किया है, लेकिन मैं इस बात की परिकल्पना करूंगा कि वस्तुओं, या प्रतिभागियों के समूहों, या समय के साथ केंद्रीय प्रवृत्ति रेटिंग्स की तुलना करने के लिए, माध्य उत्पन्न करने के लिए स्केलिंग का कोई भी उचित विकल्प समान निष्कर्ष निकलेगा।

4
अच्छा लेख! क्या आपके पास इस बारे में कोई विचार है कि विभिन्न संस्कृतियों / देशों में किस प्रकार तराजू का उपयोग किया जा सकता है जो इन प्रकार के परिणामों को काफी प्रभावित करेगा?
चेस

@चेज़ इस पर शोध हुआ है, लेकिन जब से मैंने इसे देखा है, तब से कुछ समय हो गया है। यहाँ Google विद्वान scholar.google.com.au/…
जिरोमी एंग्लिम

मैं माध्य के उपयोग पर श्री जेरोमे एंग्लीम के औचित्य से सहमत हूं (यानी, भारित माध्य सटीक होना), सबसे विश्वसनीय निष्पक्ष क्रमबद्ध व्याख्या के रूप में क्रमबद्ध श्रेणीगत चर जैसे लिकट पैमाने का उपयोग जहां प्रत्येक डेटा बिंदु में योगदान होता है। अंतिम औसत।


28

बुनियादी सारांश के लिए, मैं मानता हूं कि आवृत्ति तालिका की रिपोर्टिंग और केंद्रीय प्रवृत्ति के बारे में कुछ संकेत ठीक है। अनुमान के लिए, हाल ही में PARE में प्रकाशित एक लेख- बनाम MWW- टेस्ट, फाइव-पॉइंट लाइक आइटम: t test vs Mann-Whitney-Wilcoxon पर चर्चा की गई ।

अधिक विस्तृत उपचार के लिए, मैं क्रमबद्ध वैरिएबल पर अग्रेंजी की समीक्षा पढ़ने की सलाह दूंगा:

लियू, वाई और एगेस्टी, ए (2005)। क्रमबद्ध श्रेणीबद्ध डेटा का विश्लेषण: एक अवलोकन और हाल के घटनाक्रम का एक सर्वेक्षणसोसिएडैड डे एस्टैडिका ई इंवेनिगासियोन ओपरेटिवा टेस्ट , 14 (1), 1-73।

यह काफी हद तक सामान्य आंकड़ों से परे है, जैसे थ्रेशोल्ड-आधारित मॉडल (जैसे आनुपातिक अंतर-अनुपात), और एग्रेस्टी की सीडीए बुक के स्थान पर पढ़ने लायक है ।

नीचे मैं एक लिकर आइटम के इलाज के तीन अलग-अलग तरीकों की एक तस्वीर दिखाता हूं; ऊपर से नीचे तक, "आवृत्ति" (नाममात्र) दृश्य, "संख्यात्मक" दृश्य, और "संभाव्य" दृश्य ( आंशिक क्रेडिट मॉडल ):

वैकल्पिक शब्द

डेटा पैकेज Scienceमें डेटा से आता है ltm, जहां आइटम संबंधित तकनीक ("नई तकनीक बुनियादी वैज्ञानिक अनुसंधान पर निर्भर नहीं करती है", प्रतिक्रिया के साथ "दृढ़ता से सहमत" "चार-बिंदु पैमाने पर"।


14

पारंपरिक प्रथा गैर-पैरामीट्रिक सांख्यिकी रैंक योग का उपयोग करना और क्रमिक डेटा का वर्णन करने के लिए रैंक करना है।

यहां बताया गया है कि वे कैसे काम करते हैं:

रैंक Sum

  • प्रत्येक समूह में प्रत्येक सदस्य को एक रैंक प्रदान करें;

  • उदाहरण के लिए, मान लीजिए कि आप फुटबॉल की दो विरोधी टीमों के प्रत्येक खिलाड़ी के लिए लक्ष्य देख रहे हैं, फिर दोनों टीमों के प्रत्येक सदस्य को पहले से लेकर अंतिम तक रैंक दें ;

  • प्रति समूह रैंक जोड़कर रैंक राशि की गणना करें ;

  • रैंक राशि का परिमाण आपको बताता है कि प्रत्येक समूह के लिए रैंक एक साथ कितने करीब हैं

रैंक मतलब

M / R, R / S की तुलना में अधिक परिष्कृत आँकड़ा है क्योंकि यह उन समूहों में असमान आकारों की भरपाई करता है जिनकी आप तुलना कर रहे हैं। इसलिए, उपरोक्त चरणों के अलावा, आप समूह में सदस्यों की संख्या से प्रत्येक राशि को विभाजित करते हैं।

एक बार जब आपके पास ये दो आँकड़े होते हैं, तो आप उदाहरण के लिए, रैंक योग का परीक्षण कर सकते हैं कि क्या दोनों समूहों के बीच अंतर सांख्यिकीय रूप से महत्वपूर्ण है (मेरा मानना ​​है कि इसे विल्कोक्सन रैंक योग परीक्षण के रूप में जाना जाता है , जो विनिमेय है, अर्थात कार्यात्मक रूप से। मान-व्हिटनी यू परीक्षण के बराबर)।

इन आंकड़ों के लिए कार्य (जिनके बारे में मुझे पता है, वैसे भी):

मानक आर स्थापना में wilcox.test

meanranks में क्रैंक पैकेज


3

अमूर्त के आधार पर यह लेख कई वेरिएबल्स की तुलना के लिए मददगार हो सकता है जो लिकर्ट स्केल हैं। यह दो प्रकार के गैर-पैरामीट्रिक एकाधिक तुलना परीक्षणों की तुलना करता है: एक रैंक के आधार पर और एक चाको द्वारा परीक्षण के आधार पर। इसमें सिमुलेशन शामिल हैं।


वर्तमान में, यह लगभग एक टिप्पणी की तरह लगता है, @PeterFlom। यद्यपि ACM डिजिटल लाइब्रेरी में सड़ांध को जोड़ने के लिए संभवतः कम संवेदनशील है, क्या आप इस लेख के बारे में कुछ कहना चाहेंगे, शायद यह सहायक जानकारी का एक उदाहरण है?
गंग

2
हाय @gung मुझे यकीन नहीं था कि इस लंबे धागे में टिप्पणी कहां रखनी है। मैं यहाँ का हवाला देते हैं के बाद से प्रश्न पोस्ट आज बंद हो गया जोड़ा, और इस लेख उपयोगी लगता है (और मुद्दों मैं कहीं और नहीं देखा है को शामिल किया गया)
पीटर Flom

2

मैं आमतौर पर मोज़ेक साजिश का उपयोग करना पसंद करता हूं। आप उन्हें रुचि के अन्य कोवरिअट को उकसा कर बना सकते हैं (जैसे: सेक्स, स्तरीकृत कारक आदि)


2

मैं जेरोमी एंग्लिम के मूल्यांकन से सहमत हूं। याद रखें कि लिकर्ट प्रतिक्रियाएं अनुमान हैं - आप स्थिर आयामों के साथ भौतिक वस्तु को मापने के लिए एक पूरी तरह से विश्वसनीय शासक का उपयोग नहीं कर रहे हैं। उचित नमूना आकार का उपयोग करते समय माध्य एक शक्तिशाली उपाय है।

व्यापार और उत्पाद आर एंड डी में, इसका मतलब अभी तक लिकटल तराजू के साथ इस्तेमाल किया जाने वाला सबसे आम आंकड़ा है। लिकट स्केल का उपयोग करते समय मैंने आमतौर पर एक उपाय चुना है जो आदर्श रूप से शोध प्रश्न पर फिट बैठता है। उदाहरण के लिए, यदि आप "वरीयता" या "दृष्टिकोण" के बारे में बात कर रहे हैं, तो आप कई संकेतक-आधारित संकेतकों का उपयोग कर सकते हैं, प्रत्येक संकेतक के साथ थोड़ा अलग अंतर्दृष्टि प्रदान करते हैं।

iX


1

"बॉक्स स्कोर" का उपयोग अक्सर क्रमिक डेटा को सारांशित करने के लिए किया जाता है, खासकर जब यह सार्थक मौखिक एंकर के साथ आता है। दूसरे शब्दों में, आप "टॉप 2 बॉक्स" की रिपोर्ट कर सकते हैं, जो प्रतिशत "सहमत" या "दृढ़ता से सहमत" चुना गया है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.