एक 6-प्रतिक्रिया विकल्प ("मुझे नहीं पता") को 5-पॉइंट लिकर्ट स्केल में जोड़ा गया था। क्या डेटा खो गया है?


16

मुझे प्रश्नावली से डेटा को बचाने में थोड़ी मदद की जरूरत है।

मेरे एक सहकर्मी ने एक प्रश्नावली लागू की, लेकिन अनजाने में, मूल 5-पॉइंट लिकर्ट स्केल (दृढ़ता से सहमत होने के लिए दृढ़ता से असहमत) का उपयोग करने के बजाय, उन्होंने स्केल में 6 वां उत्तर डाला। और, मामले को बदतर बनाने के लिए, 6 वा प्रतिक्रिया विकल्प है ... "मुझे नहीं पता"।

समस्या उत्तरदाताओं का बड़ा अनुपात है, जिन्होंने एक बिंदु या किसी अन्य पर, "मुझे नहीं पता" चुना। यदि वे यथोचित छोटे प्रतिशत थे, तो मैंने उन्हें डेटाबेस से बाहर कर दिया। हालांकि, अनुसंधान का मूल एक वैचारिक मॉडल पर टिकी हुई है, और इतने सारे रिकॉर्ड को छोड़कर मॉडल के लिए एक समस्या पैदा करेगा।

कोई मुझे यहाँ सही दिशा में इशारा कर सकता है? क्या कोई 'अच्छी प्रथाएं' हैं, या क्या मैं उन "जवाबों को नहीं जानता" (उपयोग, परिवर्तित, आदि) का उपयोग करने के लिए कुछ भी कर सकता हूं?

इसके अलावा, अगर मैं प्रश्न में डेटा का कोई हेरफेर करता हूं (यानी, अगर मैं "मैं नहीं जानता" प्रतिक्रियाओं को प्रतिस्थापन, प्रतिरूपण, आदि द्वारा परिवर्तित करता हूं), तो किस तरह का 'अस्वीकरण', 'चेतावनी', एनोटेशन, क्या मुझे उपयोग करना चाहिए?

मुझे पता है कि यह एक लंबा शॉट है, लेकिन मैं स्वीकार करता हूं, प्रतिक्रियाओं को निस्तारण करने के अलावा, मैं इस बात से भी उत्सुक हूं कि इस प्रकार के मामलों में सहमत प्रथा (यदि कोई है तो) क्या है।

पुनश्च: मुझे पता है कि यह बचकाना लगता है, लेकिन नहीं, 'सहयोगी' मुझे नहीं है :)


22
कल्पना कीजिए कि आपके सहकर्मी ने I श्रेणी नहीं जानता था। उन व्यक्तियों ने क्या उत्तर दिया होगा? हो सकता है कि उन्होंने कुछ यादृच्छिक श्रेणी में टिक किया हो, हो सकता है कि उन्होंने इसे खाली छोड़ दिया हो। अब आप जानते हैं कि आपके चर समस्याग्रस्त हैं और एक सूचित निर्णय लेते हैं। इस दृष्टिकोण से, सहकर्मी ने आपका उपकार किया।
मार्टन Buis

खैर, जहाँ तक मेरे सिर को खरोंचने की बात है, उसने वास्तव में मुझ पर एक एहसान किया ... आप प्रतिक्रियाओं की यादृच्छिकता के बारे में सही हैं, और यह आरोपण के लिए एक दृष्टिकोण हो सकता है, हालांकि, मैं सोच रहा था कि क्या कोई अच्छा है अभ्यास, या कम से कम कुछ इसी तरह के अनुभव
सुव्यवस्थित

4
मुझे ऐसे प्रश्नावली मिलते हैं जिनमें ऐसा " मैं नहीं जानता " विकल्प विशेष रूप से निराशा होती है (विशेषकर तब जब आप कुछ चुने बिना प्रस्तुत नहीं कर सकते)। मान लें कि आप एक प्रश्न फेंकते हैं जैसे " उस स्पेस रॉकेट पर नई सुविधाएँ एक सुधार हैं ", और फिर आप सबसे अच्छे से तटस्थ रहने के लिए मजबूर होते हैं, कुछ लोग फिर उस तरह के सर्वेक्षणों की व्याख्या कर सकते हैं और निष्कर्ष निकाल सकते हैं "हमने 1000 मांगे हैं लोग, और 100% ने बुरा नहीं माना ... ", जबकि व्यवहार में, यह सुविधा उन लोगों के लिए एक पूरी गलती हो सकती है जो इसका उपयोग करते हैं। उन मामलों में, यह लगभग मेरे द्वारा उपयोग नहीं की गई चीज़ के लिए मौन समर्थन की तरह महसूस करता है।
ब्रूनो

3
अधिक स्पष्ट होने के लिए: यदि मॉडल मानता है कि 5 बिंदु पैमाने उत्तरदाताओं की राय का प्रतिनिधित्व कर सकते हैं, तो आपका डेटा साबित करता है कि मॉडल अपर्याप्त है । यदि यह सही था, तो आपके पास "मुझे नहीं पता" की एक नगण्य संख्या होगी, क्योंकि लोग 1-5 का जवाब देने में सक्षम होंगे। तो यह डेटा "मॉडल के लिए एक समस्या पैदा करेगा" जैसे बुध की कक्षा न्यूटनियन भौतिकी के लिए एक समस्या पैदा करती है। मुझे लगता है कि आपका एकमात्र तरीका यह है कि यदि मध्य बिंदु "न तो सहमत है और न ही असहमत" है और आप यह मामला बना सकते हैं कि "मुझे नहीं पता" इस तरह से उसी अर्थ के साथ बेमानी है।
स्टीव जेसोप

नमस्ते, @SteveJessop, सिद्धांत रूप में / सिद्धांत रूप में, आप प्रश्नावली के साथ एक समस्या का संकेत होने के रूप में डीके उत्तरों की संख्या के बारे में सही हैं (मॉडल नहीं, आप पर ध्यान दें, मॉडल पैमाने के लिए सीएफए नहीं है, लेकिन प्रतिगमन) पैमाने सहित, चर का एक गुच्छा के लिए), इसे अपर्याप्त कहने के लिए अभी भी थोड़ा मजबूत है। मैं स्केल एनालिसिस करूंगा और देखूंगा, और यह सच है, डीके उत्तरों की कतरनी संख्या समस्याग्रस्त साबित हो सकती है। हालांकि, उनका मतलब यह भी हो सकता है कि प्रतिवादी को जवाब देने का मन नहीं था (संयोग से, डीके के अधिकांश उत्तर परीक्षा के बाद छात्रों के एक समूह से आते हैं ...)
सुव्यवस्थित करें

जवाबों:


28

जो कुछ सच नहीं है उस पर एक अंशांकन को मजबूर करने की कोशिश क्यों करें? जैसा कि मैर्टन ने कहा, यह डेटा का नुकसान नहीं है बल्कि जानकारी का लाभ है। यदि आप जिस जादुई गोली की तलाश कर रहे हैं, वह मौजूद है, तो इसका मतलब होगा कि आपकी आबादी के बारे में कुछ धारणाएँ हैं, जो उदाहरण के लिए, एक विशेष लेबल के पक्ष में एक पूर्वाग्रह है, हालांकि उपयोगकर्ता कहते हैं कि "मुझे नहीं पता"।

मैं आपकी कुंठा को पूरी तरह से समझता हूं, लेकिन समस्या को हल करने का उचित तरीका यह है कि मॉडल को आपकी मौजूदा मौजूदा डेटा के आधार पर आपकी आवश्यकताओं के अनुरूप संशोधित किया जाए, न कि दूसरे तरीके से (डेटा को संशोधित) किया जाए।


हाय, हातिम, मेरा मानना ​​है कि मॉडल को संशोधित करना संभव नहीं है। पैमाने सामान्य है, और एक तर्क और स्पष्ट विकल्प मानता है, जबकि 6 वां जवाब, "मुझे नहीं पता", किसी भी तरह से व्याख्या की जा सकती है। इसका मतलब यह हो सकता है कि "मैंने इस स्थिति का कभी सामना नहीं किया / मुझे याद नहीं है", यह किसी प्रकार के 'मध्यस्थ' विकल्प के लिए खड़ा हो सकता है। मेरी ओर से ऐसी कोई भी व्याख्या / धारणा, विहित और निराधार होगी। मैर्टन के जवाब ने सूचना के एक 'लाभ' को संदर्भित किया, जो मैं इसे लेता हूं कि एक विशिष्ट 'यादृच्छिक' प्रतिरूपण का उपयोग किया जा सकता है, लेकिन यह वह नहीं है जो आप कहते हैं - "मॉडल को संशोधित करें"।
सुव्यवस्थित

निरंतरता ... हालांकि, हालांकि मैं था और अभी भी हूं, ऐसे 'यादृच्छिक' संसेचन में आगे देखने के लिए लुभाता हूं, "मुझे नहीं पता" जवाब की बड़ी मात्रा मुझे डर देती है कि चर के बीच सच्चे (प्रामाणिक) संबंध होंगे बदल दिया।
सुव्यवस्थित

8
+1। मुझे पता है कि यह असुविधाजनक है, लेकिन अगर आप उस मॉडल का परीक्षण करना चाहते हैं या नियोजित विश्लेषण को संशोधित करना चाहते हैं, तो आपके पास एक अलग डेटासेट खोजने के बीच एक विकल्प है। आपने अलग-अलग जवाबों की उम्मीद करते हुए सवाल पूछा है, लेकिन मेरे विचार में, कोई भी ऐसा नहीं है जो किसी भी तरह से खराब हो। अगर मैं इस तरह के प्रश्नावली का उत्तर देने वाला होता तो मुझे विकृति और विश्वास में कमी महसूस होती, जिसके इलाज की कोशिश में मुझे कुछ नहीं पता। वास्तव में सामाजिक अनुसंधान के एक सामयिक उपभोक्ता के रूप में मैं भी निराश हूं।
निक कॉक्स

1
आप स्वाभाविक रूप से सही हैं कि यह पहले भी हुआ है, और कई बार। यही कारण है कि उन परियोजनाओं के कुछ अनुभव वाले जिन्हें अप्रत्याशित समस्याओं द्वारा उलटा या जटिल किया गया था, इसलिए, विश्लेषण अलग हो सकता है और कागज की कल्पना नहीं की जाएगी। या यहां तक ​​कि कभी-कभी परियोजनाएं सिर्फ काम नहीं करती हैं, इसलिए आप वहां जाते हैं। (अगर किसी तरह आप के माध्यम से पालन करने के लिए निर्देश या मजबूरी है, तो यह विशेष रूप से दुर्भाग्यपूर्ण है, लेकिन यह इस बारे में सोचने के बारे में मेरी सलाह को प्रभावित नहीं करता है।)
निक कॉक्स

8
@ user2836366 मुझे समझ में नहीं आता है कि मॉडल को संशोधित नहीं किया जा सकता है। निश्चित रूप से "पता नहीं" प्रतिक्रियाओं के सामान्य संग्रह का हिस्सा नहीं है, लेकिन यह पूरी तरह से बिंदु पर है; "पता नहीं" का तात्पर्य यह है कि जो भी कारण (वास्तव में जानते हुए भी जानते हैं) के लिए व्यक्ति ने अध्यादेश प्रतिक्रियाओं में से एक का चयन नहीं किया। तो ऐसा एक संशोधन है कि आप उस प्रक्रिया के लिए कुछ मॉडल रख सकते हैं (चुना "पता नहीं" बनाम "अन्य विकल्पों में से एक को चुना") और फिर दूसरी श्रेणी के मामलों के लिए सामान्य मॉडल। इस तरह के मॉडल बाधा मॉडल या शून्य-फुलाए गए मॉडल के समान हो सकते हैं।
Glen_b -रिटनेट मोनिका

10

यदि यह एक मानकीकृत प्रश्नावली थी जिसे स्वतंत्र रूप से मान्य किया गया है, तो आप यह दावा नहीं कर सकते कि नया प्रश्नावली समतुल्य है, और डेटा अब तुलनीय नहीं है। आप अलग-अलग प्रयोगों (बहुत समय और प्रयास-उपभोग) में प्रश्नावली को मान्य करने और जांचने की कोशिश कर सकते हैं, खासकर यदि आप भी पुराने संस्करण की तुलना दिखाना चाहते हैं) या बस स्वीकार करें कि आप कम सबूत की गुणवत्ता के साथ काम कर रहे हैं (जब से आपका डेटा आता है गैर-वैध प्रश्नावली से)।

जब आप अपने डेटा का उपयोग करते हैं, तो आपको बदलाव को ध्यान में रखना होगा। जब एक दृष्टिकोण प्रश्न का सामना किया जाता है, तो लोग आपको किसी भी तरह से "उद्देश्यपूर्ण रूप से सही" उत्तर नहीं देते हैं, वे आपको वह उत्तर देते हैं जो उन्हें सच लगता है - और यह निश्चित रूप से उपलब्ध उत्तर विकल्पों से दोनों को प्रभावित करता है (वे अपने उत्तरों को "आदर्श" करते हैं। पैमाने पर) और ज्ञान के बारे में उन्हें विषय के बारे में है (ऐसे ज्ञात पक्षपात हैं जो अलग-अलग दिशाओं में काम करते हैं, कभी-कभी अलग-अलग दिशाओं में (!) इस पर निर्भर करता है कि प्रतिभागी को विषय के बारे में बहुत कम या कम ज्ञान है)।

इसलिए, यदि हम एक स्थापित quesitonnaire के साथ काम कर रहे हैं, तो आपके पास प्रश्नावली के अपने संस्करण और मूल एक के बीच तुलना के लिए अच्छा विकल्प है। यदि मूल ने मान लिया कि लोग जानते हैं कि वे क्या चयन कर रहे हैं, और यह पता चला कि वे नहीं करते हैं, तो आप चर्चा कर सकते हैं कि पुराना मॉडल गलत धारणाओं पर कैसे आधारित है, और इसके परिणाम क्या हैं। ध्यान दें कि यह एक "पक्ष" की खोज है, जो एक अच्छा नया शोध प्रश्न बनाता है, लेकिन आपको मूल एक से दूर करता है, और वास्तव में दिखाता है कि मूल का उत्तर देना विचार से कहीं अधिक कठिन है, इसलिए यह निश्चित रूप से आपके काम को गुणा करता है।

यदि आप एक स्थापित प्रश्नावली के साथ काम नहीं कर रहे हैं, तो आप प्रवाह के साथ रोल कर सकते हैं और दिखावा कर सकते हैं कि आपके तदर्थ प्रश्नावली को उसी तरह से योजनाबद्ध किया गया था, और तदनुसार परिणामों का मूल्यांकन करें। फिर, इसका मतलब यह हो सकता है कि आप जिन परिणामों की उम्मीद कर रहे थे, वे इस पद्धति से अप्राप्य हैं, लेकिन यह जानना भी एक महत्वपूर्ण बात है।

प्रश्नावली के उत्तर देने के तरीके और विकल्प कैसे प्रभावित करते हैं, इसकी एक अच्छी समझ के लिए, मैं टूरनग्यू एट अल। के "सर्वेक्षण प्रतिक्रिया के मनोविज्ञान" को पढ़ने का सुझाव देता हूं। यह उन सभी के लिए बहुत अच्छा पढ़ा जाता है जो कभी प्रश्नावली बनाते हैं।


2

यदि आप पूछते हैं कि कितने बच्चों को प्रतिवादी ने जन्म दिया है, तो उत्तर "शून्य" और "लागू नहीं" का मतलब एक ही बात से कड़ाई से नहीं होगा, क्योंकि पुरुष जन्म नहीं दे सकते।

कुछ संदर्भों के लिए, "मुझे पता नहीं है" तटस्थ प्रतिक्रिया के बराबर, एक वैचारिक गलती हो सकती है।

वास्तव में, आपके पास दो प्रश्न हैं: एक द्विअर्थी "क्या आपके पास एक राय है?" और एक अध्यादेश "यह क्या है?", जैसा कि, ऊपर, आपके पास एक निहित है "क्या आप एक महिला हैं?" अपने स्पष्ट प्रश्न से परे।

बेशक, आप कुछ मॉडलिंग को सक्षम करने के लिए कुछ मान्यताओं को लागू कर सकते हैं (कभी-कभी सही, कभी-कभी सुविधा के लिए, कभी-कभी केवल)।

एक अंतिम बिंदु के रूप में, यह सोचने का कोई मतलब नहीं है कि महिला की बेईमानी के जवाबों से पुरुष आबादी का कुछ भी पता लगाने की कोशिश नहीं की जाएगी।


2

दुविधा यह है कि किसी को शामिल किया जाना चाहिए या नहीं, एक लिक्विड टाइप के रेटिंग पैमानों वाले प्रश्नावली में रिस्पॉन्स ऑप्शन विकल्प को शाश्वत नहीं है। अक्सर, जब आइटम राय के बारे में पूछते हैं, तो डीके को शामिल किया जाता है क्योंकि कोई राय नहीं होना अपने आप में एक महत्वपूर्ण स्थिति है और उत्तरदाताओं द्वारा इस तरह के विकल्प की उम्मीद की जाती है। व्यक्तिगत विशेषता आविष्कारों में जहां लोग एक लक्ष्य डीके विकल्प के गुणों का वर्णन करते हैं, आमतौर पर गिरा दिया जाता है क्योंकि एक प्रतिवादी सामान्य रूप से एक विशेषता की आत्मीयता की सीमा का आकलन करने में सक्षम होने की उम्मीद की जाती है (यानी प्रतिसाद हमेशा योग्य देखा जाता है); और जब वह कभी-कभार कठिनाई पाता है तो उसे (अनुदेश द्वारा) उस आइटम को छोड़ने की अनुमति दी जाती है। व्यक्तिगत विशेषता आविष्कारों में जहां लोग एक लक्ष्य (व्यवहार संबंधी वस्तुओं) डीके (या डॉन) का वर्णन करते हैं

@Hatim ने अपने उत्तर में, @Maarten और ओपी प्रश्न के कुछ अन्य टीकाकारों ने समझदारी से कहा है कि वर्तमान अध्ययन में बड़ी मात्रा में DK प्रतिक्रियाओं का उल्लेख किया गया है जो आइटम में समस्याओं (सामग्री की वैधता या चेहरे की वैधता) का संकेत देते हैं या कि विषय डॉन ' टी फिट के साथ प्रश्नावली उन्हें आदेश दिया।

लेकिन आप कहानी को कभी नहीं बता सकते हैं, अंततः बाधा की व्याख्या आप पर है (जब तक कि आप इसे एक अलग जांच में संबोधित नहीं करते हैं)। उदाहरण के लिए, दावा किया जा सकता है कि उस प्रश्नावली में डीके के विकल्प को शामिल करना (कहते हैं, यह एक अनुलेखन सूची है) अच्छा नहीं, बुरा कार्य करता है। इसने आपको जानकारी नहीं दी (जिनमें से टिप्पणीकार कहते हैं, वह it proves that the [rating] model is inadequate) बल्कि एक प्रतिवादी को विचलित / बहकाया। यह अनुमानित संज्ञानात्मक विशेषता स्कीमा द्वारा निर्देशित रेटिंग निर्णय की आपूर्ति नहीं की जा सकती है; लेकिन कूलिंग ऑप्शन को देखते हुए स्कीमा को हटा दिया जाता है और एक को जल्दबाजी में वापस ले लिया जाता है।

यदि आप आगे स्वीकार करते हैं - अपने जोखिम पर, लेकिन क्यों नहीं? - कि एक आसानी से विचलित या आलसी विषय वह है जिसकी क्षमता, आयोजित किया गया दृश्य वैध है, लेकिन कमजोर रूप से विभेदित हो जाता है - अर्थात, वह आसानी से व्यक्तिगत दास मैन को आमंत्रित करेगा , व्यक्तिगत एर्लेबनीस , स्कीमा के स्थान पर , फिर आप अस्थायी रूप से अनुमान लगा सकते हैं। उस वस्तु के लिए नमूना या आबादी के साधन के आसपास उसकी लापता प्रतिक्रिया है। यदि हां, तो लापता प्रतिक्रियाओं का मतलब (+ शोर) क्यों नहीं है? या आप सहसंबंधों को ध्यान में रखने के लिए EM या प्रतिगामी (+ शोर) प्रतिरूपण कर सकते हैं।

दोहराने के लिए: प्रतिरूपण निर्णय संभव है, लेकिन जोखिम भरा है, और अनुपस्थित डेटा को "सही मायने में" बहाल करने के लिए, लापता डेटा की बड़ी मात्रा को देखते हुए, संभावना नहीं है। जैसा कि @rumtscho ने कहा, निश्चित रूप से डीके के साथ नया प्रश्नावली डीके के बिना मूल के बराबर नहीं है, और डेटा अब तुलनीय नहीं है।

ये अटकलें थीं। लेकिन सबसे पहले, आपको गुमशुदगी के देखे गए पैटर्न की जांच करने का प्रयास करना चाहिए। वे कौन से विषय हैं जिन्होंने डीके का चयन किया? क्या वे उपप्रकारों में एक साथ क्लस्टर करते हैं? "ओके" सब्स्क्राइब से वे बाकी मदों पर कैसे अलग हैं? कुछ सॉफ्टवेयर में गुम मूल्य विश्लेषण पैकेज है। तब आप यह तय कर सकते थे कि लोगों को पूरी तरह से या आंशिक रूप से गिराया जाए, या थोपा जाए, या उन्हें एक अलग सदस्यता के रूप में विश्लेषण किया जाए।

PS यह भी ध्यान दें कि उत्तरदाता "बेवकूफ" हैं। वे अक्सर स्केल ग्रेड के साथ मिश्रण करते हैं। उदाहरण के लिए, यदि डीके बिंदु को स्केल के एक ध्रुव के करीब रखा जाता है, तो यह अक्सर उस ध्रुव के साथ असावधानी से भ्रमित हो जाता है। मैं मजाक नहीं कर रहा हूं।


नमस्ते, @ttnphns, ठीक है, आपका उत्तर इसे बिंदु से बिंदु तक ले जाने के लिए बहुत लंबा है (मैंने पहले से ही आपके द्वारा यहां उठाए गए कुछ बिंदुओं के बारे में अन्य उत्तरों पर टिप्पणी की है)। ईमानदार होने के लिए, मुझे इसे एक बार फिर से पढ़ना होगा। हालाँकि, यह मेरी पसंद की हर चीज को संबोधित करता है।
सुव्यवस्थित

0

अब आपके पास मामले पर एक राय होने के लिए उत्तरदाताओं का स्व-चयन है। आप जो भी निष्कर्ष निकालेंगे वह पूरी तरह से उन लोगों के बारे में होगा। यह ठीक हो सकता है, क्योंकि उन लोगों को "पता नहीं है" मतदान करना परिभाषा से कम उपयोगी नहीं है।


2
ड्रोल, लेकिन बहुत निराशावादी। उन लोगों ने तर्कों की पेशकश की कि कोई क्या कर सकता है, क्या नहीं करना चाहिए, क्या नहीं करना चाहिए, और यह तर्क हैं जिन्हें तौलना चाहिए। यहाँ किसी भी सूत्र पर एक ही उत्तर दिया जा सकता है, लेकिन जो लोग नहीं बोलते हैं, उनका कोई कहना नहीं है।
निक कॉक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.