Be सीलिंग इफेक्ट ’होने के लिए क्या मापदंड पूरे होने चाहिए?


13

सामाजिक विज्ञान अनुसंधान विधियों के विशाल विश्वकोश के अनुसार …

[ए] सीलिंग प्रभाव तब होता है जब एक उपाय संभावित प्रतिक्रियाओं के लिए एक अलग ऊपरी सीमा रखता है और प्रतिभागियों की एक बड़ी एकाग्रता इस सीमा पर या उसके आसपास स्कोर करती है। स्केल क्षीणन एक पद्धतिगत समस्या है जो तब होती है जब भी इस तरह से विचरण प्रतिबंधित होता है। … उदाहरण के लिए, एक छत का प्रभाव व्यवहार के माप के साथ हो सकता है जिसमें एक उच्च स्कोर एक अनुकूल दृष्टिकोण को इंगित करता है और उच्चतम प्रतिक्रिया संभव सबसे सकारात्मक मूल्यांकन पर कब्जा करने में विफल रहती है। ... छत के प्रभावों की समस्या का सबसे अच्छा समाधान पायलट परीक्षण है, जो समस्या को जल्दी पहचानने की अनुमति देता है । यदि एक छत प्रभाव पाया जाता है , [और] परिणाम माप कार्य प्रदर्शन है, तो संभावित प्रतिक्रियाओं की सीमा को बढ़ाने के लिए कार्य को और अधिक कठिन बनाया जा सकता है। 1 [महत्व दिया]

वहाँ सलाह और सवाल ( और यहाँ ) डेटा का विश्लेषण करने के लिए बहुत से प्रतीत होता है जो ऊपर दिए गए उद्धरण में वर्णित के समान छत प्रभाव दिखाते हैं।

मेरा प्रश्न सरल या भोला हो सकता है, लेकिन कोई वास्तव में कैसे पता लगा सकता है कि डेटा में एक छत प्रभाव मौजूद है? अधिक विशेष रूप से, मान लीजिए कि एक साइकोमेट्रिक टेस्ट बनाया गया है और सीलिंग इफेक्ट (केवल दृश्य परीक्षा) का नेतृत्व करने के लिए संदेह है और फिर परीक्षण को अधिक से अधिक मूल्यों का उत्पादन करने के लिए संशोधित किया गया है। यह कैसे दिखाया जा सकता है कि संशोधित परीक्षण ने उत्पन्न होने वाले डेटा से छत के प्रभाव को हटा दिया है? क्या कोई परीक्षण है जो दिखाता है कि डेटा सेट में एक छत प्रभाव है लेकिन डेटा सेट बी में कोई छत प्रभाव नहीं है ?

मेरा अनुभवहीन दृष्टिकोण सिर्फ वितरण तिरछा की जांच करना होगा और अगर यह तिरछा नहीं है, तो निष्कर्ष निकालें कि कोई छत प्रभाव नहीं है। क्या यह अति सरलीकृत है?

संपादित करें

एक अधिक ठोस उदाहरण जोड़ने के लिए, मैं एक ऐसा उपकरण विकसित करता हूं जो कुछ अव्यक्त विशेषता x को मापता है जो उम्र के साथ बढ़ता जाता है लेकिन अंततः स्तर से गिर जाता है और बुढ़ापे में कम होने लगता है। मैं पहला संस्करण बनाता हूं, जिसमें 1–14 की सीमा होती है, कुछ पायलटिंग करते हैं, और पाते हैं कि ऐसा लगता है कि एक छत प्रभाव हो सकता है (14 पर या निकट प्रतिक्रियाओं की एक बड़ी संख्या, अधिकतम .. मैं इसके द्वारा ही समाप्त करता हूं डेटा को देखते हुए। लेकिन क्यों? क्या उस दावे का समर्थन करने का कोई कठोर तरीका है?

फिर मैं 1–20 की सीमा और अधिक डेटा एकत्र करने के लिए उपाय को संशोधित करता हूं। मैं देखता हूं कि प्रवृत्ति मेरी अपेक्षाओं के अधिक निकट है, लेकिन मुझे कैसे पता चलेगा कि माप की सीमा काफी बड़ी है। क्या मुझे इसे फिर से संशोधित करने की आवश्यकता है? नेत्रहीन, यह ठीक लगता है, लेकिन क्या मेरे संदेह की पुष्टि करने के लिए इसका परीक्षण करने का एक तरीका है?

यहाँ छवि विवरण दर्ज करें

मैं जानना चाहता हूं कि मैं इस छत के प्रभाव को केवल देखने के बजाय डेटा में कैसे पहचान सकता हूं। रेखांकन वास्तविक डेटा का प्रतिनिधित्व करता है, न कि सैद्धांतिक। साधन की सीमा का विस्तार करने से बेहतर डेटा प्रसार हुआ, लेकिन क्या यह पर्याप्त है? मैं उसका परीक्षण कैसे कर सकता हूं?


1 हेस्लिंग, आर।, ट्रैक्सेल, एन।, और श्मिट, टी। (2004)। छत प्रभाव। माइकल एस। लुईस-बेक, ए। ब्रायमैन, और टिम फ्यूटिंग लिआओ (एडीएस), द सेज एनसाइक्लोपीडिया ऑफ सोशल साइंस रिसर्च मेथड्स । (पृष्ठ १०।)। थाउज़ेंड ओक्स, सीए: सेज पब्लिकेशन, इंक। डोई: 10.4135 / 9781412950589.76102


4
प्रगति करने के लिए, किसी को "छत प्रभाव" की एक परिचालन परिभाषा के साथ आना होगा। ऐसा करना सामान्य रूप से समस्याग्रस्त हो सकता है: आखिरकार, लगभग किसी भी मापी गई मात्रा वास्तविक रूप से कुछ मूल्य से अधिक नहीं हो सकती है, जैसे कि एक परीक्षण स्कोर या रासायनिक एकाग्रता में 100%, एक उपकरण क्या पढ़ सकता है, और इसी तरह की ऊपरी सीमा, इतने यकीनन लगभग सभी डेटा कुछ अंतर्निहित ऊपरी बाध्य के अधीन हैं। इसलिए, यद्यपि "छत के प्रभाव" का इच्छित अर्थ आपके अच्छे उदाहरणों से स्पष्ट रूप से स्पष्ट है, तो आप हमें यह स्पष्ट करके मदद कर सकते हैं कि आपके डेटा से "हटाए जाने" की आवश्यकता क्या है , और क्यों।
whuber

1
@ जब आप सही होते हैं कि इस शब्द का उपयोग कई अलग-अलग तरीकों से किया जाता है, लेकिन इस मामले में, मैं एक शासक को बनाने की बात कर रहा हूं जो उन सभी चीजों को पार करने के लिए पर्याप्त है जिन्हें मैं मापना चाहता हूं। परीक्षण बनाते समय, आप निश्चित रूप से कठिनाइयों की एक सीमा के पर्याप्त आइटम को शामिल करना चाहते हैं ताकि कोई भी 100% न हो, अन्यथा आपको पता नहीं चलेगा कि उस व्यक्ति की क्षमता वास्तव में परीक्षण की सीमा है या उच्चतर। डेटा से कुछ भी निकालने की आवश्यकता नहीं है, लेकिन साधन को तब तक संशोधित करने की आवश्यकता है जब तक कि यह सेंसर किए गए डेटा बिंदुओं का उत्पादन न करे।
छत

धन्यवाद। मुझे अभी भी यकीन नहीं है कि "सीलिंग इफ़ेक्ट" से आपका क्या तात्पर्य है, क्योंकि आपके किसी भी चित्रण से किसी भी तरह के सेंसरिंग के सबूत नहीं दिखते हैं - कम से कम एक परीक्षण के साथ प्राप्त किए गए तरह के निश्चित सेंसरिंग सीमाओं के साथ नहीं। वास्तव में, बाएं से दाएं पैनल में परिवर्तन ऊर्ध्वाधर अक्ष के एक-से-एक nonlinear फिर से अभिव्यक्ति की तरह दिखता है, जिसका डेटा में किसी भी छत पर कोई प्रभाव नहीं होगा। यह मुझे आश्चर्यचकित करता है कि क्या आप वास्तव में पूरी तरह से अलग कुछ के बारे में चिंतित हैं, जैसे कि प्रतिगमन अवशेषों की विषमता।
whuber

1
ज्यादातर पॉइंट ओवरलैप होने के बाद से @ व्हीबर जिटर को जोड़ा गया है। यदि रेखांकन मेरे प्रश्न से संबंधित नहीं दिखाई देता है, तो जाहिर है मुझे पता नहीं है कि मैं किस बारे में बात कर रहा हूं। मेरे लिए, ऐसा लगता है कि हेस्लिंग, ट्रैक्सेल और श्मिट द्वारा वर्णित छत प्रभाव है, लेकिन आपकी टिप्पणियों और इस सवाल में पूरी तरह से रुचि की कमी के आधार पर, शायद मैं एक समस्या देख रहा हूं जहां कोई नहीं है। हालांकि आपके सुझाव और अंतर्दृष्टि का धन्यवाद। मैं इसकी सराहना करता हूं।
सीलिंग

1
@ जोहान मैं देख रहा हूं। आपके प्रश्न की भावना में, मेरे साथ ऐसा होता है कि आपके विचार का एक मामूली संशोधन एक अच्छा हो सकता है। जब तक हमारे पास कारण नहीं है कि अवशेषों को सामान्य रूप से वितरित किया जाना चाहिए, हम प्रतिक्रिया की एक मोनोटोन परिवर्तन की तलाश कर सकते हैं जिसमें अवशिष्ट वितरण होमोसिडेस्टिक हैं जहां प्रतिक्रिया कम होती है और संभवतः कम हो जाती है जहां प्रतिक्रिया अधिक होती है। दूसरे शब्दों में, शायद परीक्षण सामान्यता के लिए नहीं होना चाहिए, लेकिन प्रतिक्रिया के लिए एक सुसंगत आकार और पैमाने की तलाश करनी चाहिए ।
whuber

जवाबों:


3

सबसे पहले, मैं यह कहना चाहूंगा कि दोनों रेखांकन मुझे स्पष्ट सबूत प्रदान करते हैं कि एक छत प्रभाव मौजूद है। मैं सिर्फ नेत्रहीन के बजाय उस प्रभाव को मापने का प्रयास कैसे करूंगा कि जब तक कि अवलोकन का एक गैर-तुच्छ भाग साधन की सीमा के ऊपरी सीमा के पास है। आमतौर पर एक छत प्रभाव बोलना हमेशा तब तक मौजूद रहेगा जब तक कि परीक्षार्थियों का एक गैर-तुच्छ हिस्सा न हो जो परीक्षण पर अधिकतम अंक प्राप्त करते हैं।

हालांकि, कहा कि, परीक्षण विश्लेषण की तकनीक ने एक लंबा रास्ता तय किया है क्योंकि हमें स्कोर सही पर आधारित एक उपकरण पर स्कोर की सीधे व्याख्या करने की आवश्यकता थी। अब हम अलग-अलग वस्तुओं के आइटम मापदंडों का अनुमान लगाने और विषय की क्षमता की पहचान करने के लिए उन वस्तुओं का उपयोग करने के लिए आइटम रिस्पॉन्स थ्योरी का उपयोग कर सकते हैं। यदि हम परीक्षण को बहुत आसान बनाते हैं, तो निश्चित रूप से एक परीक्षण पर अभी भी छत प्रभाव हो सकता है। हालांकि, आइटम प्रतिक्रिया सिद्धांत की शक्तियों के कारण हमें साधन में उच्च पर्याप्त कठिनाई के कम से कम कुछ आइटम डालने में सक्षम होना चाहिए ताकि केवल रोकने के लिए आबादी का एक तुच्छ हिस्सा छत से टकरा सके।

सवाल के लिए धन्यवाद। यह बहुत रोचक है!


2

मुझे लगता है कि एक मोटा और तैयार तरीका सिर्फ वैरिएशन को मापने के लिए होगा जैसा कि स्केल बढ़ता है। यदि यह कमी दिखाता है तो यह एक छत के प्रभाव के लिए सबूत है और यदि कोई छत प्रभाव नहीं है। आप प्रसरण कथानक की एकरूपता बना सकते हैं। लेवेने का परीक्षण यह निर्धारित करने के लिए उपयोगी हो सकता है कि क्या पैमाने पर विभिन्न बिंदुओं पर भिन्नता है।


2
विचार के लिए धन्यवाद। मैं इसकी कोशिश करूँगा, लेकिन मुझे उम्मीद है कि इस मामले में स्वाभाविक रूप से उम्र के साथ विचरण कम होगा।
छत

सीलिंग, यह उत्तर और आपकी टिप्पणी दोनों दो अलग-अलग अवधारणाओं को भ्रमित करते हैं। पैमाने विचरण एक विषय के बार-बार स्वतंत्र माप के फैलाव को प्रतिबिंबित करेगा; यह माना जाता है कि यह विषय पर निर्भर नहीं है, लेकिन संभवतः विषय की औसत प्रतिक्रिया के साथ भिन्न हो सकता है। जिस विचरण को आप और यह उत्तर संदर्भित करते हैं, वह प्रतिगमन अवशिष्टों का विचरण है। हालांकि वे संबंधित हैं, वे एक ही चीज नहीं हैं।
whuber

@whuber कि बाहर इशारा करने के लिए धन्यवाद। वैसे, आप अभी भी अपडेट ग्राफ़ और जानकारी के साथ छत के प्रभाव का कोई सबूत नहीं देखते हैं? मैं काफी हैरान हूं कि इस सवाल ने लगभग कोई दिलचस्पी नहीं ली है जिसमें मौजूद छत के प्रभावों के साथ डेटा के विश्लेषण पर कई सवाल और जवाब दिए गए हैं।
सीलिंग

नमस्ते। जब तक आप विषयों के बीच भिन्नता की साजिश रच रहे हैं, जैसे कि विषयों की तुलना में पैमाना बढ़ता है, तो क्या यह आपको छत के प्रभावों के बारे में कुछ नहीं बताएगा? - क्या आप पैमाना बढ़ने पर महत्वपूर्ण परिवर्तन के लिए परीक्षण करने के लिए लेवेन के परीक्षण का उपयोग कर सकते हैं? या यह केवल विचरण में विषय परिवर्तन के भीतर परीक्षण करने के लिए डिज़ाइन किया गया है? क्या हमें अलग-अलग लोगों के अंकों की भिन्नता का वर्णन करने के लिए एक अलग शब्द का उपयोग करना चाहिए क्योंकि "स्केल विचरण" के अलावा पैमाना बढ़ता है, जैसे कि "अवशेषों का सार"? क्या लेवेने के परीक्षण का उपयोग यह दिखाने के लिए किया जा सकता है कि "अवशिष्टों का विचरण" पूरे पैमाने पर समान है
user45114

0

यह तय करने में महत्वपूर्ण समस्या है कि उच्चतम या निम्नतम बिंदु के आसपास क्लस्टरिंग छत / फर्श के प्रभाव के कारण होती है या नहीं, क्या मामलों के मूल्य वास्तव में मूल्य का "प्रतिनिधित्व" करते हैं। जब छत / फर्श का प्रभाव होता है, तो कुछ मामलों में, अधिकतम या न्यूनतम मूल्य मानने के बावजूद, वास्तव में अधिकतम या न्यूनतम मूल्य से अधिक / कम होते हैं (एक वयस्क और एक बच्चे की कल्पना दोनों एक बहुत ही सरल गणित परीक्षण को पूरा करते हैं जिसे मापने के लिए निर्धारित किया गया है। किसी की गणित क्षमता, और दोनों ने 100% स्कोर किया)। यहां, डेटा सेंसर किया गया है।

एक अन्य परिदृश्य भी संभव है, जब हम लिकट-जैसे पैमाने पर बंधे हुए पैमानों का उपयोग करते हैं जिसमें अंतर्निहित ऊपरी और निचली सीमाएँ होती हैं। यह पूरी तरह से संभव है कि जिन लोगों ने उच्चतम स्कोर किया है वे वास्तव में उस स्कोर के लायक हैं और कोई अंतर (जैसे कि ऊपर का गणित उदाहरण) उन सभी में मौजूद है जिन्होंने उच्चतम स्कोर किया है। ऐसे मामले में, डेटा को सीमा पर काट दिया जाता है, सेंसर नहीं किया जाता है।

उपरोक्त तर्क के आधार पर, मुझे लगता है कि किसी को किसी भी डेटासेट को डेटा ट्रंकेशन और डेटा सेंसरिंग के साथ फिट करने के लिए एक प्रक्रिया तैयार करनी चाहिए। यदि सेंसरिंग मॉडल ने सबसे अच्छा डेटा फिट किया है, तो मुझे लगता है कि कोई भी निष्कर्ष निकाल सकता है कि छत / फर्श प्रभाव मौजूद है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.