अधिक से अधिक विचरण "बेहतर" के साथ एक भविष्यवक्ता है?


13

मेरे पास एक "बुनियादी आँकड़े" अवधारणा प्रश्न है। एक छात्र के रूप में मैं जानना चाहता हूं कि क्या मैं इस बारे में पूरी तरह से गलत सोच रहा हूं और क्यों, यदि ऐसा है:

मान लें कि मैं काल्पनिक रूप से "क्रोध प्रबंधन के मुद्दों" के बीच संबंधों को देखने की कोशिश कर रहा हूं और एक लॉजिस्टिक प्रतिगमन में तलाक (हां / नहीं) कहता हूं और मेरे पास दो अलग-अलग क्रोध प्रबंधन स्कोर का उपयोग करने का विकल्प है - दोनों 100 में से।
स्कोर 1 प्रश्नावली रेटिंग साधन 1 और मेरी अन्य पसंद से आता है; स्कोर 2 एक अलग प्रश्नावली से आता है। हाइपोथेटिक रूप से, हमारे पास पिछले काम से विश्वास करने का कारण है कि क्रोध प्रबंधन के मुद्दे तलाक को जन्म देते हैं।
अगर, 500 लोगों के मेरे नमूने में, स्कोर 1 का विचरण स्कोर 2 की तुलना में बहुत अधिक है, तो क्या यह मानने का कोई कारण है कि स्कोर 1 अपने विचरण के आधार पर तलाक के भविष्यवक्ता के रूप में उपयोग करने के लिए एक बेहतर स्कोर होगा?

मेरे लिए, यह सहज रूप से सही लगता है, लेकिन क्या ऐसा है?


दिलचस्प सवाल, मेरा मानना ​​है कि व्हीबर का जवाब इसे पूरी तरह से अच्छी तरह से समझाता है। इस सवाल पर मेरी पहली प्रतिक्रिया थी: 'बढ़ा हुआ विचरण उच्च वर्ग-विभेदकारी सूचनाओं को आकर्षित नहीं करता है।'
ज़ुर्बर्ब

जवाबों:


11

कुछ त्वरित बिंदु:

  • अपने चर के लिए भिन्न पैमाने को अपनाकर मनमाने ढंग से वृद्धि या कमी की जा सकती है। एक पैमाने को एक से अधिक गुणा करने से एक से अधिक विचरण बढ़ेगा, लेकिन परिवर्तनशील की पूर्वानुमेय शक्ति को नहीं बदलना चाहिए।
  • आप विश्वसनीयता के साथ विचरण को भ्रमित कर सकते हैं। बाकी सभी समान हैं (और यह मानते हुए कि कम से कम कुछ सही स्कोर भविष्यवाणी है), जिस विश्वसनीयता के साथ आप एक निर्माण को मापते हैं, उससे इसकी भविष्य कहनेवाला शक्ति में वृद्धि होनी चाहिए। क्षीणन के लिए सुधार की इस चर्चा को देखें ।
  • यह मानते हुए कि दोनों पैमानों को पच्चीस-पच्चीस आइटमों से बनाया गया था, और इस तरह कुल स्कोर 20 से 100 तक था, फिर अधिक से अधिक संस्करण वाला संस्करण भी अधिक विश्वसनीय होगा (कम से कम आंतरिक स्थिरता के संदर्भ में)।
  • आंतरिक स्थिरता विश्वसनीयता एकमात्र मानक नहीं है जिसके द्वारा एक मनोवैज्ञानिक परीक्षण का न्याय किया जाता है, और यह एकमात्र कारक नहीं है जो किसी दिए गए निर्माण के लिए एक पैमाने बनाम दूसरे की अनुमानित शक्ति को अलग करता है।

9

एक सरल उदाहरण हमें यह पहचानने में मदद करता है कि क्या आवश्यक है।

चलो

Y=C+γX1+ε

जहाँ और पैरामीटर हैं, पहले इंस्ट्रूमेंट (या स्वतंत्र चर) पर स्कोर है, और निष्पक्ष आईआईडी त्रुटि का प्रतिनिधित्व करता है। दूसरे साधन पर स्कोर पहले के माध्यम से संबंधित होने देंCγX1ε

X1=αX2+β.

उदाहरण के लिए, दूसरे उपकरण पर स्कोर 25 से 75 तक हो सकता है और साथ पहले से 100 तक स्कोर हो सकता है । का प्रसरण के प्रसरण का गुना है । फिर भी, हम फिर से लिख सकते हैंX1=2X250X1α2X2

Y=C+γ(αX2+β)=(C+βγ)+(γα)X2+ε=C+γX2+ε.

पैरामीटर बदलते हैं, और स्वतंत्र चर के परिवर्तन होते हैं , फिर भी मॉडल की अनुमानित क्षमता अपरिवर्तित रहती है

सामान्य तौर पर और बीच का संबंध हो सकता है। जिनमें से एक बेहतर कारक है जो करने के लिए एक करीब रैखिक संबंध है पर निर्भर करेगा । इस प्रकार मुद्दा एक पैमाने का नहीं है (जैसा कि के विचरण से परिलक्षित होता है ) लेकिन उपकरणों के बीच के रिश्तों और उन्हें भविष्यवाणी करने के लिए क्या इस्तेमाल किया जा रहा है, यह तय करना होगा। यह विचार प्रतिगमन में स्वतंत्र चर का चयन करने के बारे में हाल ही में पूछे गए प्रश्न में बारीकी से संबंधित है ।एक्स 2 वाई वाई एक्स आईX1X2YYXi

शमन करने वाले कारक हो सकते हैं। उदाहरण के लिए, यदि और खंडित चर रहे हैं और दोनों समान रूप से अच्छी तरह से करने के लिए संबंधित हैं , तो बड़ा विचरण के साथ एक हो सकता है (अगर यह पर्याप्त रूप से समान रूप से फैला हुआ है) अपने मूल्यों के बीच महीन भेद के लिए अनुमति देते हैं और जिससे अधिक सटीक बर्दाश्त। उदाहरण के लिए , यदि दोनों उपकरण 1-5 परिमाण पैमाने पर प्रश्नावली हैं, तो दोनों समान रूप से साथ सहसंबद्ध हैं , और के उत्तर सभी 2 और 3 हैं और के उत्तर 1 से 5 के बीच फैले हैं, का पक्ष लिया जा सकता है। इस आधार।एक्स 2 वाई वाई एक्स 1 एक्स 2 एक्स 2X1X2YYX1X2X2


1

हमेशा आपके द्वारा उपयोग किए जा रहे सांख्यिकीय परीक्षण के लिए मान्यताओं की जाँच करें!

लॉजिस्टिक रिग्रेशन की मान्यताओं में से एक त्रुटियों की स्वतंत्रता है जिसका अर्थ है कि डेटा के मामलों से संबंधित नहीं होना चाहिए। उदाहरण के लिए। आप उन लोगों को समय पर अलग-अलग बिंदुओं पर माप नहीं सकते हैं जो मुझे डर है कि आपने अपने क्रोध प्रबंधन सर्वेक्षणों के साथ किया हो सकता है।

मुझे यह भी चिंता होगी कि 2 क्रोध प्रबंधन सर्वेक्षणों के साथ आप मूल रूप से एक ही चीज़ को माप रहे हैं और आपका विश्लेषण मल्टीकोलिनरिटी से पीड़ित हो सकता है।


1
मुझे लगता है कि N26 एक विचार प्रयोग का सुझाव दे रहा है। यानी, यदि कोई अध्ययन डिजाइन करते समय आपके पास दो पैमानों के बीच एक विकल्प होता है, तो क्या आपको पसंद करना चाहिए, प्राइमा फेशियल, जो अधिक से अधिक गठबंधन के साथ हो। साथ ही, दो भविष्यवक्ता जो एक ही निर्माण का प्रतिनिधित्व करते हैं, लेकिन अलग-अलग मापे जाते हैं, टिप्पणियों की स्वतंत्रता की धारणा का उल्लंघन नहीं करते हैं।
जेरोमे एंग्लीम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.