जब कुछ समय बिंदुओं में भारी प्रतिक्रियाएं होती हैं और कुछ दोहराया उपायों के अध्ययन में नहीं आता है तो क्या करें?


12

आमतौर पर, जब एक अनुदैर्ध्य डिजाइन में निरंतर लेकिन तिरछे परिणाम के उपायों का सामना होता है (जैसे, एक-विषय के प्रभाव के साथ) सामान्य दृष्टिकोण परिणाम को सामान्यता में बदलना है। यदि स्थिति चरम है, जैसे कि छंटनी की गई टिप्पणियों के साथ, किसी को फैंसी मिल सकता है और एक टोबाइट ग्रोथ वक्र मॉडल का उपयोग कर सकता है, या कुछ ऐसे।

लेकिन मैं एक नुकसान में हूं जब मैं ऐसे परिणाम देखता हूं जो आम तौर पर कुछ निश्चित समय बिंदुओं पर वितरित किए जाते हैं और फिर दूसरों पर भारी तिरछा होते हैं; परिवर्तन एक रिसाव प्लग कर सकता है लेकिन दूसरा वसंत। ऐसे मामले में आप क्या सुझाव दे सकते हैं? क्या मिश्रित प्रभाव वाले मॉडल के "गैर-पैरामीट्रिक" संस्करण हैं जिनके बारे में मुझे जानकारी नहीं है?

नोट: एक लागू उदाहरण ज्ञान परीक्षण स्कोर होगा / शैक्षिक हस्तक्षेप की एक श्रृंखला के बाद। स्कोर सामान्य से शुरू होता है, लेकिन बाद में पैमाने के उच्च अंत में क्लस्टर होता है।


6
उदाहरण दिलचस्प है क्योंकि यह हर समय होता है। इससे निपटने के लिए जाने-माने परिवर्तन हैं, जैसे कि तुकी की "तह" शक्ति रूपांतरण। ये पैमाने के बीच में थोड़ा बदलाव करते हैं फिर भी दोनों छोर पर तिरछापन ठीक करते हैं। मैंने पाया है कि मानकीकृत पूर्व / पोस्ट परीक्षण तुलनाओं के लिए मुड़े हुए जड़ें और लॉग बहुत अच्छी तरह से काम करते हैं ।
whuber

शुक्रिया, व्हीबर । मैं तह परिवर्तन दृष्टिकोण पर गौर करूंगा।
ब्रेंडेन डुफॉल्ट

1
एक परिभाषा और उदाहरण के लिए, ब्रेंडेन, आँकड़े देखें ।stackexchange.com/a/10979 । उनके उपयोग पर निर्देश के लिए, Tukey की पुस्तक EDA में अंतिम कुछ अध्याय देखें ।
whuber

2
एक जोड़ा नोट - याद रखें कि मॉडल के अवशेषों के बारे में धारणाएं बनाई जाती हैं, न कि इसमें शामिल वास्तविक चर।
पीटर फ्लॉम - मोनिका

जवाबों:


1

यह मानते हुए कि समस्या आपके अवशेषों में होती है (जैसा कि परिणाम चर का वितरण आमतौर पर एक समस्या नहीं होती है), मैं एक परिवर्तन या आवेदन के माध्यम से इसे "ठीक" करने की कोशिश करने के बजाय समस्या के कारण की जांच करना चाहूंगा अपरंपरागत मॉडल।

यदि यह मामला है कि एक प्रवृत्ति प्रतीत होती है (उदाहरण के लिए, उत्तरोत्तर अधिक या कम सामान्य), या, जब यह सामान्य से सामान्य नहीं होने के बीच एक स्पष्ट विराम होता है, तो यह किसी प्रकार का "शासन परिवर्तन" बताता है आपका डेटा (यानी, डेटा जनरेटिंग तंत्र समय के साथ बदल रहा है) या किसी प्रकार की अनुपलब्ध चर समस्या।

यदि यह मामला है कि कोई स्पष्ट पैटर्न नहीं है (जैसे, समय अवधि 1 और 3 सामान्य दिखते हैं और समय अवधि 2 और 4 नहीं है) तो मैं डेटा अखंडता समस्या के लिए बहुत सावधानी से देखूंगा।

यह देखने के लिए कि क्या आपके पास शासन परिवर्तन है, यह देखने का एक सरल तरीका केवल "सामान्य" समय अवधि का उपयोग करके मॉडल का अनुमान लगाना है और फिर अन्य समय अवधि का उपयोग करके फिर से अनुमान लगाना है और देखें कि क्या अंतर होता है। एक अधिक जटिल दृष्टिकोण एक अव्यक्त वर्ग मॉडल का उपयोग करना है, शायद समय के साथ एक सहवर्ती चर के रूप में।

जैसा कि आपके प्रश्न को गैर-घटक मिश्रित प्रभावों के मॉडल के बारे में बताता है कि यह इस बात पर निर्भर करता है कि आपके पास गैर-पैरामीटर क्या है। यदि आपके पास ऐसे मॉडल हैं जो संख्यात्मक निर्भर चर नहीं मानते हैं, तो ऐसे बहुत सारे मॉडल हैं (उदाहरण के लिए, लिमडेपी में काफी कुछ है)। इसके अलावा, ध्यान रखें कि सामान्यता धारणा का उल्लंघन संभवतः केवल एक अनुमान परिप्रेक्ष्य से समस्याग्रस्त होगा यदि आपका नमूना आकार छोटा है। इसकी जांच का एक तरीका यह होगा कि आप अन्य टिप्पणियों और उत्तरों में चर्चा किए गए विभिन्न परिवर्तनों की कोशिश करें और देखें कि क्या यह आपके निष्कर्षों पर अधिक प्रभाव डालता है।


+1 धन्यवाद, टिम। मैं अव्यक्त वर्ग मॉडल और LIMDEP के संबंध में आपके सुझावों की सराहना करता हूं। जैसे-जैसे मैं उनके बारे में और जानना शुरू करूंगा, ये दृष्टिकोण मुझे अपील में बढ़ रहे हैं।
ब्रेंडेन डुफॉल्ट

0

बॉक्स-कॉक्स ट्रांसफ़ॉर्मेशन हैं जो चर को एक पावर लैम्ब्डा में बढ़ाते हैं जहां लैम्बडा को मॉडल पैरामीटर अनुमान में शामिल किया जाता है। मैं Tukey के तह बिजली परिवर्तन से परिचित नहीं हूँ, इसलिए मुझे नहीं पता कि क्या हम उसी चीज़ के बारे में बात कर रहे हैं। लैम्ब्डा का अनुमान लगाने के लिए आपको फिट में कई बिंदुओं की आवश्यकता है। क्या आप प्रत्येक समय बिंदु पर एक अलग वितरण फिट करना चाहते हैं जहां वितरण को हर समय बिंदु पर परीक्षण लेने वाले विषयों के एक सेट पर परिभाषित किया गया है? यहां तक ​​कि अगर यह मामला है अगर आप जानते हैं कि कुछ समय बिंदुओं में समान वितरण होना चाहिए, तो आप उन्हें एक ही फिट में संयोजित कर सकते हैं।

एक और दृष्टिकोण जो गैर-समरूप है और इसमें सामान्यता में परिवर्तन शामिल नहीं है, प्रत्येक समय बिंदु पर या समय बिंदुओं के प्रत्येक संयुक्त सेट पर बूटस्ट्रैप को लागू करना होगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.