श्रेणीबद्ध चरों के बीच संयम


11

निरंतर भविष्यवक्ताओं के संबंध में बहुत सी मिलीभगत है, लेकिन इतना नहीं कि मैं श्रेणीबद्ध भविष्यवक्ताओं पर पा सकता हूं। मेरे पास इस प्रकार का डेटा नीचे सचित्र है।

पहला कारक एक आनुवंशिक चर (एलील काउंट) है, दूसरा कारक एक रोग श्रेणी है। स्पष्ट रूप से जीन बीमारी से पहले होते हैं और लक्षण दिखाते हैं जो एक निदान का नेतृत्व करते हैं। हालाँकि, वर्गों के प्रकार II या III प्रकारों का उपयोग करते हुए एक नियमित विश्लेषण, जैसा कि आमतौर पर SPSS के साथ किया जाता है, प्रभाव याद करता है। एक प्रकार का मैं वर्ग विश्लेषण का चयन करता है, जब उपयुक्त क्रम में प्रवेश किया जाता है, तो यह निर्भर करता है। इसके अलावा, रोग प्रक्रिया के लिए अतिरिक्त घटक होने की संभावना है जो जीन से संबंधित नहीं हैं जो कि प्रकार II या III के साथ अच्छी तरह से पहचाने नहीं जाते हैं, बनाम lm2 या Anova नीचे aova (lm1) देखें।

उदाहरण डेटा:

set.seed(69)
iv1 <- sample(c(0,1,2), 150, replace=T)
iv2 <- round(iv1 + rnorm(150, 0, 1), 0)
iv2 <- ifelse(iv2<0, 0, iv2)
iv2 <- ifelse(iv2>2, 2, iv2)
dv  <- iv2 + rnorm(150, 0, 2)
iv2 <- factor(iv2, labels=c("a", "b", "c"))
df1 <- data.frame(dv, iv1, iv2)

library(car)
chisq.test(table(iv1, iv2))          # quick gene & disease relations
lm1 <- lm(dv~iv1*iv2, df1);    lm2 <- lm(dv~iv2*iv1, df1)
anova(lm1);                    anova(lm2)
Anova(lm1, type="II");         Anova(lm2, type="II")
  1. lm1 प्रकार I के साथ मेरे लिए पृष्ठभूमि सिद्धांत दिए गए डेटा का विश्लेषण करने का उपयुक्त तरीका लगता है। क्या मेरी धारणा सही है?
  2. मुझे स्पष्ट रूप से ऑर्थोगोनल डिजाइनों में हेरफेर करने के लिए उपयोग किया जाता है, जहां ये समस्याएं आमतौर पर नहीं होती हैं। क्या SPSS केंद्रित क्षेत्र के संदर्भ में समीक्षकों को यह समझाना मुश्किल है कि यह सबसे अच्छी प्रक्रिया है (बिंदु 1 सही है)?
  3. और सांख्यिकी अनुभाग में क्या रिपोर्ट करना है? कोई अतिरिक्त विश्लेषण, या टिप्पणियां जो अंदर जानी चाहिए?

यह सुनकर आश्चर्य होता है कि SPSS का उपयोग करने वाला कोई व्यक्ति केवल III या II SS जानता है। और तुम जैसे ध्वनि करते हो।
ttnphns

2
ठीक है, मेरे पास वही ज्ञान अंतराल था जिसका मैं अपने प्रश्न में उल्लेख कर रहा हूं। ऐसा लगता है कि लोगों के हितों, ज्ञान और वे सॉफ्टवेयर के बजाय सॉफ्टवेयर से कैसे परिचित होते हैं। लेकिन डिफ़ॉल्ट विकल्प बड़े भाग के साथ-साथ SPSS में डिफ़ॉल्ट प्रकार III विकल्प का उपयोग करते हैं।
मैट अल्ब्रेक्ट

आप कह रहे हैं कि आपके पास SPSS की एनोवा प्रक्रिया (अनियनोवा?) का उपयोग करके एक विशिष्ट क्रम में 2 भविष्यवाणियों को दर्ज करने का एक तरीका है। मैं केवल प्रतिगमन प्रक्रिया पर स्विच करके आदेश को निर्दिष्ट करने का एक तरीका जानता हूं। आप इसे कैसे पूरा करेंगे?
rolando2

जवाबों:


8

कारकों के बीच Collinearity काफी जटिल है। शास्त्रीय उदाहरण वह है जो आपको तब मिलता है जब आप तीन निरंतर चर 'आयु', 'अवधि' और 'वर्ष' को समूहबद्ध करते हैं। इसमें विश्लेषण किया गया है:

चार (तीन नहीं) संदर्भों को हटाने के बाद, आपको मिलने वाले गुणांक केवल एक अज्ञात रैखिक प्रवृत्ति तक पहचाने जाते हैं। इसका विश्लेषण किया जा सकता है क्योंकि स्रोत चर (आयु + वर्ष = अवधि) में एक ज्ञात कोलिनियरिटी से कोलिनियरिटी उत्पन्न होती है।

कुछ काम दो कारकों के बीच सहज सहयोग पर भी किए गए हैं। इसमें इसका विश्लेषण किया गया है:

उतावलापन यह है कि श्रेणीबद्ध चर के बीच संपार्श्विकता का अर्थ है कि डेटासेट को प्रत्येक घटक में संदर्भ स्तर के साथ डिस्कनेक्ट किए गए भागों में विभाजित किया जाना चाहिए। विभिन्न घटकों से अनुमानित गुणांक सीधे तुलना नहीं की जा सकती।

तीन या अधिक कारकों के बीच अधिक जटिल संपार्श्विक के लिए, स्थिति जटिल है। अनुमान कार्यों को खोजने के लिए मौजूद प्रक्रियाएं हैं, यानी गुणांक के रैखिक संयोजन, जो व्याख्या करने योग्य हैं, जैसे:

  • Utilitas Mathematica (60) पीपी 51-65 में गोडोल्फिन और गोडोल्फिन द्वारा "पंक्ति-स्तंभ डिजाइन की कनेक्टिविटी पर"

लेकिन मेरे ज्ञान के लिए सहज ज्ञान युक्त तरीके से इस तरह की कोलिनियरिटी को संभालने के लिए कोई सामान्य सिल्वर-बुलेट मौजूद नहीं है।


1

कुछ आँकड़ों के साथ जगह के आसपास लोगों के साथ चैट करने के बाद। ऐसा लगता है कि इस तरह का सवाल जवाब देने के लिए सबसे सही सवाल नहीं हो सकता है। जब वे अत्यधिक सहसंबद्ध होते हैं, तो न्यूरोपैसिकोलॉजिकल उपायों पर आनुवंशिक और नैदानिक ​​बातचीत की जांच करने के लिए एनोवा (या इसी तरह के तरीकों) का उपयोग करना एक कठिन सवाल है। मुझे इसके बजाय संरचनात्मक समीकरण मॉडलिंग के साथ डेटा की संरचना की जांच करने के लिए कहा गया है।

जैसे ही मैं SEM के बारे में अधिक जानूंगा, यह उत्तर अपडेट हो जाएगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.