गैर-पैरामीट्रिक परीक्षण (जैसे क्रमपरिवर्तन परीक्षण) के साथ सहभागिता प्रभाव का परीक्षण कैसे करें?


10

मेरे पास दो श्रेणीबद्ध / नाममात्र चर हैं। उनमें से प्रत्येक केवल दो अलग-अलग मान ले सकता है (इसलिए, मेरे कुल 4 संयोजन हैं)।

मूल्यों का प्रत्येक संयोजन संख्यात्मक मानों के एक सेट के साथ आता है। तो, मेरे पास संख्याओं के 4 सेट हैं। इसे और अधिक ठोस बनाने के लिए, हम कहें कि मेरे पास male / femaleऔर young / oldनाममात्र चर के रूप में है और मेरे पास weightआश्रित संख्यात्मक "आउटपुट" है।

मैं से कि संक्रमण पता maleकरने के लिए femaleऔसत वजन में बदल जाती है और इन परिवर्तनों को सांख्यिकीय रूप से महत्वपूर्ण हैं। तो, मैं एक genderकारक की गणना कर सकता हूं । यह ageवैरिएबल पर लागू होता है । मुझे लगता है कि संक्रमण से पता है youngके लिए oldऔसत वजन में बदल जाती है और मैं इसी गणना कर सकते हैं ageकारक।

अब, मैं वास्तव में यह देखना चाहता हूं कि क्या डेटा साबित करता है कि युवा-महिलाओं से लेकर बूढ़े-पुरुषों तक संक्रमण लिंग और आयु-कारकों का संयोजन है। दूसरे शब्दों में, मैं जानना चाहता हूं कि क्या डेटा साबित करता है कि "2 डी प्रभाव" हैं या, दूसरे शब्दों में, वह उम्र और लिंग-प्रभाव स्वतंत्र नहीं हैं। उदाहरण के लिए, यह हो सकता है कि पुरुषों के लिए बूढ़ा हो जाना कारक 1.3 से वजन बढ़ाता है और महिला के लिए संगत कारक 1.1 है।

बेशक मैं दो उल्लिखित कारकों (पुरुषों के लिए आयु कारक और महिलाओं के लिए आयु कारक) की गणना कर सकता हूं और वे अलग हैं। लेकिन मैं इस अंतर के सांख्यिकीय महत्व की गणना करना चाहता हूं। यह अंतर कितना वास्तविक है।

यदि संभव हो तो मैं एक गैर पैरामीट्रिक परीक्षण करना चाहूंगा। क्या यह करना संभव है कि मैं चार सेटों को मिलाकर, उन्हें फेरबदल करके, फिर से विभाजित करके और कुछ की गणना करके क्या करना चाहता हूं।


2
गैरपारंपरिक रूप से बातचीत से निपटने के साथ एक कठिनाई यह है कि प्रतिक्रिया का एक मोनोटोनिक परिवर्तन उस इंटरैक्शन को हटा सकता है जो मौजूद था, इंटरैक्शन को प्रेरित करता है जहां यह अनुपस्थित था, या इंटरैक्शन की दिशा को फ्लिप करता है। यह बताता है कि रैंक-आधारित दृष्टिकोण, उदाहरण के लिए, वह नहीं कर सकते हैं जो आप उनसे उम्मीद करेंगे।
Glen_b -Reinstate मोनिका

मूल चर पर क्रमपरिवर्तन परीक्षण के साथ, आपको वह समस्या नहीं है लेकिन यह पता चलता है कि बातचीत के लिए कोई सटीक परीक्षण नहीं हैं। आप कुछ अनुमानित परीक्षण प्राप्त कर सकते हैं।
Glen_b -Reinstate Monica

जवाबों:


5

इंटरैक्शन के लिए गैर-समरूप परीक्षण हैं। मोटे तौर पर, आप देखे गए वज़न को उनके रैंकों द्वारा प्रतिस्थापित करते हैं और परिणामी डेटा सेट को हेटेरोसेडस्टिक एनोवा के रूप में मानते हैं। उदाहरण के लिए ब्रूनर और पुरी (2001) द्वारा "गुटनिरपेक्ष डिजाइनों में गैरपरंपरागत तरीके" देखें।

हालाँकि, जिस तरह की नॉनपेरमेट्रिक इंटरैक्शन में आप रुचि रखते हैं, वह इस सामान्यता में नहीं दिखाई जा सकती है। तुमने कहा था:

दूसरे शब्दों में, मैं जानना चाहता हूं कि क्या डेटा साबित करता है कि "2 डी प्रभाव" हैं या, दूसरे शब्दों में, वह उम्र और लिंग-प्रभाव स्वतंत्र नहीं हैं। उदाहरण के लिए, यह हो सकता है कि पुरुषों के लिए बूढ़ा हो जाना कारक 1.3 से वजन बढ़ाता है और महिला के लिए संगत कारक 1.1 है।

उत्तरार्द्ध असंभव है। नॉनपरमेट्रिक इंटरैक्शन में एक साइन चेंज होना चाहिए, यानी बढ़ते हुए बूढ़े पुरुषों का वज़न बढ़ता है लेकिन महिलाओं का वज़न घटता है। इस तरह का एक संकेत परिवर्तन तब भी बना रहता है, जब आप नीरस रूप से वज़न बदल देते हैं। लेकिन आप डेटा पर एक नीरस परिवर्तन का चयन कर सकते हैं जो कारक 1.1 से वजन में वृद्धि करता है जैसा कि आप 1.3 तक चाहते हैं। बेशक, आप कभी भी महत्वपूर्ण होने के लिए अंतर नहीं दिखाएंगे यदि यह उतना ही निकट हो सकता है जितना आप चाहते हैं।

यदि आप वास्तव में हस्ताक्षर परिवर्तन के बिना बातचीत में रुचि रखते हैं, तो आपको सामान्य पैरामीट्रिक विश्लेषण से चिपके रहना चाहिए। वहाँ, नीरस रूपांतरण जो "अंतर को निगलते हैं" अनुमति नहीं है। बेशक, यह फिर से मॉडलिंग और अपने आंकड़ों की व्याख्या करके ध्यान में रखने के लिए कुछ है।


1

यदि आपको लगता है कि उम्र और लिंग के प्रभाव सिर्फ व्यक्तिगत प्रभाव की तुलना में अधिक हैं, तो आप मॉडल पर विचार कर सकते γweighti=αagei+βgenderi+γ(genderiagei).γगुणांक उम्र और लिंग के "2 डी" प्रभाव के आकार को कैप्चर करता है। आप की टी आंकड़ा जाँच कर सकते हैं पर मोटा अनुमान लगा है कि क्या γ आप अपने मॉडल में निरीक्षण से काफी अलग है γ = 0γγγ=0

यहाँ यह जान सकें कि इस अतिरिक्त गुणक अवधि एक बहुत ही किसी न किसी चित्रमय उदाहरण है नहीं करता है।genderiagei

मॉडल , हम अनिवार्य रूप से डेटा के लिए एक साधारण हाइपरप्लेन फिट करने की कोशिश करते हैंresponse=x1+x2

यहां छवि विवरण दर्ज करें

यह मॉडल covariates में रैखिक है, इसलिए ऊपर दिए गए भूखंड में आप जिस रैखिक आकार को देखते हैं।

दूसरी ओर, मॉडल x 1 और x 2 में गैर-रैखिक है और इसलिए वक्रता के कुछ स्तर की अनुमति देता हैresponse=x1+x2+x1x2x1x2

यहां छवि विवरण दर्ज करें

परिकल्पना को अस्वीकार करने में असफल होना अस्वीकार करने में विफल जैसा है कि मॉडल में इस रूप की कुछ वक्रता है।γ=0

एक गैर पैरामीट्रिक परीक्षण के संदर्भ में, आप के लिए बूटस्ट्रैप मानक त्रुटियों प्राप्त करने के द्वारा क्या सुझाव दिया की तर्ज पर कुछ कर सकते हैं । इसका मतलब है कि, कई बार आप: 1) प्रतिस्थापन के साथ आपके डेटा का नमूना, 2) रैखिक मोड, 3) एक अनुमान प्राप्त पुनर्गणना γ । आप में से कई के अनुमान के बाद γ , तो आप उपयोग कर सकते हैं 50 ± पी % एक गैर पैरामीट्रिक स्थापित करने के लिए quantile 2 पी % के लिए विश्वास अंतराल γ । इस पर अधिक के लिए, Google "बूटस्ट्रैप मानक त्रुटियां"।γγ^γ^50±p%2p%γ


यह कैसे गैर-रेखीय हो सकता है यदि X1 और x2 केवल 0 या 1 का मान ले सकते हैं? आपके उदाहरण में गामा कैसे वक्रता के किसी भी रूप की व्याख्या करेगा?
5

इससे कोई फर्क नहीं पड़ता कि डोमेन है, यह अभी भी गैर रेखीय क्योंकि समारोह अपने तर्कों का एक रैखिक संयोजन के रूप में लिखा नहीं किया जा सकता है (यानी )। अपने दूसरे बिंदु के लिए, नोटिस मैंने ध्यान से कहा "एक बहुत ही मोटा चित्रमय उदाहरण।" यह बाइनरी केस का एक निरंतर एनालॉग है। αR2:x1+x2+x1x2=i=12αixi
मुस्तफा एस आइसा

मैं, हालांकि, जब डोमेन द्विआधारी (जो 2D घन के शीर्ष की तरह है) को जोड़ देगा, तो आप इस फ़ंक्शन का रैखिक रूप से इलाज कर सकते हैं। लेकिन कार्यात्मक रूप सख्ती से गैर-रैखिक है।
मुस्तफा एस आइसा

@MustafaMEisa, मैंने कभी भी "2 डी क्यूब के कोने" के संदर्भ में समझाए गए रैखिक मॉडल में इंटरैक्शन शब्द नहीं देखा है। यह जानकारीपूर्ण होगा यदि आप विस्तृत कर सकते हैं।
5

@ HorstGrünbusch, मैं इस उत्तर पर आपकी टिप्पणी के लिए भी उत्सुक हूं, क्योंकि आपने पहले ही मेरे उत्तर पर एक उपयोगी टिप्पणी दे दी है।
5

1

जैसा कि अन्य ने उल्लेख किया है, यह एक इंटरैक्शन के साथ रैखिक रूप से मॉडलिंग की जा सकती है। आप दो डमी से बातचीत कर रहे हैं, और इस बारे में कुछ भी गैर-रैखिक नहीं है। मॉडल को देखते हुए: में 'लिंग' सीमांत प्रभाव आंशिक व्युत्पन्न है:

wt=α+b1age+b2gender+b3agegender+ϵ

wtgender=b2+b3age

देखें कि कैसे लिंग और आयु केवल 0 या 1 के मान ले सकते हैं, हम अनिवार्य रूप से केवल चार अलग-अलग समूहों के साधनों में अंतर देख रहे हैं? अर्थात्, हमारे पास केवल चार अलग-अलग संयोजन हैं जो हम उपरोक्त समीकरणों में प्लग कर सकते हैं: (1) और एक जी = 0 , (2) जी एन डी आर = 1 और एक जी = 1 , (3) जी एन डी आर = 0 और एक जी gender=0age=0gender=1age=1gender=0 , और (4) जी एन डी आर = 1 और एक जी = 0 । इस प्रकार, आपका विशिष्ट उदाहरण चार समूह साधनों के बीच तुलना के बराबर है।age=1gender=1age=0

यह समझने में भी मददगार हो सकता है कि यह समझने के लिए कि उपरोक्त दो एनोवा के साथ नाममात्र चर के बराबर कैसे है। इस तथ्य को शांत करने के एक अन्य तरीके के रूप में कि आपके विशिष्ट उदाहरण के साथ, (फिर से, क्योंकि उम्र और लिंग के केवल चार संभावित संयोजन हैं) हम निम्नलिखित मॉडल की तरह एक स्पष्ट अंतःक्रियात्मक शब्द के बिना भी निर्दिष्ट कर सकते हैं:

wt=α+b1young.male+b2old.male+b3young.female+ϵ

old.femaleb1old.femaleyoung.maleαwtold.female

उपरोक्त उदाहरण इस प्रकार इस निष्कर्ष पर पहुंचने के लिए एक अत्यधिक जटिल तरीका है (कि हम वास्तव में सिर्फ चार समूह साधनों की तुलना कर रहे हैं), लेकिन बातचीत कैसे काम करती है, इस बारे में जानने के लिए, मुझे लगता है कि यह एक सहायक उत्पाद है। सीवी पर अन्य बहुत अच्छे पद हैं जो नाममात्र चर के साथ एक सतत चर को इंटरैक्ट करने के लिए, या दो निरंतर चर को इंटरैक्ट कर रहे हैं। भले ही आपके प्रश्न को गैर-पैरामीट्रिक परीक्षणों को निर्दिष्ट करने के लिए संपादित किया गया हो, मुझे लगता है कि यह आपकी समस्या के माध्यम से अधिक पारंपरिक (यानी, पैरामीट्रिक) दृष्टिकोण से सोचने में मददगार है, क्योंकि परिकल्पना परीक्षण के लिए अधिकांश गैर पैरामीट्रिक दृष्टिकोणों में एक ही तर्क होता है लेकिन आम तौर पर विशिष्ट वितरण के बारे में कम धारणाएं।

wt

old.menyoung.women

"महत्वपूर्ण" इंटरैक्शन पर लघु

x1x2x1x2लेकिन एक बार और, अगर हमारे पास केवल दो कोवरिएट्स हैं जो केवल 0 या 1 का मान ले सकते हैं, तो इसका मतलब है कि हम अनिवार्य रूप से अन्य समूह साधनों को देख रहे हैं।

काम किया उदाहरण

चलो डन के परीक्षण के परिणामों के साथ इंटरैक्शन मॉडल के परिणामों की तुलना करें। सबसे पहले, कुछ डेटा उत्पन्न करते हैं जहां (ए) पुरुषों का वजन महिलाओं की तुलना में अधिक होता है, (बी) छोटे पुरुषों का वजन वृद्ध पुरुषों की तुलना में कम होता है, और (सी) युवा और वृद्ध महिलाओं के बीच कोई अंतर नहीं होता है।

set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))

wt

mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)

 model: wt ~ age * gender

 age*gender effect
       gender
age         male   female
  old   80.61897 57.70635
  young 67.78351 56.01228

अपने सीमांत प्रभाव के लिए एक मानक त्रुटि या विश्वास अंतराल की गणना करने की आवश्यकता है? ऊपर उल्लिखित 'प्रभाव' पैकेज आपके लिए यह कर सकता है, लेकिन बेहतर अभी तक, एकेन और वेस्ट (1991) आपको अधिक जटिल बातचीत मॉडल के लिए सूत्र भी देते हैं। मैट गोल्डर द्वारा बहुत अच्छी टिप्पणी के साथ उनकी तालिकाओं को आसानी से यहाँ छापा गया है।

अब डन के परीक्षण को लागू करने के लिए।

#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")

Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0


                           Comparison of x by group                            
                             (Benjamini-Hochberg)                              
Col Mean-|
Row Mean |    old.men   young.me   young.wo
---------+---------------------------------
young.me |   3.662802
         |    0.0002*
         |
young.wo |   7.185657   3.522855
         |    0.0000*    0.0003*
         |
old.wome |   6.705346   3.042544  -0.480310
         |    0.0000*    0.0014*     0.3155

क्रुश्कल-वालिस ची-स्क्वेर्ड परीक्षा परिणाम पर पी-मूल्य बताता है कि हमारे समूहों में से कम से कम एक अलग आबादी से आता है। ' समूह-दर-समूह तुलना के लिए, शीर्ष नंबर डन का जेड-टेस्ट स्टेटिस्टिक है, और नीचे की संख्या एक पी-मूल्य है, जिसे कई तुलनाओं के लिए समायोजित किया गया है। जैसा कि हमारे उदाहरण के आंकड़े कृत्रिम थे, यह आश्चर्यजनक है कि हमारे पास इतने छोटे पी-मान हैं। लेकिन छोटी और बड़ी महिलाओं के बीच की तुलना में नीचे-सही तुलना पर ध्यान दें। परीक्षण सही रूप से शून्य परिकल्पना का समर्थन करता है कि इन दोनों समूहों के बीच कोई अंतर नहीं है।

अद्यतन: अन्य उत्तरों को देखते हुए, इस उत्तर को इस विचार को विवादित करने के लिए अद्यतन किया गया है कि इसके लिए किसी भी प्रकार के गैर-रेखीय मॉडलिंग की आवश्यकता होती है, या - ओपी को दो बाइनरी कोवरिएट्स का विशिष्ट उदाहरण दिया जाता है, अर्थात, चार समूह - कि एक होना चाहिए इस गैर-परम्परागत रूप से परिवर्तन के लिए साइन इन करें। उदाहरण के लिए, यदि उम्र निरंतर थी, तो इस समस्या से निपटने के अन्य तरीके होंगे, लेकिन यह ओपी द्वारा दिया गया उदाहरण नहीं था।


आप दो पार किए गए कारकों की संरचना का उपयोग नहीं करते हैं। आप केवल चार समूहों की तुलना करें। डन का परीक्षण बातचीत के बारे में बिल्कुल नहीं है।
होर्स्ट ग्रुनबसच

सहमत, डन का परीक्षण बातचीत के बारे में नहीं है। हालांकि, सवाल विशेष रूप से दो बाइनरी चर के बीच बातचीत के बारे में पूछता है। मेरा जवाब दर्शाता है कि यह चार समूहों की तुलना के बराबर कैसे है। यदि बातचीत की शर्तें ओपी के लिए नई हैं, तो उम्मीद है कि यह एक सहायक चित्रण है।
5

1

तो आपके पास ये यादृच्छिक चर हैं:

  • AN
  • S{male,female}
  • W]0,[

और आपके पास ये संभाव्यता द्रव्यमान / घनत्व कार्य हैं:

  • fWW
  • fW,AW,A
  • fW,SW,S
  • fW,A,SW,A,S

was

  • fW,A(w,a)fW(w)
  • fW,S(w,s)fW(w)

fW,A,S(w,a,s)fW,A(w,a)fW,S(w,s)

was

हालाँकि, आप ऊपर के सच्चे संयुक्त PDF को नहीं जानते हैं। चूंकि आप खुद को गैर-पैरामीट्रिक तरीकों तक सीमित करना चाहते हैं, इसलिए अब आपका काम इन गैर-पैरामीट्रिक अनुमानों को खोजना है:

  • f^W,A(w,a)
  • f^W,S(w,s)
  • f^W,A,S(w,a,s)

और फिर यह दिखाएं कि:

  • आपके घनत्व का अनुमान काफी सटीक है।
  • f^W,A,S(w,a,s)f^W,A(w,a)f^W,S(w,s)
  • f^W,A,S(w,a,s)=f^W,A(w,a)=f^W,S(w,s)

0

यह बातचीत प्रभाव के लिए जाँच होगी । रैखिक मॉडलिंग ऐसी चीज़ की जाँच करने में सक्षम होगी लेकिन यह गैर-पैरामीट्रिक नहीं है इसलिए मुझे लगता है कि एक और उपकरण का उपयोग किया जाना चाहिए।

अब तक आप अपना ageऔर genderप्रभाव कैसे देख रहे हैं?

संपादित करें: यह उत्तर ऐसा लगता है कि यह आपकी मदद करेगा

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.