व्यावहारिक रूप से, जब डेटा काफी मान्यताओं को पूरा नहीं करता है, तो लोग एनोवा को कैसे संभालते हैं?


19

यह कड़ाई से आँकड़े का सवाल नहीं है - मैं एनोवा मान्यताओं के बारे में सभी पाठ्यपुस्तकों को पढ़ सकता हूं - मैं यह पता लगाने की कोशिश कर रहा हूं कि वास्तविक कामकाजी विश्लेषक डेटा को कैसे संभालते हैं जो मान्यताओं को पूरा नहीं करते हैं। मैं इस साइट पर बहुत सारे सवालों के जवाबों की तलाश में गया हूं और मैं ANOVA (अमूर्त, आदर्श गणितीय संदर्भ में) का उपयोग नहीं करने या आर में नीचे वर्णित कुछ चीजों को कैसे करना है, इसके बारे में पोस्ट ढूंढता रहता हूं। वास्तव में यह पता लगाने की कोशिश कर रहा हूं कि लोग वास्तव में क्या निर्णय लेते हैं और क्यों।

मैं चार समूहों में पेड़ों (वास्तविक पेड़, सांख्यिकीय पेड़ नहीं) से समूहीकृत डेटा पर विश्लेषण चला रहा हूं। मुझे प्रत्येक पेड़ के लिए लगभग 35 विशेषताओं का डेटा मिला है और मैं यह निर्धारित करने के लिए प्रत्येक विशेषता से गुज़र रहा हूं कि क्या समूह उस विशेषता पर महत्वपूर्ण रूप से भिन्न हैं। हालाँकि, कुछ मामलों में, एनोवा की धारणाओं का थोड़ा उल्लंघन किया गया है, क्योंकि संस्करण समान नहीं हैं (एक लीवेन के परीक्षण के अनुसार, अल्फा = .05 का उपयोग करके)।

जैसा कि मैं इसे देख रहा हूं, मेरे विकल्प हैं: 1. डेटा को रूपांतरित करें और देखें कि क्या यह लेवेन पी-वैल को बदलता है। 2. एक गैर पैरामीट्रिक परीक्षण का उपयोग करें जैसे एक विलकॉक्सन (यदि ऐसा है, तो कौन सा?)। 3. एनोवा परिणाम के लिए किसी तरह का सुधार करें, जैसे बोन्फेरोनी (मैं वास्तव में निश्चित नहीं हूं कि अगर ऐसा कुछ मौजूद है?)। मैंने पहले दो विकल्पों की कोशिश की है और थोड़ा अलग परिणाम प्राप्त किया है - कुछ मामलों में एक दृष्टिकोण महत्वपूर्ण है और दूसरा नहीं है। मैं पी-वैल्यू मछली पकड़ने के जाल में गिरने से डरता हूं, और मैं सलाह की तलाश कर रहा हूं जो मुझे यह बताने में मदद करेगा कि किस दृष्टिकोण का उपयोग करना है।

मैंने कुछ ऐसी चीजें भी पढ़ी हैं जो बताती हैं कि विषमलैंगिकता वास्तव में एनोवा के लिए एक समस्या नहीं है जब तक कि साधन और संस्करण परस्पर संबंधित नहीं हैं (यानी वे दोनों एक साथ बढ़ते हैं), इसलिए शायद मैं सिर्फ लेवेने के परिणाम को अनदेखा कर सकता हूं जो मुझे दिखाई देता है पैटर्न की तरह है कि? यदि हां, तो क्या इसके लिए कोई परीक्षा है?

अंत में, मुझे यह जोड़ना चाहिए कि मैं एक सहकर्मी की समीक्षा की गई पत्रिका में प्रकाशन के लिए यह विश्लेषण कर रहा हूं, इसलिए जो भी मैं निपटता हूं उसे समीक्षकों के साथ पास करना पड़ता है। इसलिए, यदि कोई भी समान, प्रकाशित उदाहरणों के लिए लिंक प्रदान कर सकता है जो शानदार होगा।


3
आप उपयोग करते हैं या नहीं R, यह आपको मेरा जवाब पढ़ने के लिए लाभ दे सकता है: विषम डेटा के लिए एक तरफ़ा एनोवा के विकल्प , जो इनमें से कुछ मुद्दों पर चर्चा करता है।
गूँग - मोनिका

जवाबों:


18

मैं यह पता लगाने की कोशिश कर रहा हूं कि वास्तविक कामकाजी विश्लेषक डेटा को कैसे संभालते हैं जो मान्यताओं को पूरा नहीं करते हैं।

यह मेरी जरूरतों पर निर्भर करता है कि कौन सी धारणाओं का उल्लंघन किया जाता है, किस तरह से, कितनी बुरी तरह, कितना प्रभाव है कि अनुमान को प्रभावित करता है, और कभी-कभी नमूना आकार पर।

मैं चार समूहों में पेड़ों से समूहीकृत डेटा पर विश्लेषण चला रहा हूं। मुझे प्रत्येक पेड़ के लिए लगभग 35 विशेषताओं का डेटा मिला है और मैं यह निर्धारित करने के लिए प्रत्येक विशेषता से गुजर रहा हूं कि क्या समूह उस विशेषता पर महत्वपूर्ण रूप से भिन्न हैं। हालाँकि, कुछ मामलों में, एनोवा मान्यताओं का थोड़ा उल्लंघन किया जाता है क्योंकि संस्करण समान नहीं हैं (एक लीवेन के परीक्षण के अनुसार, अल्फा = .05 का उपयोग करके)।

1) यदि नमूना आकार समान हैं, तो आपको अधिक समस्या नहीं है। यदि एन बराबर हैं तो एनोवा काफी अलग (भिन्न-) स्तर का है।

2) यह निर्धारित करने से पहले विचरण की समानता का परीक्षण करना कि क्या इसे कई अध्ययनों के खिलाफ सुझाया गया है। यदि आप किसी भी वास्तविक संदेह में हैं कि वे समान के करीब होंगे, तो यह मान लेना बेहतर है कि वे असमान हैं।

कुछ संदर्भ:

ज़िम्मरमैन, डीडब्ल्यू (2004),
"भिन्नताओं की समानता के प्रारंभिक परीक्षणों पर एक नोट।"
बीआर। जे। मठ। स्टेट। साइकोल। , मई ; 57 (Pt 1): 173-81।
http://www.ncbi.nlm.nih.gov/pubmed/15171807

हेनरिक यहां तीन संदर्भ देते हैं

3) यह प्रभाव का आकार है जो मायने रखता है, बजाय इसके कि आपका नमूना आपको बताने के लिए पर्याप्त है कि वे काफी अलग हैं। इसलिए बड़े नमूनों में, लेवेने के परीक्षण से विचरण में एक छोटा सा अंतर अत्यधिक महत्वपूर्ण दिखाई देगा, लेकिन इसके प्रभाव में अनिवार्य रूप से कोई परिणाम नहीं होगा। यदि नमूने बड़े हैं और प्रभाव का आकार - भिन्नताओं का अनुपात या भिन्नताओं में भिन्नता है - वे जो होना चाहिए, उसके काफी करीब हैं, तो पी-मूल्य का कोई परिणाम नहीं है। (दूसरी ओर, छोटे नमूनों में, एक अच्छा बड़ा पी-मूल्य थोड़ा आराम का है। किसी भी तरह से परीक्षण सही प्रश्न का उत्तर नहीं देता है।)

ध्यान दें कि एनोवा में अवशिष्ट मानक त्रुटि और डीएफ के अनुमान के लिए एक वेल्च-स्टरथाइट प्रकार का समायोजन है, जैसे कि दो-नमूना टी-परीक्षणों में है।

  1. एक गैर पैरामीट्रिक परीक्षण का उपयोग करें जैसे कि विलकॉक्सन (यदि ऐसा है, तो कौन सा?)।

यदि आप स्थान-परिवर्तन के विकल्पों में रुचि रखते हैं, तो आप अभी भी निरंतर प्रसार मान रहे हैं। यदि आप अधिक सामान्य विकल्पों में रुचि रखते हैं तो आप शायद इस पर विचार कर सकते हैं; एक विल्कोक्सॉन परीक्षण के बराबर k- नमूना एक क्रुस्काल-वालिस परीक्षण है।

एनोवा परिणाम के लिए किसी प्रकार का सुधार करें

वेल्च-सटरथवेट पर विचार करने के मेरे उपरोक्त सुझाव को देखें, यह एक 'सुधार' है।

(वैकल्पिक रूप से आप अपने एनोवा को जोड़ीदार वेल्च-प्रकार के टी-टेस्ट के एक सेट के रूप में डाल सकते हैं, जिस स्थिति में आप संभावित रूप से बोन्फ्रोनी या कुछ इसी तरह देखना चाहेंगे)

मैंने कुछ ऐसी चीजें भी पढ़ी हैं, जो बताती हैं कि विषमलैंगिकता वास्तव में एनोवा के लिए एक समस्या नहीं है, जब तक कि साधन और संस्करण परस्पर संबंधित नहीं हैं (यानी वे दोनों एक साथ बढ़ते हैं)

आपको ऐसा कुछ करना होगा। टी-परीक्षणों के साथ कई स्थितियों को देखने के बाद, मुझे नहीं लगता कि यह स्पष्ट रूप से सच है, इसलिए मैं यह देखना चाहूंगा कि वे ऐसा क्यों सोचते हैं; शायद स्थिति किसी तरह से प्रतिबंधित है। यह अच्छा होगा अगर यह मामला था, क्योंकि बहुत अक्सर सामान्यीकृत रैखिक मॉडल उस स्थिति में मदद कर सकते हैं।

अंत में, मुझे यह जोड़ना चाहिए कि मैं एक सहकर्मी की समीक्षा की गई पत्रिका में प्रकाशन के लिए यह विश्लेषण कर रहा हूं, इसलिए जो भी मैं निपटता हूं उसे समीक्षकों के साथ पास करना पड़ता है।

यह अनुमान लगाना बहुत कठिन है कि आपके समीक्षकों को क्या संतुष्ट कर सकता है। हममें से ज्यादातर लोग पेड़ों के साथ काम नहीं करते हैं।


12

वास्तव में सरल रैखिक मॉडल (जैसे, एक- या दो-तरफ़ा एनोवा-जैसे मॉडल) में विषमलैंगिकता को संभालना बहुत मुश्किल नहीं है

एनोवा की लूट

सबसे पहले, जैसा कि दूसरों ने नोट किया है, ANOVA समान रूप से भिन्नताओं की धारणा से विचलन के लिए आश्चर्यजनक रूप से मजबूत है, खासकर यदि आपके पास लगभग संतुलित डेटा (प्रत्येक समूह में टिप्पणियों की समान संख्या) है। बराबर प्रसरण पर प्रारंभिक परीक्षण, अन्य दूसरी ओर, कर रहे हैं नहीं है (हालांकि Levene के परीक्षण बहुत से बेहतर है एफ -Test आमतौर पर पाठ्य पुस्तकों में पढ़ाया जाता है)। जॉर्ज बॉक्स के रूप में इसे रखा:

भिन्नताओं पर प्रारंभिक परीक्षण करने के लिए बल्कि समुद्र में एक नाव खेने के लिए समुद्र में डालने जैसा है ताकि यह पता लगाया जा सके कि क्या बंदरगाह को छोड़ने के लिए समुद्र लाइनर के लिए स्थितियां पर्याप्त रूप से शांत हैं!

हालांकि एनोवा बहुत मजबूत है, क्योंकि विषमता को ध्यान में रखना बहुत आसान है, ऐसा न करने का बहुत कम कारण है।

गैर पैरामीट्रिक परीक्षण

यदि आप वास्तव में साधनों में अंतर में रुचि रखते हैं , तो गैर-पैरामीट्रिक परीक्षण (जैसे, क्रुस्कल-वालिस परीक्षण) वास्तव में किसी काम के नहीं हैं। वे समूहों के बीच अंतर का परीक्षण करते हैं, लेकिन वे सामान्य परीक्षण अंतरों में नहीं करते हैं

उदाहरण डेटा

आइए डेटा का एक सरल उदाहरण उत्पन्न करते हैं जहां कोई एनोवा का उपयोग करना चाहेगा, लेकिन जहां समान भिन्नताओं की धारणा सही नहीं है।

set.seed(1232)
pop = data.frame(group=c("A","B","C"),
                 mean=c(1,2,5),
                 sd=c(1,3,4))
d = do.call(rbind, rep(list(pop),13))
d$x = rnorm(nrow(d), d$mean, d$sd)

हमारे पास तीन समूह हैं, (स्पष्ट) दोनों साधनों और भिन्नताओं में अंतर:

stripchart(x ~ group, data=d)

उदाहरण डेटा दिखा रहा है।

एनोवा

आश्चर्य की बात नहीं, एक सामान्य एनोवा इसे अच्छी तरह से संभालती है:

> mod.aov = aov(x ~ group, data=d)
> summary(mod.aov)
            Df Sum Sq Mean Sq F value  Pr(>F)    
group        2  199.4   99.69   13.01 5.6e-05 ***
Residuals   36  275.9    7.66                    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

तो, कौन से समूह अलग-अलग हैं? चलिए, Tukey की HSD विधि का उपयोग करते हैं:

> TukeyHSD(mod.aov)
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = x ~ group, data = d)

$group
        diff        lwr      upr     p adj
B-A 1.736692 -0.9173128 4.390698 0.2589215
C-A 5.422838  2.7688327 8.076843 0.0000447
C-B 3.686146  1.0321403 6.340151 0.0046867

0.26 के P -value के साथ , हम समूह A और B. के बीच किसी भी अंतर (मतलब में) का दावा नहीं कर सकते हैं और यहां तक ​​कि अगर हम इस बात पर ध्यान नहीं देते हैं कि हमने तीन तुलनाएं की हैं, तो हमें कम P नहीं मिलेगा - मान ( P  = 0.12):

> summary.lm(mod.aov)
[…]
Coefficients:
            Estimate Std. Error t value  Pr(>|t|)    
(Intercept)   0.5098     0.7678   0.664     0.511    
groupB        1.7367     1.0858   1.599     0.118    
groupC        5.4228     1.0858   4.994 0.0000153 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.768 on 36 degrees of freedom

ऐसा क्यों है? साजिश के आधार पर, वहाँ है एक बहुत स्पष्ट अंतर। कारण यह है कि एनोवा प्रत्येक समूह में समान भिन्नताओं को मानता है, और 2.77 के सामान्य मानक विचलन का अनुमान लगाता है ( summary.lmतालिका में 'अवशिष्ट मानक त्रुटि' के रूप में दिखाया गया है , या आप इसे अवशिष्ट माध्य वर्ग (7.66) के वर्गमूल में ले कर प्राप्त कर सकते हैं) ANOVA तालिका में)।

लेकिन समूह ए की जनसंख्या (जनसंख्या) 1 का मानक विचलन है, और 2.77 का यह अतिरेक इसे (अनावश्यक रूप से) सांख्यिकीय रूप से महत्वपूर्ण परिणाम प्राप्त करने के लिए कठिन बनाता है, अर्थात, हमारे पास (बहुत) कम शक्ति के साथ एक परीक्षण है।

असमान भिन्नताओं के साथ 'एनोवा'

तो, एक उचित मॉडल को कैसे फिट किया जाए, एक जो संस्करण में अंतर को ध्यान में रखता है? यह R में आसान है:

> oneway.test(x ~ group, data=d, var.equal=FALSE)
    One-way analysis of means (not assuming equal variances)

data:  x and group
F = 12.7127, num df = 2.000, denom df = 19.055, p-value = 0.0003107

इसलिए, यदि आप R में एक समान वन-वे 'ANOVA' चलाना चाहते हैं, तो समान रूपांतरों के बिना, इस फ़ंक्शन का उपयोग करें। यह मूल रूप t.test()से असमान परिवर्तन के साथ दो नमूनों के लिए (वेल्च) का विस्तार है ।

दुर्भाग्य से, यह साथ काम नहीं करता TukeyHSD()(या अधिकांश अन्य कार्यों आप पर उपयोग aovवस्तुओं), हम कर रहे हैं तो भले ही यकीन है कि वहाँ रहे हैं समूह मतभेद, हम नहीं जानते कि जहां वे कर रहे हैं।

विषमलैंगिकता की मॉडलिंग करना

सबसे अच्छा समाधान स्पष्ट रूप से वेरिएंस को मॉडल करना है। और यह R में बहुत आसान है:

> library(nlme)
> mod.gls = gls(x ~ group, data=d,
                weights=varIdent(form= ~ 1 | group))
> anova(mod.gls)
Denom. DF: 36 
            numDF  F-value p-value
(Intercept)     1 16.57316  0.0002
group           2 13.15743  0.0001

अभी भी महत्वपूर्ण अंतर, निश्चित रूप से। लेकिन अब समूह ए और बी के बीच के अंतर भी  सांख्यिकीय रूप से महत्वपूर्ण हो गए हैं ( P = 0.025):

> summary(mod.gls)
Generalized least squares fit by REML
  Model: x ~ group
  […]
Variance function:
 Structure: Different standard
            deviations per stratum
 Formula: ~1 | group 
 Parameter estimates:
       A        B        C 
1.000000 2.444532 3.913382 

Coefficients:
               Value Std.Error  t-value p-value
(Intercept) 0.509768 0.2816667 1.809829  0.0787
groupB      1.736692 0.7439273 2.334492  0.0253
groupC      5.422838 1.1376880 4.766542  0.0000
[…]
Residual standard error: 1.015564 
Degrees of freedom: 39 total; 36 residual

तो एक उपयुक्त मॉडल का उपयोग करने से मदद मिलती है! यह भी ध्यान दें कि हमें (सापेक्ष) मानक विचलन का अनुमान मिलता है। समूह ए के लिए अनुमानित मानक विचलन, परिणाम, 1.02 के नीचे पाया जा सकता है। समूह बी का अनुमानित मानक विचलन यह 2.44 गुना या 2.48 गुना है, और समूह सी का अनुमानित मानक विचलन समान रूप से 3.97 है ( intervals(mod.gls)समूह बी और सी के सापेक्ष मानक विचलन के लिए आत्मविश्वास अंतराल प्राप्त करने का प्रकार )।

कई परीक्षण के लिए सही है

हालांकि, हमें वास्तव में कई परीक्षण के लिए सही होना चाहिए। Comp मल्टीकम्प ’पुस्तकालय का उपयोग करना आसान है। दुर्भाग्य से, इसमें 'gls' ऑब्जेक्ट के लिए अंतर्निहित समर्थन नहीं है, इसलिए हमें पहले कुछ सहायक कार्य जोड़ना होगा:

model.matrix.gls <- function(object, ...)
    model.matrix(terms(object), data = getData(object), ...)
model.frame.gls <- function(object, ...)
  model.frame(formula(object), data = getData(object), ...)
terms.gls <- function(object, ...)
  terms(model.frame(object),...)

अब चलो काम करने के लिए:

> library(multcomp)
> mod.gls.mc = glht(mod.gls, linfct = mcp(group = "Tukey"))
> summary(mod.gls.mc)
[…]
Linear Hypotheses:
           Estimate Std. Error z value Pr(>|z|)    
B - A == 0   1.7367     0.7439   2.334   0.0480 *  
C - A == 0   5.4228     1.1377   4.767   <0.001 ***
C - B == 0   3.6861     1.2996   2.836   0.0118 *  

अभी भी समूह ए और समूह बी के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है! Inter और हम समूह साधनों के बीच अंतर के लिए (एक साथ) विश्वास अंतराल भी प्राप्त कर सकते हैं:

> confint(mod.gls.mc)
[…]
Linear Hypotheses:
           Estimate lwr     upr    
B - A == 0 1.73669  0.01014 3.46324
C - A == 0 5.42284  2.78242 8.06325
C - B == 0 3.68615  0.66984 6.70245

लगभग (यहाँ बिल्कुल) सही मॉडल का उपयोग करके, हम इन परिणामों पर भरोसा कर सकते हैं!

ध्यान दें कि इस सरल उदाहरण के लिए, समूह C का डेटा वास्तव में समूह A और B के बीच के अंतर पर कोई जानकारी नहीं जोड़ता है, क्योंकि हम प्रत्येक समूह के लिए अलग-अलग साधन और मानक विचलन दोनों मॉडल करते हैं। हम कई तुलनाओं के लिए सही युग्मित t -ests का उपयोग कर सकते हैं :

> pairwise.t.test(d$x, d$group, pool.sd=FALSE)
    Pairwise comparisons using t tests with non-pooled SD 

data:  d$x and d$group 

  A       B      
B 0.03301 -      
C 0.00098 0.02032

P value adjustment method: holm 

हालांकि, अधिक जटिल मॉडल के लिए, उदाहरण के लिए, जीएलएस (सामान्यीकृत कम से कम वर्ग) का उपयोग करके और कई भविष्यवाणियों के साथ दो-तरफा मॉडल, या स्पष्ट रूप से विचरण कार्यों का मॉडलिंग करना सबसे अच्छा समाधान है।

और विचरण फ़ंक्शन को प्रत्येक समूह में बस एक अलग स्थिरांक नहीं होना चाहिए; हम इस पर संरचना थोप सकते हैं। उदाहरण के लिए, हम प्रत्येक समूह के माध्य की एक शक्ति के रूप में विचरण कर सकते हैं (और इस प्रकार केवल एक पैरामीटर, प्रतिपादक का अनुमान लगाने की आवश्यकता है ), या शायद मॉडल में एक भविष्यवक्ता के लघुगणक के रूप में। यह सब GLS (और gls()R में) के साथ बहुत आसान है ।

सामान्यीकृत कम से कम वर्ग IMHO एक बहुत ही अप्रयुक्त सांख्यिकीय मॉडलिंग तकनीक है। मॉडल मान्यताओं से विचलन के बारे में चिंता करने के बजाय, उन विचलन को मॉडल करें !


1
जवाब के लिए धन्यवाद! मैं परिणाम के बारे में oneway.test () और gls () असमान विचरण ANOVA (वेल्च एनोवा) के बारे में नहीं समझता। Oneway.test () का p मान p = मान = 0.0003107 है। लेकिन gls (x ~ समूह, डेटा = d, भार = varIdent (प्रपत्र = ~ 1 | समूह)) से p मान 0.0001 है। ये दोनों परिणाम अलग-अलग क्यों हैं?
WCMC

2
कई परीक्षणों के लिए सुधारों पर चिंता बढ़ रही है, मुझे लगता है कि आपके द्वारा किए गए तुलनाओं की संख्या के साथ-साथ गैर-सही पी-मूल्यों की रिपोर्टिंग करना अधिक पारदर्शी था। विशेष रूप से क्योंकि आप उन्हें आर में परीक्षण करते समय हर जोड़ीदार तुलना में दिलचस्पी नहीं ले सकते हैं, इसलिए सुधार उन खातों की तुलना को ध्यान में रखकर किया जाएगा जो कोई रुचि नहीं हैं।
नक्ष

7
  1. आपके डेटा का वास्तव में कुछ परिवर्तन हो सकता है जो एक सामान्य रूप से सामान्य वितरण का उत्पादन करता है। बेशक, अब आपका निष्कर्ष रूपांतरित डेटा के बारे में है, न कि परिवर्तित डेटा के बारे में।

  2. आप एक वनवे एनोवा के बारे में बात कर रहे हैं, यह मानते हुए कि क्रूसकल-वालिस परीक्षण , ओएनोवा एनोवा के लिए एक उपयुक्त गैर-समरूप एनालॉग है। डन का परीक्षण (गार्डन-वैरायटी रैंक सम टेस्ट नहीं) पोस्ट हॉक जोड़ी-वार मल्टीपल कंपेरिजन के लिए शायद सबसे सामान्य नॉनपैमेट्रिक टेस्ट है , हालांकि अन्य टेस्ट भी हैं जैसे कॉनओवर-इमान टेस्ट (रिजेक्शन के बाद डन के टेस्ट की तुलना में सख्ती से अधिक शक्तिशाली) द क्रुस्क्कल-वालिस), और ड्वेस-स्टील-क्राइक्लो-फ्लिग्नेर टेस्ट।

  3. α

एनोवा समूह के भीतर और समूह भिन्नताओं के बीच के अनुपात पर आधारित है। मुझे पूरी तरह से यकीन नहीं है कि आप इस संदर्भ में विषमलैंगिकता से क्या मतलब है, लेकिन अगर आप समूहों के बीच असमान परिवर्तन का मतलब है, जो मुझे मूल रूप से परीक्षण की अशक्त परिकल्पना के तर्क को तोड़ने के लिए प्रतीत होगा।

आपके अनुशासन से एक सामान्य शब्द के साथ "डन के परीक्षण" के लिए एक सरल Google विद्वान क्वेरी को बहुत सारे प्रकाशित उदाहरणों को वापस करना चाहिए।


संदर्भ

कोनोवर, डब्ल्यूजे और इमान, आरएल (1979)। कई तुलना प्रक्रियाओं पर । तकनीकी रिपोर्ट LA-7677-MS, लॉस अलामोस वैज्ञानिक प्रयोगशाला।

क्राइक्लो, डीई और फ्लिग्नर, एमए (1991)। विचरण के एकतरफा विश्लेषण में वितरण-मुक्त कई तुलनाओं परसांख्यिकी में संचार - सिद्धांत और तरीके , 20 (1): 127।

डन, OJ (1964)। रैंक रकम का उपयोग करते हुए कई तुलनाटेक्नोमेट्रिक्स , 6 (3): 241-252।


2
ठीक है, इस उत्तर के लिए धन्यवाद, लेकिन मैं पूरी तरह से स्पष्ट नहीं हूं कि आप क्या कह रहे हैं। जहाँ तक 'हेटेरोसिस्टैस्टिकिटी' के बारे में मुझे लगा कि मैं साधारण अर्थ में इस शब्द का उपयोग कर रहा था: "रैंडम वैरिएबल का एक संग्रह हेट्रोसेरेडैस्टिक होता है अगर वहाँ सब-पॉपुलेशन होती है जिसमें दूसरों से अलग-अलग वैरिएबल होते हैं। यहाँ" वैरिएबल "को वेरिएशन या मात्रा से निर्धारित किया जा सकता है। सांख्यिकीय फैलाव का कोई अन्य उपाय। "- विकिपीडिया। मेरे डेटा में उप-समूहों के परिवर्तन असमान हैं (लेवेने के परीक्षण के अनुसार) इसलिए मैंने उन्हें विषमलैंगिक के रूप में वर्णित किया। सही है न?
जस मैक्स

1
जो मैं वास्तव में चर्चा करने की कोशिश कर रहा हूं वह पाठ्यपुस्तक के आंकड़ों और वास्तविक दुनिया के बीच की खाई है। प्रत्येक पाठ्यपुस्तक कहती है "एनोवा के लिए संस्करण समान होना चाहिए" लेकिन निश्चित रूप से वे कभी नहीं होते हैं। तो, क्या हम एक विशेष बिंदु पर मनमाने ढंग से कटऑफ करते हैं और एक अलग परीक्षण पर स्विच करते हैं - यदि हां, तो किस बिंदु पर? मेरे क्षेत्र में (प्लांट बायोलॉजी) ज्यादातर लोग बिना किसी सोचे-समझे जो भी परीक्षण करने के लिए प्रशिक्षित हुए, उसका उपयोग करते हैं। मैं वास्तव में उससे संतुष्ट नहीं हूँ। मुझे उन किताबों / वेबसाइटों के लिए कोई सुझाव पसंद आएगा, जो आंकड़ों के 'व्यावहारिक' उपयोग पर चर्चा करती हैं - यानी कि कब, और क्यों प्रयोग करना है। डन के सुझाव के लिए धन्यवाद, जो मदद करता है।
जस मैक्स

2
आह, समान भिन्नताओं की धारणा जनसंख्या संस्करण है नमूना नमूने नहीं हैं । आप अनुमान लगा सकते हैं कि जनसंख्या संस्करण समान हैं ... नेत्र परीक्षण के माध्यम से, या कुछ अन्य लोगों द्वारा, सांख्यिकीय परीक्षण।
एलेक्सिस

1
यदि आप नमूना विचरण का मूल्यांकन करके जनसंख्या संस्करण के बारे में कुछ नहीं जानते हैं? मैं लेवेने के परीक्षण पी-वैल की व्याख्या करता हूं, "यह मानते हुए कि जनसंख्या भिन्नताएं समान हैं, आपके नमूना संस्करण क्या हैं यह बहुत भिन्न होगा।" अगर मुझे कम पी-वैल मिलता है तो मैं इस परिकल्पना को खारिज करता हूं कि जनसंख्या संस्करण समान हैं और एनोवा का उपयोग नहीं कर सकते। क्रुस्कल-वालेस एक अच्छे विकल्प की तरह लगता है, लेकिन क्या एनोवा की मान्यताओं को पूरा करने के लिए डेटा को बदलना बेहतर है और यदि ऐसा है तो क्यों?
जस मैक्स

1
इसके अलावा, लेवेने का परीक्षण, पी <.05 इस निर्णय के लिए उपयुक्त परीक्षण और कटऑफ है? ओ'ब्रायन के बारे में क्या है, बार्टलेट के ... इन परीक्षणों के परिणाम काफी भिन्न हो सकते हैं और मुझे वास्तव में पता नहीं है कि किसका उपयोग करना है - इसलिए मैं लेवेन के साथ जाता हूं क्योंकि यह सबसे रूढ़िवादी लगता है। लेकिन शायद यह ओवरकिल है - शायद एनोवा को छोड़ने के लिए बहुत जल्दी होने से, मैं एक ऐसे परीक्षण पर स्विच कर रहा हूं जो अनावश्यक रूप से मेरे विश्लेषण की सांख्यिकीय शक्ति को कम करता है।
जस मैक्स

1

यह मुझे लगता है जैसे कि आप फुटवर्क कर रहे हैं और अपनी पूरी कोशिश कर रहे हैं लेकिन चिंतित हैं कि आपके प्रयास समीक्षकों के सामने अपने पेपर को प्राप्त करने के लिए पर्याप्त नहीं होंगे। बहुत वास्तविक दुनिया की समस्या है। मुझे लगता है कि सभी शोधकर्ता विश्लेषण के साथ संघर्ष करते हैं जो समय-समय पर सीमा रेखा या यहां तक ​​कि खुलकर सामने आने वाली मान्यताओं के रूप में दिखाई देते हैं। सब के बाद लाखों लेखों का मूल्यांकन कर रहे हैं जैसे प्रत्येक समूह में 6 - 7 चूहों जैसे कुछ के साथ चूहों के 3 छोटे समूहों में उपचार प्रभाव। कैसे पता करें कि अनोवा मान्यताओं को इस तरह के एक पेपर में संतुष्ट किया जाता है!

मैंने विशेष रूप से कार्डियोवस्कुलर पैथोफिज़ियोलॉजी के क्षेत्र में बड़ी संख्या में पत्रों की समीक्षा की है और वास्तव में कभी भी 100% यह महसूस नहीं करता है कि मैं उस लेख पर डेटा पर भरोसा कर सकता हूं या नहीं जो मैं पढ़ता हूं। लेकिन मेरे लिए एक समीक्षक के रूप में, मैं वास्तव में लगता है कि मुद्दों पर पैदा कर सकते करते हैं तो सब के बाद, पूरे डाटासेट गढ़े जा सकता है और मैं कभी नहीं होगा - विज्ञान के क्षेत्र में कई स्तरों आंकड़ों में गहरी भी खुदाई में शायद थोड़ा मतलब नहीं है कि एक लाख साल में बताने में सक्षम हो। तदनुसार, इस कार्यक्षेत्र में हमेशा विश्वास का एक तत्व होगा, जिसका शोधकर्ताओं को कभी दुरुपयोग नहीं करना चाहिए।

सबसे वास्तविक दुनिया का सुझाव मैं यह दूंगा कि आपको सबमिट करने से पहले बहुत सावधानी से सब कुछ सोचने की जरूरत है और सुनिश्चित करें कि आप समीक्षकों द्वारा पूछे गए किसी भी प्रश्न का सच्चाई से उत्तर दे पाएंगे। जब तक आप अपना सर्वश्रेष्ठ प्रदर्शन करते हैं, तब तक आपके इरादे ईमानदार होते हैं और आप रात को अच्छी नींद लेते हैं। मुझे लगता है कि आपको ठीक होना चाहिए।


2
मुझे यकीन नहीं है कि मैं इस बात पर सहमत हूं कि मैं मनगढ़ंत बातें नहीं कर सकता: मैंने पहले भी ऐसा देखा है।
एलेक्सिस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.