रैखिक मॉडल के रूप में सामान्य सांख्यिकीय परीक्षण


22

(अद्यतन: मैंने इसमें गहराई से डुबकी लगाई और परिणामों को यहां पोस्ट किया )

नामित सांख्यिकीय परीक्षणों की सूची बहुत बड़ी है। आम परीक्षणों में से कई सरल रैखिक मॉडल से अनुमान पर भरोसा करते हैं, उदाहरण के लिए एक-नमूना टी-परीक्षण सिर्फ y = ε + against है जिसे null मॉडल y = μ + ε के खिलाफ परीक्षण किया गया है अर्थात is = μ जहां μ कुछ सुस्त है मूल्य - आम तौर पर μ = 0।

मुझे लगता है कि यह रट्टा सीखने वाले मॉडल की तुलना में शिक्षण उद्देश्यों के लिए काफी अधिक शिक्षाप्रद है, जब उनका उपयोग करना है, और उनकी मान्यताओं जैसे कि उनका एक दूसरे से कोई लेना-देना नहीं है। यह दृष्टिकोण समझ को बढ़ावा नहीं देता है। हालाँकि, मुझे यह इकट्ठा करने वाला एक अच्छा संसाधन नहीं मिल रहा है। मैं अंतर्निहित मॉडल के बीच समीकरणों में अधिक दिलचस्पी रखता हूं, न कि उनसे निष्कर्ष निकालने की विधि के बारे में । यद्यपि, जहां तक ​​मैं देख सकता हूं, इन सभी रैखिक मॉडल पर संभावना अनुपात परीक्षण "शास्त्रीय" निष्कर्ष के समान परिणाम देते हैं।

यहाँ मैं अब तक के बारे में सीखे गए समतुल्य हैं, त्रुटि शब्द अनदेखा करते हुए और यह मानते हुए कि सभी अशक्त परिकल्पनाएं एक प्रभाव की अनुपस्थिति हैं:εN(0,σ2)

एक-नमूना टी-परीक्षण:y=β0H0:β0=0

जोड़ी-नमूना टी-परीक्षण: y2y1=β0H0:β0=0

यह जोड़ी के अंतर पर एक-नमूना टी-परीक्षण के समान है।

दो-नमूना टी-परीक्षण: y=β1xi+β0H0:β1=0

जहां x एक संकेतक (0 या 1) है।

पीयरसन सहसंबंध: y=β1x+β0H0:β1=0

एक द्वि-नमूना टी-परीक्षण की समानता पर ध्यान दें जो एक बाइनरी एक्स-अक्ष पर सिर्फ प्रतिगमन है।

स्पीयरमैन सहसंबंध: rank(y)=β1rank(x)+β0H0:β1=0

यह रैंक-रूपांतरित एक्स और वाई पर पियरसन सहसंबंध के समान है।

एक तरफ़ा ANOVA: y=β1x1+β2x2+β3x3+...H0:β1,β2,β3,...=β

जहाँ संबंधित चयन करने वाले संकेतक हैं (एक 1 है, अन्य 0 हैं)। मॉडल को संभवतः रूप में मैट्रिक्स रूप में लिखा जा सकता है ।xiβxY=βX

दो तरफ़ा एनोवा: y=β1X1+β2X2+β3X1X2H0:β3=0

दो दो स्तरीय कारकों के लिए। यहाँ वैक्टर हैं जहाँ एक को संकेतक वेक्टर द्वारा चुना जाता है । यहाँ दिखाया गया है बातचीत प्रभाव है।βiXiH0

क्या हम रैखिक मॉडल की इस सूची में अधिक "नामित परीक्षण" जोड़ सकते हैं? जैसे, बहुभिन्नरूपी प्रतिगमन, अन्य "गैर पैरामीट्रिक" परीक्षण, द्विपद परीक्षण, या आरएम-एनोवा?

अद्यतन: प्रश्न पूछे गए हैं और SOA पर रैखिक मॉडल के रूप में एनोवा और टी-टेस्ट के बारे में उत्तर दिए गए हैं। इस प्रश्न को देखें और संबंधित प्रश्नों को टैग करें


1
मुझे लगता है कि ये तुलनाएँ उचित हैं लेकिन कुछ बिंदुओं पर सूक्ष्म अंतर भी हैं। जैसे एक-तरफ़ा एनोवा: जहाँ एक रेखीय प्रतिगमन आपको गुणांक प्रदान करेगा और अधिकांश सॉफ्टवेयर संकुल में वाल्ड टेस्ट के साथ गुणांक प्रति महत्व (जो उचित नहीं हो सकता है), एक एनोवा एक एकल पी-मूल्य प्रदान करेगा जो यह दर्शाता है कि क्या गुणांक में से एक शून्य से काफी अलग है। एक अशक्त मॉडल और ब्याज के प्रतिगमन मॉडल के बीच एक संभावना अनुपात परीक्षण अधिक तुलनीय हो सकता है। जैसे, मैं इन परीक्षणों / मॉडलों की पूरी तरह से बराबरी नहीं करूंगा।
IWS

अच्छी बात; मैंने प्रश्न को अपडेट किया, यह कहते हुए कि "मैं उनसे प्रतिवाद की विधि के बजाय अंतर्निहित मॉडल के बीच समानता में अधिक रुचि रखता हूं।" एकतरफा ANOVAs और इंटरैक्शन की शर्तों पर संभावना-अनुपात परीक्षण समान p-मानों को "शास्त्रीय" विश्लेषण करता है, जहां तक ​​मेरा परीक्षण जाता है।
जोनास लिंडेलोव

1
उचित रूप से पर्याप्त है, लेकिन एक तरफ ध्यान दें, कि गैर-रैखिकता से निपटने पर प्रतिगमन मॉडल भी अतिरिक्त लचीलापन प्रदान करते हैं (हालांकि इन 'नामित परीक्षणों' के साथ परिवर्तनों का परीक्षण भी किया जा सकता है, विभाजन एक अलग मामला है) या विषमलैंगिकता को संभालना, परिवार का उल्लेख नहीं करना सामान्यीकृत मॉडल जो गैर-निरंतर निर्भर चर भी संभालते हैं। बहरहाल, मैं नामांकित परीक्षणों को समझा सकता हूं क्योंकि शिक्षण उद्देश्यों के लिए प्रतिगमन मॉडल की प्रतिबंधात्मक विविधताएं योग्यता हो सकती हैं, इसलिए +1
IWS

1
क्या स्पीयरमैन रैंक सहसंबंध वास्तव में एक रैखिक मॉडल है?
मार्टिन डिट्ज़

1
@MartinDietz: हाँ, रैंक-बदलने के बाद x और y, यह रैखिक है। आर कोड:x = rnorm(100); y = rnorm(100); summary(lm(rank(x) ~ rank(y))); cor.test(x, y, method='spearman')
जोनास लिंडेलोव

जवाबों:


6

एक विस्तृत सूची नहीं है लेकिन यदि आप सामान्यीकृत रैखिक मॉडल शामिल करते हैं , तो इस समस्या का दायरा काफी हद तक बड़ा हो जाता है।

उदाहरण के लिए:

प्रवृत्ति के कोचरन-आर्मिटेज परीक्षण : द्वारा तैयार किया जा सकता

E[logit(p)|t]=β0+β1tH0:β1=0

आकस्मिकता तालिका के लिए स्वतंत्रताp×k का पियर्सन ची-स्क्वायर परीक्षण सेल आवृत्तियों के लिए एक लॉग-रैखिक मॉडल है:

[लॉग(μ)]=β0+βमैं+βj+γमैंjमैं,j>1एच0:γमैंj=0,मैं,j>1

इसके अलावा असमान रूपांतरों के लिए टी-टेस्ट को ह्यूबर व्हाइट मजबूत त्रुटि अनुमान का उपयोग करके अच्छी तरह से अनुमानित किया गया है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.