दो रैखिक प्रतिगमन मॉडल की तुलना करना


12

मैं दो रैखिक प्रतिगमन मॉडल की तुलना करना चाहता हूं जो दो अलग-अलग परिस्थितियों में समय के साथ एक mRNA की गिरावट दर का प्रतिनिधित्व करते हैं। प्रत्येक मॉडल का डेटा स्वतंत्र रूप से एकत्र किया गया।

यहाँ डेटासेट है।

समय (घंटे) लॉग (उपचार ए) लॉग (उपचार बी)
0 2.02 1.97
0 2.04 2.06
0 1.93 1.96
२ २.०२ १.९ १
2 2.00 1.95
२ २.० 2 १. 2.0२
4 1.96 1.97
4 2.02 1.99
4 2.02 1.99
6 1.94 1.90
6 1.94 1.97
6 1.86 1.88
8 1.93 1.97
8 2.12 1.99
8 2.06 1.93
12 1.71 1.70
12 1.96 1.73
१२ १.76१ १. 1.६
24 1.70 1.46
24 1.83 1.41
24 1.62 1.42

ये मेरे मॉडल हैं:

Exp1.A.lm<-lm(Exp1$Time~Exp1$(Treatment A))
Exp1.B.lm<-lm(Exp1$Time~Exp1$(Treatment B))
कॉल करें:
lm (सूत्र = Exp1 $ समय ~ Exp1 $ (उपचार A))

बच गया:
    मिन 1 क्यू मेडियन 3 क्यू मैक्स 
-6.8950 -1.2322 0.2862 1.2494 5.2494 

गुणांकों:
                   अनुमानित एसटीडी। त्रुटि t मान Pr (> | t |)    
(इंटरसेप्ट) 74.68 6.27 11.91 2.94e-10 ***
Exp1 $ (उपचार A) -36.14 3.38 -10.69 1.77e-09 ***
---
Signif। कोड: 0 '***' 0.001 '**' 0.01 '*' 0.05 '।' ०.१ ’’ १

अवशिष्ट मानक त्रुटि: स्वतंत्रता के 19 डिग्री पर 2.97
एकाधिक आर-वर्ग: 0.8575, समायोजित आर-वर्ग: 0.85 
एफ-स्टेटिस्टिक: 1 और 19 डीएफ पर 114.3, पी-मूल्य: 1.772e-09

कॉल करें:
lm (सूत्र = Exp1 $ समय ~ Exp1 $ (उपचार B))

बच गया:
   मिन 1 क्यू मेडियन 3 क्यू मैक्स 
-7.861 -3.278 -1.444 3.222 11.972 

गुणांकों:
                      अनुमानित एसटीडी। त्रुटि t मान Pr (> | t |)    
(इंटरसेप्ट) 88.281 16.114 5.478 2.76e-05 ***
Exp1 $ (उपचार B) -41.668 8.343 -4.994 8.05e-05 ***
---
Signif। कोड: 0 '***' 0.001 '**' 0.01 '*' 0.05 '।' ०.१ ’’ १

अवशिष्ट मानक त्रुटि: स्वतंत्रता के 19 डिग्री पर 5.173
एकाधिक आर-वर्ग: 0.5676, समायोजित आर-वर्ग: 0.5449 
एफ-स्टेटिस्टिक: 1 और 19 डीएफ पर 24.94, पी-मूल्य: 8.052e-05

इन दो मॉडलों की तुलना करने के लिए, मैंने इस कोड का उपयोग किया।

anova(Exp1.A.lm,Exp1.B.lm)
वियरेन्स टेबल का विश्लेषण

मॉडल 1: Exp1 $ समय ~ Exp1 $ Exp1 $ (उपचार A)
मॉडल 2: Exp1 $ समय ~ Exp1 $ Exp1 $ (उपचार B)
  Sf F Pr (> F) के RSS.Df Sum
1 19 167.60                      
2 19 508.48 0 -340.88

मेरा प्रश्न यह है कि एनोवा विश्लेषण एक एफ आँकड़े और एक p.val क्यों नहीं दिखाता है। अगर यह एक भोला सवाल है तो मेरी माफी।

विभिन्न ढलानों के आधार पर, इन दो मॉडलों में गिरावट की दर अलग-अलग है, लेकिन मैं यह जानना चाहूंगा कि यह अंतर कितना महत्वपूर्ण है। मुझे उम्मीद है कि यह समझ में आता है।


2
आप देख सकते हैं कि एनोवा तालिका विश्लेषण से जुड़ी स्वतंत्रता की डिग्री को 0 के रूप में सूचीबद्ध करती है ; आपके पास दोनों मॉडलों में समान संख्या में चर हैं, यही कारण है कि कोई भी एफ या पी-मूल्यों की गणना नहीं की जा सकती है।
गूँग - मोनिका

5
मैं इन मॉडलों की तुलना करने की जहमत तब तक नहीं उठाऊँगा जब तक कि उनकी अच्छाई की जाँच नहीं हो जाती। मुझे लगता है कि आप दूसरे में पाएंगे कि न तो प्रतिक्रिया और न ही इसका लघुगणक समय के रैखिक कार्य हैं। यह कॉल (गंभीरता से) ढलान के अनुमानों की किसी भी तुलना में सवाल करता है।
whuber

जवाबों:


11

यदि आप ए और बी के साथ एक लंबे कॉलम में डेटा को एक नए कॉलम के रूप में सेट करते हैं, तो आप निरंतर समय चर और एक मामूली "प्रयोग" चर (ए, बी) के साथ अपने प्रतिगमन मॉडल को जीएलएम के रूप में चला सकते हैं। एनोवा का आउटपुट आपको मापदंडों के बीच अंतर का महत्व देगा। "इंटरसेप्ट 'आम अवरोधन है और" प्रयोग "कारक प्रयोगों के बीच अंतर (वास्तव में समग्र साधन) के बीच अंतर को दर्शाएगा।" टाइम "कारक सामान्य ढलान होगा, और बातचीत सम्मान के साथ प्रयोगों के बीच अंतर है। ढलान के लिए।

मुझे स्वीकार करना होगा कि मैं धोखा देता हूं (?) मापदंडों के दो सेट और उनकी त्रुटियों को प्राप्त करने के लिए पहले मॉडल को अलग से चलाता हूं और फिर उपचार (आपके मामले ए और बी में) के बीच अंतर प्राप्त करने के लिए संयुक्त मॉडल चलाता हूं ...


3
यह एक चतुर दृष्टिकोण है। जब आप "धोखा" देते हैं, तो क्या आप जांचते हैं कि प्रत्येक मॉडल में त्रुटि संस्करण लगभग समान हैं? और यदि वे पर्याप्त रूप से भिन्न दिखाई देते हैं, तो यह आपकी सिफारिशों को कैसे प्रभावित करता है?
whuber

Th GLM एक अच्छा दृष्टिकोण है, और डेटा की खोज के लिए, अलग-अलग मॉडल फिटिंग करना प्रयोगों के बीच त्रुटि विचरण को आंकने का एक अच्छा तरीका है। यदि कोई वास्तव में चिंतित था, तो वे सभी प्रयोगात्मक डेटा के लिए एक सामान्य त्रुटि विचरण की अंतर्निहित धारणा के बजाय समूह विशिष्ट त्रुटि संस्करण को शामिल करने के लिए GLM मॉडल का विस्तार कर सकते हैं।
prince_of_pears

एक और बात जो दिमाग में आती है, वह यह है कि क्या ओपी ट्रेडिंग में दिलचस्पी रखते हैं या नहीं, प्रयोगों के बीच गिरावट दर एक दूसरे से बिल्कुल अलग है (निरपेक्ष दर की अनदेखी), या क्या ये दरें भी सांख्यिकीय (या व्यावहारिक रूप से) शून्य से अलग हैं। परिकल्पना के परीक्षण के लिए पहली मात्रा है कि उपचार और समय के बीच बातचीत गुणांक शून्य के बराबर है। दूसरा या तो दो अलग-अलग परीक्षण (या एक संयुक्त परिकल्पना परीक्षण) करने के लिए है कि प्रत्येक दर शून्य से अलग है। मैं पहले से पहले दूसरे का परीक्षण करने में अधिक दिलचस्पी ले सकता हूं।
prince_of_pears

5

एनोवा विश्लेषण एक एफ आँकड़े और एक p.value नहीं दिखाता है क्योंकि दोनों मॉडलों में स्वतंत्रता की एक ही अवशिष्ट डिग्री (यानी 19) है और यदि आप अंतर लेते हैं तो यह शून्य होगा! एफ-टेस्ट करने के लिए आपको अंतर लेने के बाद कम से कम एक डिग्री की स्वतंत्रता होनी चाहिए।


मुझे यकीन नहीं है कि अगर मैं आपका जवाब समझता हूं। क्या कोई कारण है कि स्वतंत्रता के अवशिष्ट अंश बराबर हैं? ढलानों की तुलना करने के लिए एक वैकल्पिक दृष्टिकोण पर कोई सुझाव?
रोज

n=21(टीआरटीnटी)आरएक्सपी1टी=n-1=20टी=आरआरआर+आरजीआररोंरोंआररोंआरआरआर=19

एफ-टेस्ट के अलावा उनकी तुलना करने के कई तरीके हैं। सबसे आसान है कि आपके पास समर में मल्टीपल आर-स्क्वेर और एडजस्टेड आर-स्क्वेर का उपयोग करना है। उच्च आर-स्क्वेर या एडजस्टेड आर-स्क्वेर के साथ मॉडल बेहतर है। यहाँ बेहतर मॉडल Exp1 $ (उपचार ए) के साथ एक प्रतीत होता है। लेकिन याद रखें, आपको फिट किए गए मॉडल की पर्याप्तता की जांच करने के लिए अपने मॉडल के अवशेषों की जांच करनी चाहिए। मैं व्यक्तिगत रूप से केवल R- चुकता मानदंडों पर भरोसा करने की अनुशंसा नहीं करता हूं और आपको रैखिक मॉडल में भी अन्य मान्यताओं की जांच करनी चाहिए। विशेष रूप से देखें कि अवशेष अवशिष्ट हैं या नहीं।
स्टैट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.