एक रेखीय प्रतिगमन के लिए अंकों की न्यूनतम संख्या


16

एक रेखीय प्रतिगमन के साथ समय के साथ एक प्रवृत्ति को देखने के लिए "उचित" न्यूनतम संख्या क्या होगी? क्या एक द्विघात मॉडल फिटिंग के बारे में?

मैं स्वास्थ्य (एसआईआई, आरआईआई) में असमानता के समग्र सूचकांकों के साथ काम करता हूं, और सर्वेक्षण की केवल 4 तरंगें हैं, इसलिए 4 अंक (1997,2001,2004,2008)।

मैं सांख्यिकीविद् नहीं हूं, लेकिन मेरे पास सहज प्रभाव है 4 अंक पर्याप्त नहीं हैं। क्या आपके पास एक उत्तर है, और / या संदर्भ हैं?

बहुत बहुत धन्यवाद,

Françoise


4
प्रत्येक स्वतंत्र चर के लिए अंगूठे का सामान्य नियम 10 अंक है।
पीटर फ़्लॉम -

1
आपके सूचकांक को कैसे मापा जाता है? यदि वे परिवर्तनशीलता के अनुमान शामिल करते हैं, तो दो पर्याप्त हो सकते हैं (एक टी-परीक्षण या इसके एनालॉग का उपयोग करके)। यहां लागू होने वाला मूल सांख्यिकीय सिद्धांत यह है कि जब यादृच्छिक भिन्नता आप क्या देख रहे हैं, इसकी असंभावनापूर्ण व्याख्या है, तो आपको गैर-यादृच्छिक कारणों के लिए किसी भी स्पष्ट प्रवृत्ति को विशेषता देने का अधिकार है। जब प्रवृत्ति मजबूत होती है, तो इस तरह के निष्कर्ष पर आने के लिए बहुत कम डेटा मूल्यों की आवश्यकता हो सकती है, सभी सामान्य "अंगूठे के नियम" के बावजूद।
whuber

जवाबों:


12

10 कोवेरेट के अंगूठे का पीटर्स नियम एक उचित नियम है। प्रतिक्रिया मूल्यों में शोर की मात्रा की परवाह किए बिना एक सीधी रेखा को किसी भी दो बिंदुओं के साथ पूरी तरह से फिट किया जा सकता है और एक द्विघात सिर्फ 3 बिंदुओं के साथ पूरी तरह से फिट हो सकता है। तो लगभग किसी भी परिस्थिति में स्पष्ट रूप से यह कहना उचित होगा कि 4 अंक अपर्याप्त हैं। हालांकि, अंगूठे के अधिकांश नियमों की तरह यह हर स्थिति को कवर नहीं करता है। मामले जहां मॉडल में शोर शब्द का एक बड़ा विचरण होता है, एक समान मामले की तुलना में अधिक नमूनों की आवश्यकता होगी जहां त्रुटि विचरण छोटा है।

नमूना बिंदुओं की आवश्यक संख्या वस्तुओं पर निर्भर करती है। यदि आप खोजपूर्ण विश्लेषण कर रहे हैं, तो यह देखने के लिए कि क्या एक मॉडल (एक कोवरिएट में रैखिक) एक दूसरे की तुलना में बेहतर दिखता है (कहते हैं कि कोवरिएट का एक द्विघात कार्य) 10 से कम अंक पर्याप्त हो सकता है। लेकिन अगर आप सहसंबंधों के लिए सहसंबंध और प्रतिगमन गुणांक के बहुत सटीक अनुमान चाहते हैं, तो आपको प्रति सेवारत 10 से अधिक की आवश्यकता हो सकती है। भविष्यवाणी मानदंड की सटीकता सटीक पैरामीटर अनुमानों की तुलना में और भी अधिक नमूनों की आवश्यकता हो सकती है। ध्यान दें कि अनुमानों की भविष्यवाणी और भविष्यवाणी सभी में मॉडल त्रुटि अवधि के परिवर्तन शामिल हैं।


अच्छे अंक, माइकल; मैं इसे सरल बनाए रखने की कोशिश कर रहा था। :-)। मूल प्रश्न के विषय को देखते हुए, मुझे बहुत आश्चर्य होगा अगर 10 से कम अंक पर्याप्त थे। स्वास्थ्य में असमानता के उपायों में बहुत अधिक त्रुटि होने की संभावना है, और समय के साथ संबंध अत्यधिक रैखिक होने की संभावना नहीं है। क्या आपको इस पर कोई लेख पता है? यह एक दिलचस्प विषय है जो बहुत कुछ सामने आता है।
पीटर फ्लॉम -

@PeterFlom I न। मैं अंगूठे के सांख्यिकीय नियमों पर वैन बेले की पुस्तक को देखूंगा कि क्या वह आपके द्वारा उल्लिखित नियम का उपयोग करता है। उनकी किताब के बारे में अच्छी बात यह है कि वह हर नियम के पीछे तर्क बताती है। मैं आपसे सहमत हूं कि एक नियम यह कहता है कि कम से कम 10 प्रति कोवरिएट लेना बहुत अच्छा है और कम उपयोग करना कुछ खोजपूर्ण मामलों को छोड़कर शायद ही सुरक्षित होगा। स्वास्थ्य विज्ञान में, जहां मैं काम करता हूं, शोर शब्द हमेशा बड़ा लगता है, लेकिन शायद कुछ कसकर नियंत्रित भौतिकी या इंजीनियरिंग प्रयोगों में बहुत सटीक माप हो सकते हैं और इसलिए छोटे यादृच्छिक त्रुटि हो सकती है।
माइकल आर। चेरिक

मैं सिर्फ छोटे शोर की संभावना को इंगित करने की कोशिश कर रहा था जिससे 10 से कम अंक की आवश्यकता हो, भले ही संभावना दूरस्थ हो।
माइकल आर। चेरिक

आर2

+1, अच्छी जानकारी, लेकिन यह भी ध्यान देने योग्य है कि यदि आपका अनुमानक निष्पक्ष है, तो आपके पास एक संतृप्त मॉडल हो सकता है और अभी भी मापदंडों का एक अनुमान हो सकता है, अगर यह आपको चाहिए। आपके पास परिवर्तनशीलता का अनुमान नहीं होगा या आपत्ति नहीं कर सकते। हालांकि, कुछ मामलों में जहां अनुमान लगाने के लिए कई प्रभाव हैं और डेटा प्राप्त करने के लिए पर्याप्त रूप से कठिन हैं, संतृप्त मॉडल कभी-कभी उपयोग किए जाते हैं। इसलिए, इस मामले में, आप फ़ंक्शन w / द्विघात w / 3 अंक का अनुमान प्राप्त कर सकते हैं। मैं जरूरी नहीं कि इसका मतलब यह है कि यह एक अच्छी बात है, लेकिन यह वास्तविक निचली सीमा है और यही कारण है।
गंग -
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.