योजक त्रुटि या गुणक त्रुटि?


13

मैं आँकड़ों के लिए अपेक्षाकृत नया हूँ और इसे बेहतर समझने में मदद करूँगा।

मेरे क्षेत्र में फॉर्म का आमतौर पर उपयोग किया जाने वाला मॉडल है:

Pt=Po(Vt)α

जब लोग मॉडल को डेटा के लिए फिट करते हैं तो वे आमतौर पर इसे रैखिक करते हैं और निम्नलिखित को फिट करते हैं

log(Pt)=log(Po)+αlog(Vt)+ϵ

यह ठीक है? मैंने कहीं पढ़ा कि सिग्नल में शोर के कारण वास्तविक मॉडल होना चाहिए

Pt=Po(Vt)α+ϵ

और यह ऊपर के रूप में रैखिक नहीं किया जा सकता है। क्या ये सच है? यदि हां, तो क्या किसी को एक संदर्भ का पता है जिसे मैं इसके बारे में अधिक पढ़ और सीख सकता हूं और शायद एक रिपोर्ट में उद्धृत कर सकता हूं।


मैंने आपके समीकरणों को प्रारूपित किया। कृपया जांचें कि क्या सामग्री अभी भी वही है जो आप चाहते थे (विशेष रूप से सदस्यता के बारे में)।
एंडी

आपने अपने प्रश्न को "माप त्रुटि" के साथ चिह्नित किया है और 3 डी समीकरण में + ई को प्रतिक्रियाशील माप त्रुटि के कारण प्रतीत होगा, प्रतिक्रिया में गुणात्मक स्टोचस्टिक / यादृच्छिक भिन्नता के अलावा, पी * (वी ^ अल्फा) * जैसा कुछ exp (ई)। क्या ये सही है? माप त्रुटि मॉडल (उर्फ "चर में त्रुटि" मॉडल) को अक्सर एक प्रकार की दो-चरण प्रक्रिया की आवश्यकता होती है, जो आपके मामले में "शोर" के कारण योगात्मक त्रुटि को चिह्नित करने के लिए अलग-अलग सत्यापन डेटा की आवश्यकता हो सकती है, जिस स्थिति में एक नहीं हो सकता है! समीकरण को रेखीय करने की आवश्यकता है।
एन ब्रूवर

जवाबों:


14

कौन सा मॉडल उपयुक्त है यह इस बात पर निर्भर करता है कि माध्य के आस-पास भिन्नता कैसे टिप्पणियों में आती है। यह अच्छी तरह से गुणात्मक या additively ... या किसी अन्य तरीके से आ सकता है।

यहां तक ​​कि इस भिन्नता के कई स्रोत हो सकते हैं, कुछ जो गुणात्मक रूप से प्रवेश कर सकते हैं और कुछ जो जोड़कर और कुछ तरीकों से प्रवेश करते हैं जो वास्तव में या तो विशेषता नहीं हो सकते हैं।

कभी-कभी यह स्थापित करने के लिए स्पष्ट सिद्धांत है जो उपयुक्त है। कभी-कभी माध्य के बारे में भिन्नता के मुख्य स्रोतों को इंगित करना एक उपयुक्त विकल्प प्रकट करेगा। बार-बार लोगों को यह स्पष्ट रूप से पता नहीं होता है कि किस प्रक्रिया का पर्याप्त रूप से वर्णन करने के लिए विभिन्न प्रकारों की भिन्नता के कई स्रोतों का उपयोग करना आवश्यक है।

लॉग-लीनियर मॉडल के साथ, जहां रैखिक प्रतिगमन का उपयोग किया जाता है:

log(Pt)=log(Po)+αlog(Vt)+ϵ

ओएलएस प्रतिगमन मॉडल निरंतर लॉग-स्केल विचरण को मानता है, और यदि ऐसा है, तो मूल डेटा के माध्यम से माध्य में वृद्धि के बारे में बढ़ते प्रसार को दिखाएगा।

दूसरी ओर, इस प्रकार का मॉडल:

Pt=Po(Vt)α+ϵ

आम तौर पर नॉनलाइनियर कम से कम वर्गों द्वारा फिट किया जाता है, और फिर से, यदि निरंतर विचरण (एनएलएस के लिए डिफ़ॉल्ट) फिट किया जाता है, तो माध्य के बारे में प्रसार स्थिर होना चाहिए।

यहाँ छवि विवरण दर्ज करें

[आपको यह आभास हो सकता है कि अंतिम छवि में बढ़ते हुए अर्थ के साथ प्रसार कम हो रहा है; यह वास्तव में बढ़ती ढलान की वजह से एक भ्रम है - हम लंबवत के बजाय वक्र को फैलाने वाले ऑर्थोगोनल का न्याय करते हैं ताकि हमें एक विकृत प्रभाव मिले। '

यदि आपके पास लगभग मूल या लॉग स्केल पर लगातार फैला हुआ है, तो यह सुझाव दे सकता है कि दोनों में से कौन सा मॉडल फिट होने के लिए है, इसलिए नहीं कि यह साबित होता है कि यह योगात्मक या गुणक है, लेकिन क्योंकि यह प्रसार के एक उपयुक्त विवरण की ओर जाता है। मतलब है।

बेशक एक additive त्रुटि की संभावना हो सकती है जिसमें गैर-निरंतर विचरण था।

हालांकि, ऐसे अन्य मॉडल अभी भी हैं जहां ऐसे कार्यात्मक संबंधों को फिट किया जा सकता है जिनके बीच माध्य और विचरण के बीच अलग-अलग संबंध हैं (जैसे कि एक पॉइज़न या अर्ध-पॉइसन जीएलएम, जो अर्थ के वर्गमूल के आनुपातिक रूप से फैल गया है)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.