"बेहतर" आपके मॉडल का एक कार्य है।
आपके भ्रम का कारण आप केवल अपने मॉडल का आधा हिस्सा ही लिख सकते हैं।
जब आप कहते हैं , तो यह वास्तव में सच नहीं है। आपके देखे गए मान बराबर नहीं हैं ; उनके पास एक त्रुटि घटक है।y=axbyaxb
उदाहरण के लिए, आपके द्वारा उल्लिखित दो मॉडल (किसी भी तरह से केवल संभव मॉडल नहीं) त्रुटि के बारे में पूरी तरह से अलग धारणा बनाते हैं।
आप शायद करीब कुछ मतलब है ।E(Y|X=x)=axb
लेकिन तब हम किसी दिए गए पर उस अपेक्षा से दूर की भिन्नता के बारे में क्या कहते हैं ? यह मायने रखता है!Yx
जब आप अरेखीय कम से कम वर्गों के मॉडल को फिट करते हैं, तो आप कह रहे हैं कि त्रुटियां योगात्मक हैं और त्रुटियों का मानक विचलन डेटा में निरंतर है:
yi∼N(axbi,σ2)
या समकक्ष
yi=axbi+ei ,var(ei)=σ2
इसके विपरीत जब आप लॉग लेते हैं और एक रेखीय मॉडल को फिट करते हैं, तो आप कह रहे हैं कि त्रुटि लॉग पैमाने पर और (लॉग स्केल पर) डेटा में स्थिर है। इसका मतलब यह है कि प्रेक्षणों के पैमाने पर, त्रुटि शब्द गुणात्मक है , और इसलिए त्रुटियां बड़ी होती हैं जब अपेक्षित मान बहुत अधिक होते हैं:
yi∼logN(loga+blogxi,σ2)
या समकक्ष
η मैं ~ logn ( 0 , σ 2 )yi=axbi⋅ηi ,ηi∼logN(0,σ2)
(ध्यान दें कि नहीं है। 1. यदि छोटा है, तो आपको इस आशय की अनुमति देने की आवश्यकता है)σ 2E(η)σ2
(आप सामान्यता / तार्किक वितरण को ग्रहण किए बिना कम से कम वर्ग कर सकते हैं, लेकिन जिस केंद्रीय मुद्दे पर चर्चा की जा रही है, वह अभी भी लागू होता है ... और यदि आप कहीं भी सामान्यता के पास नहीं हैं, तो आपको शायद वैसे भी एक अलग त्रुटि मॉडल पर विचार करना चाहिए)
तो जो सबसे अच्छा है वह इस बात पर निर्भर करता है कि किस तरह का त्रुटि मॉडल आपकी परिस्थितियों का वर्णन करता है।
[यदि आप किसी तरह के डेटा के साथ कुछ खोजपूर्ण विश्लेषण कर रहे हैं, जो पहले नहीं देखा गया है, तो आप इस तरह के प्रश्नों पर विचार करेंगे कि "डेटा किस तरह दिखता है? (यानी को विरुद्ध प्लॉट किया गया है ? अवशिष्ट विरुद्ध कैसा दिखता है ? "दूसरी ओर यदि चर इस तरह के असामान्य नहीं हैं तो आपको पहले से ही उनके सामान्य व्यवहार के बारे में जानकारी होनी चाहिए।]x xyxx