यहां कई मुद्दे हैं।
(1) मॉडल को स्पष्ट रूप से संभाव्य होना चाहिए । लगभग सभी मामलों में मापदंडों का कोई सेट नहीं होगा जिसके लिए lhs आपके सभी डेटा के लिए rhs से मेल खाते हैं: वहाँ अवशिष्ट होंगे। आपको उन अवशेषों के बारे में धारणा बनाने की जरूरत है। क्या आप उनसे औसतन शून्य होने की उम्मीद करते हैं? सममित रूप से वितरित किया जाना है? लगभग सामान्य रूप से वितरित होने के लिए?
यहां दो मॉडल हैं जो एक निर्दिष्ट के साथ सहमत हैं, लेकिन काफी अलग-अलग अवशिष्ट व्यवहार की अनुमति देते हैं (और इसलिए आमतौर पर अलग-अलग पैरामीटर अनुमान होंगे)। आप के संयुक्त वितरण के बारे में अलग-अलग मान्यताओं के आधार पर इन मॉडलों को अलग कर सकते हैं :εमैं
बी: y मैं = β 0 exp ( β 1 एक्स 1 मैं + ... + β कश्मीर एक्स कश्मीर मैं ) + ϵ मैं ।
ए: वाई मैं= β0exp( β1एक्स1 मैं+ … + Βकएक्सk i+ ϵमैं)
ब: य मैं= β0exp( β1एक्स1 मैं+ … + Βकएक्सk i) + ϵमैं।
(ध्यान दें कि ये डेटा लिए मॉडल हैं ; आमतौर पर अनुमानित डेटा मूल्य रूप में ऐसी कोई चीज नहीं है ।)^ y iyमैंyमैं^
(2) y के लिए शून्य मानों को संभालने की आवश्यकता बताई गई मॉडल (ए) के गलत और अपर्याप्त दोनों है , क्योंकि यह शून्य मान का उत्पादन नहीं कर सकता है, भले ही यादृच्छिक त्रुटि के बराबर हो। ऊपर (बी) दूसरा मॉडल शून्य (या यहां तक कि नकारात्मक) के लिए y के मूल्यों की अनुमति देता है। हालांकि, किसी को केवल इस तरह के आधार पर एक मॉडल नहीं चुनना चाहिए। # 1 को दोहराना: त्रुटियों को यथोचित रूप से मॉडल करना महत्वपूर्ण है।
(3) रैखिककरण मॉडल को बदलता है । आमतौर पर, यह (ए) जैसे मॉडल (बी) की तरह होता है। यह उन लोगों द्वारा उपयोग किया जाता है जिन्होंने इस परिवर्तन को जानने के लिए अपने डेटा का पर्याप्त विश्लेषण किया है, जो पैरामीटर के अनुमानों को सराहनीय रूप से प्रभावित नहीं करेगा और जो लोग इस बात से अनभिज्ञ हैं कि क्या हो रहा है। (यह अंतर बताने के लिए कई बार कठिन है।)
(4) शून्य मान की संभावना को संभालने का एक सामान्य तरीका यह है कि (या कुछ फिर से अभिव्यक्ति, जैसे कि वर्गमूल) को प्रस्तावित करने का एक समान तरीका है, समान रूप से शून्य का सख्ती से सकारात्मक मौका। गणितीय रूप से, हम कुछ अन्य वितरण के साथ एक बिंदु द्रव्यमान (एक "डेल्टा फ़ंक्शन") का मिश्रण कर रहे हैं। ये मॉडल इस तरह दिखते हैं:y
च( yमैं)θजे∼ एफ( Θ ) ;= βज ० ०+ βजे १एक्स1 मैं+ ⋯ + βजे केएक्सk i
जहाँ , वेक्टर में निहित मापदंडों में से एक है , कुछ वितरणों का परिवार है जो मानकीकृत है। by , और का पुन: उपयोग है (सामान्यीकृत रैखिक मॉडल का "लिंक" फ़ंक्शन: onestop का उत्तर देखें)। (बेशक, तब, = जब ) उदाहरण हैं। शून्य-फुलाया हुआ पॉइसन और नकारात्मक द्विपद मॉडल ।पीआरएफθ[ च( य) = 0 ] = θज + १> 0θएफθ1, … , Θजेचyपीआरएफθ[ च( य) ≤ टी ]( 1 - θज + १) एफθ( टी )टी ≠ ०
(५) किसी मॉडल के निर्माण और उसके फिटिंग के मुद्दे संबंधित हैं लेकिन अलग-अलग हैं । एक साधारण उदाहरण के रूप में, यहां तक कि एक साधारण प्रतिगमन मॉडल को कई तरीकों से कम से कम वर्गों (जो अधिकतम संभावना और लगभग समान मानक त्रुटियों के रूप में एक ही पैरामीटर अनुमान देता है) द्वारा फिट किया जा सकता है, पुनरावृत्त कम से कम वर्ग , " मजबूत कम से कम वर्ग ," आदि के अन्य विभिन्न प्रकार फिटिंग का विकल्प अक्सर सुविधा, शीघ्रता ( उदाहरण के लिए , सॉफ्टवेयर की उपलब्धता), परिचित, आदत, या सम्मेलन पर आधारित है, लेकिन कम से कम एक विचार होना चाहिए त्रुटि शब्दों के ग्रहण किए गए वितरण के लिए क्या उपयुक्त है , को क्या दिया जाता हैY=β0+β1एक्स+ ϵεमैंसमस्या के लिए नुकसान का कार्य यथोचित हो सकता है, और अतिरिक्त जानकारी (जैसे मापदंडों के लिए एक पूर्व वितरण ) के दोहन की संभावना हो सकती है ।