यह हमेशा काफी बड़ा होना चाहिए! ;)
सभी पैरामीटर अनुमान एक अनुमान अनिश्चितता के साथ आते हैं, जो नमूना आकार द्वारा निर्धारित किया जाता है। यदि आप एक प्रतिगमन विश्लेषण करते हैं, तो यह अपने आप को याद दिलाने में मदद करता है कि इनपुट डेटा सेट से is 2 वितरण का निर्माण किया जाता है। यदि आपके मॉडल में 5 पैरामीटर थे और आपके पास 5 डेटा बिंदु थे, तो आप केवल distribution 2 वितरण के एक बिंदु की गणना करने में सक्षम होंगे । चूंकि आपको इसे कम से कम करने की आवश्यकता होगी, आप केवल उस एक बिंदु को न्यूनतम के लिए एक अनुमान के रूप में चुन सकते हैं, लेकिन अपने अनुमानित मापदंडों को अनंत त्रुटियों को असाइन करना होगा। अधिक डेटा पॉइंट्स होने से आप पैरामीटर स्पेस को बेहतर तरीके से मैप कर सकते हैं, जिससे न्यूनतम and 2 डिस्ट्रीब्यूशन का बेहतर अनुमान लगाया जा सकता है और इस तरह छोटे एसेसमेंट एरर हो सकते हैं।
क्या आप अधिकतम संभावना आकलनकर्ता का उपयोग कर रहे हैं बजाय स्थिति समान होगी: अधिक डेटा बिंदु न्यूनतम के बेहतर अनुमान की ओर ले जाते हैं।
बिंदु विचरण के लिए, आपको इसे भी मॉडल करना होगा। अधिक डेटा पॉइंट्स होने से "ट्रू" मान के आस-पास के बिंदुओं की क्लस्टरिंग अधिक स्पष्ट हो जाएगी (केंद्रीय सीमा प्रमेय के कारण) और उस बिंदु के लिए सही मान के रूप में एक बड़े, संभावना प्रवाह की व्याख्या करने का खतरा कम हो जाएगा। और किसी भी अन्य पैरामीटर के लिए बिंदु विचरण के लिए आपका अनुमान अधिक स्थिर हो जाएगा जितना अधिक डेटा बिंदु आपके पास होगा।