आज्ञा मनाया गया डेटा है जिसे iid यादृच्छिक चर अनुक्रम का अहसास दिया जाता है सामान्य संभावना घनत्व फ़ंक्शन के साथ एक सिग्मा-परिमित माप संबंध में परिभाषित किया गया है । घनत्व को डेटा जनरेटिंग प्रक्रिया (DGP) घनत्व कहा जाता है।y1,…,ynY1,…,Ynpeνpe
शोधकर्ता की संभाव्यता मॉडल में
संभावना घनत्व कार्यों का एक संग्रह है जो एक पैरामीटर वेक्टर द्वारा अनुक्रमित किया जाता है
। मान लें कि प्रत्येक घनत्व में एक सामान्य सिग्मा-परिमित माप संबंध में परिभाषित किया गया है (उदाहरण के लिए, प्रत्येक घनत्व समान नमूना स्थान साथ एक संभाव्यता द्रव्यमान समारोह हो सकता है )।M≡{p(y;θ):θ∈Θ}θMνS
घनत्व रखना महत्वपूर्ण है जो वास्तव में डेटा की संभावना मॉडल से वैचारिक रूप से अलग डेटा उत्पन्न करता है। क्लासिक सांख्यिकीय उपचारों में इन अवधारणाओं का सावधानीपूर्वक पृथक्करण या तो अनदेखा किया जाता है, बनाया नहीं जाता है, या यह शुरुआत से ही सही माना जाता है कि संभावना मॉडल को सही ढंग से निर्दिष्ट किया गया है।pe
संबंध में एक सही ढंग से निर्दिष्ट मॉडल को एक ऐसे मॉडल के रूप में परिभाषित किया गया है जहां -almost हर जगह है। जब
को p_e के संबंध में यह उस मामले से मेल खाता है जहां संभावना मॉडल सही ढंग से निर्दिष्ट नहीं है।Mpepe∈M νMpe
यदि संभाव्यता मॉडल को सही ढंग से निर्दिष्ट किया गया है, तो पैरामीटर स्पेस में एक मौजूद है जैसे कि
-almost हर जगह। इस तरह के एक पैरामीटर वेक्टर को "सही पैरामीटर वेक्टर" कहा जाता है। यदि संभावना मॉडल गलत है, तो सही पैरामीटर वेक्टर मौजूद नहीं है।θ∗Θpe(y)=p(y;θ∗) ν
व्हाइट के मॉडल गलत निर्धारण ढांचे के भीतर लक्ष्य को पैरामीटर अनुमान लगता है, जो
कुछ कॉम्पैक्ट पैरामीटर space । यह माना जाता है कि एक अद्वितीय सख्त वैश्विक minimizer, , की उम्मीद मूल्य के पर के भीतरी इलाकों में स्थित है । भाग्यशाली मामले में जहां संभावना मॉडल को सही ढंग से निर्दिष्ट किया गया है, " की व्याख्या "सच्चे पैरामीटर मान" के रूप में की जा सकती है।θ^n ℓ n(θ)≡(1/n)Σ n मैं = 1 लॉगपी(yमैं;θ)Θθ * ℓ nΘΘθ*ℓ^n(θ)≡(1/n)∑ni=1logp(yi;θ)Θθ∗ℓ^nΘΘθ∗
विशेष मामले में जहां संभावना मॉडल को सही ढंग से निर्दिष्ट किया गया है, तो परिचित अधिकतम संभावना अनुमान है। यदि हमें पूर्ण ज्ञान नहीं है कि संभाव्यता मॉडल को सही ढंग से निर्दिष्ट किया गया है, तो को अर्ध-अधिकतम संभावना अनुमान कहा जाता है और लक्ष्य का अनुमान लगाना है । यदि हम भाग्यशाली हो जाते हैं और संभावना मॉडल को सही ढंग से निर्दिष्ट किया जाता है, तो अर्ध-अधिकतम संभावना अनुमान कम हो जाता है एक विशेष मामले के रूप में परिचित अधिकतम संभावना अनुमान और
सही पैरामीटर मान बन जाता है।θ^n θ एनθ*θ*θ^nθ∗θ∗
व्हाइट (1982) के ढांचे के भीतर संगति अभिसरण से मेल खाती है, जो कि उस को आवश्यक किए बिना आवश्यक रूप से सही पैरामीटर वेक्टर है। व्हाइट के ढांचे के भीतर, हम कभी भी इस घटना की संभावना का अनुमान नहीं लगा सकते हैं कि produced द्वारा उत्पादित सेट में TRUE वितरण P * शामिल है। इसके बजाय, हम हमेशा संभावना वितरण P ** का अनुमान लगाएंगे जो कि इस घटना की संभावना है कि would द्वारा निर्मित सेटों में घनत्व द्वारा निर्दिष्ट वितरण शामिल है
।θ∗θ∗p(y;θ∗)
अंत में, मॉडल मिसकैपिफिकेशन के बारे में कुछ टिप्पणियां। ऐसे उदाहरणों को ढूंढना आसान है जहां एक गलत ढंग से बनाया गया मॉडल बेहद उपयोगी और बहुत भविष्य कहनेवाला हो। उदाहरण के लिए, गॉसियन अवशिष्ट त्रुटि शब्द के साथ एक ग़ैर-रेखीय (या एक रेखीय) प्रतिगमन मॉडल पर विचार करें, जिसका विचरण अत्यंत छोटा है फिर भी वातावरण में वास्तविक अवशिष्ट त्रुटि गौसियन नहीं है।
ऐसे उदाहरणों को ढूंढना भी आसान है जहां एक सही ढंग से निर्दिष्ट मॉडल उपयोगी नहीं है और पूर्वानुमान नहीं है। उदाहरण के लिए, स्टॉक की कीमतों की भविष्यवाणी करने के लिए एक यादृच्छिक वॉक मॉडल पर विचार करें, जो कल के समापन मूल्य की भविष्यवाणी करता है, आज के समापन मूल्य का एक भारित योग है और एक बहुत बड़े विचरण के साथ कुछ गॉसियन शोर है।
मॉडल प्रक्षेपी ढांचे का उद्देश्य मॉडल वैधता सुनिश्चित करने के लिए नहीं है, बल्कि विश्वसनीयता सुनिश्चित करने के लिए है। यही है, यह सुनिश्चित करें कि आपके पैरामीटर अनुमान, आत्मविश्वास अंतराल, परिकल्पना परीक्षण, और इसी तरह से जुड़े नमूना त्रुटि त्रुटि या तो मॉडल प्रक्षेपन की एक छोटी या बड़ी मात्रा की उपस्थिति के बावजूद सही ढंग से अनुमान लगाया गया है। अर्ध-अधिकतम संभावना अनुमान समान रूप से सामान्य रूप से पर केंद्रित होते हैं, एक सहसंयोजक मैट्रिक्स अनुमानक के साथ, जो नकारात्मक लॉग-लिबिलिटी फ़ंक्शन के पहले और दूसरे दोनों डेरिवेटिव पर निर्भर करता है। विशेष मामले में जहां आप भाग्यशाली हैं और मॉडल सही है तो सभी सूत्र परिचित शास्त्रीय सांख्यिकीय ढांचे में कम हो जाते हैं जहां लक्ष्य "सच्चे" पैरामीटर मानों का अनुमान लगाना है।θ∗