मॉडल पहचान क्या है?


38

मुझे पता है कि एक मॉडल जो पहचानने योग्य नहीं है, के साथ कहा जा सकता है कि यह मॉडल मापदंडों के लिए कई अलग-अलग असाइनमेंट द्वारा उत्पन्न किया जा सकता है। मुझे पता है कि कभी-कभी मापदंडों को कसना संभव है ताकि सभी पहचानने योग्य हों, जैसा कि कैसला और बर्जर 2 के संस्करण में उदाहरण के लिए, धारा 11.2।

किसी विशेष मॉडल को देखते हुए, मैं कैसे मूल्यांकन कर सकता हूं कि यह पहचान योग्य है या नहीं?

जवाबों:


45

के लिए identifiability हम एक पैरामीटर के बारे में बात कर रहे हैं है, जो एक पैरामीटर अंतरिक्ष से अधिक पर्वतमाला (जो एक वेक्टर हो सकता है) Θ , और वितरण के एक परिवार (सादगी के लिए, लगता है कि पीडीएफ़) द्वारा अनुक्रमित θ जो हम आम तौर पर लिखने कुछ की तरह { θ |θΘθ । उदाहरण के लिए, θ हो सकता है θ = β और हो सकता है{fθ|θΘ}θθ=βf

जो मतलब यह होगा किΘ=(0,)। आदेश में मॉडल से पहचाने जाने योग्य होने के लिए, परिवर्तन जो नक्शे के लिएθकोθहोना चाहिएएक-से-एक। अपनी गोद में एक मॉडल को देखते हुए, यह जाँच करने के लिए सबसे सरल तरीके के साथ शुरू करने के लिए है समीकरणθ 1 =θ 2 , (इस समानता के लिए (लगभग) सभी धारण करना चाहिएएक्समें

fθ(x)=1βex/β, x>0, β>0,
Θ=(0,)θfθfθ1=fθ2xसमर्थन ) और बीजगणित (या कुछ अन्य तर्क) कि सिर्फ इस तरह के एक समीकरण को दिखाने के लिए इस्तेमाल करने की कोशिश करने के लिए है कि निकलता है, वास्तव में, θ1=θ2

यदि आप इस योजना के साथ सफल होते हैं, तो आपका मॉडल पहचानने योग्य है; अपने व्यापार के साथ जाओ। यदि आप नहीं करते हैं, तो या तो आपका मॉडल पहचाने जाने योग्य नहीं है, या आपको कोई अन्य तर्क खोजने की आवश्यकता है। अंतर्ज्ञान समान है, भले ही: एक पहचान योग्य मॉडल में एक ही संभावना समारोह को जन्म देने के लिए दो अलग-अलग मापदंडों (जो वैक्टर हो सकते हैं) के लिए असंभव है।

यह समझ में आता है, क्योंकि यदि निश्चित डेटा के लिए, दो अद्वितीय मापदंडों ने एक ही संभावना को जन्म दिया, तो अकेले डेटा के आधार पर दो उम्मीदवार मापदंडों के बीच अंतर करना असंभव होगा। उस मामले में, सच्चे पैरामीटर की पहचान करना असंभव होगा ।

fθ1=fθ2

1β1ex/β1=1β2ex/β2,
x>0
lnβ1xβ1=lnβ2xβ2
x>0
(1β11β2)x(lnβ1lnβ2)

f(y)=y2y[1,1]y[0,1]


2
(+1) अच्छी, व्यापक, डाउन-टू-अर्थ व्याख्या। आपके द्वारा खींची गई उपमाएँ अवधारणाओं को स्पष्ट करती हैं।
कार्डिनल

मेरे द्वारा पूछे गए प्रश्न का आपने निश्चित रूप से उत्तर दिया, लेकिन मैं वास्तव में आपके उत्तर को समझने के लिए बहुत अधिक नौसिखिया हूं। यदि आप एक स्पष्टीकरण के बारे में जानते हैं जो नौसिखिए के लिए बेहतर है, तो कृपया मुझे बताएं।
जैक टान्नर

1
@ कार्डिनल, धन्यवाद। जैक को, ठीक है, मैं देखता हूं। इस बारे में कैसे: अगर ऊपर कुछ ऐसा है जो अभी तक स्पष्ट नहीं है, और यदि आप इसे मेरे लिए इंगित करते हैं, तो मैं इसे और अधिक मांस करने की कोशिश कर सकता हूं। या, यदि आप चाहें, तो आप एक और प्रश्न लिख सकते हैं जो इन विचारों के "आम आदमी की व्याख्या" या उदाहरण के लिए पूछता है। मुझे लगता है कि यह कहना उचित है कि पहचान एक ऐसा विषय है जो आमतौर पर अध्ययन के विशिष्ट परिचयात्मक अवधि के बाद सामने आता है , इसलिए यदि आप कुछ संदर्भ प्रदान करना चाहते हैं कि आप इसे क्यों प्राप्त कर रहे हैं तो यह संभावित उत्तरदाताओं की मदद कर सकता है।

2
yij=μ+α1+α2++αk+εi

23

ΣΣΣ

Σ

यदि आप एक अधिकतम संभावना समस्या कर रहे हैं, तो आप जानते हैं कि आपके अनुमानों का एसिम्प्टोटिक सहसंयोजक मैट्रिक्स MLE में मूल्यांकन किए गए फिशर जानकारी के व्युत्क्रम के बराबर है। तो, (लगभग) विलक्षणता के लिए फ़िशर सूचना मैट्रिक्स की जाँच भी पहचान का आकलन करने का एक उचित तरीका है। यह भी काम करता है जहां सैद्धांतिक फिशर जानकारी की गणना करना मुश्किल होता है क्योंकि अक्सर फिशर सूचना मैट्रिक्स के एक सुसंगत अनुमानक के बारे में बहुत सटीक रूप से लगभग सटीक रूप से संभव होता है, उदाहरण के लिए, मनाया गया बाहरी उत्पाद द्वारा स्कोर फ़ंक्शन के अपेक्षित बाहरी उत्पाद का अनुमान लगाना। ।

Σ


2
(+1) शाबाश। मैंने इस प्रश्न को उस दिशा से देखने के लिए सोचा भी नहीं था।

1
सिम्युलेटेड डेटा के आधार पर कोविरियस मैट्रिक्स की गणना करने के बारे में एक कारण विशेष रूप से साफ-सुथरा है, यह है कि किसी को भी कुक-गेलमैन-रुबिन चेक करने के लिए डेटा का अनुकरण करना चाहिए ।
जैक टैनर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.