क्या सांख्यिकीय मॉडल अंकन के लिए कोई "मानक" है?


10

उदाहरण के लिए, बीयूजीएस मैनुअल या ली और वेगेनमेकर्स ( पीडीएफ ) द्वारा आगामी पुस्तक और कई अन्य स्थानों पर एक प्रकार के अंकन का उपयोग किया जाता है जो मुझे बहुत लचीला लगता है कि इसका उपयोग सबसे सांख्यिकीय मॉडल का सफलतापूर्वक वर्णन करने के लिए किया जा सकता है। इस अंकन का एक उदाहरण निम्नलिखित है:

yiBinomial(pi,ni)log(pi1pi)=bibiNormal(μp,σp)

जो कोई भविष्यवाणियों के साथ एक पदानुक्रमित लॉजिस्टिक मॉडल का वर्णन करेगा, लेकिन समूहों के साथ। मॉडल का वर्णन करने का यह तरीका लगातार और बायेसियन मॉडल का वर्णन करने के लिए समान रूप से अच्छी तरह से काम करता है, उदाहरण के लिए, इस मॉडल विवरण को पूरी तरह से बायेसियन बनाने के लिए आपको बस को और पर जोड़ना होगा ।i=1nμpσp

क्या इस प्रकार के मॉडल अंकन / औपचारिकता को किसी लेख या पुस्तक में विस्तार से वर्णित किया गया है?

यदि आप मॉडल को लिखने के लिए इस संकेतन का उपयोग करना चाहते हैं, तो काम करने के कई अलग-अलग तरीके हैं और यह एक व्यापक गाइड के साथ दोनों का पालन करने और दूसरों को संदर्भित करने के लिए वास्तव में उपयोगी होगा। कुछ अंतर जो मैंने पाया है कि लोग इस प्रकार के संकेतन का उपयोग कैसे करते हैं:

  • आप वितरण को क्या कहते हैं? जैसे, मैंने , आदि को देखा है।N,N,Norm,Normal
  • आप इंडेक्स के साथ कैसे व्यवहार करते हैं? जैसे मैंने , , , आदि देखा है।yijyi[j]yj|i
  • कौन से पैरामीटर प्रतीक आमतौर पर मापदंडों के लिए उपयोग किए जाते हैं। उदाहरण के लिए, सामान्य वितरण के लिए माध्य के रूप में का उपयोग करना आम है , लेकिन अन्य वितरणों के बारे में क्या? (इसके लिए मैं आमतौर पर विकिपीडिया के वितरण की जाँच करता हूँ )μ

अनुवर्ती प्रश्न: क्या इस संकेतन का कोई नाम है? (एक बेहतर नाम की कमी के कारण मैंने इसे एक ब्लॉग पोस्ट में लिखा था कि संभावना वितरण केंद्रित सम्मेलन कहा ...)

जवाबों:


2

सांख्यिकीय संकेतन के लिए कुछ अनुशंसित मानकों को हेल्परिन, हार्टले और हॉएल (1965) और सैंडर्स और पुघ (1972) में प्रस्तुत किया गया है । अधिकांश वर्तमान संकेतन 19 वीं शताब्दी के अंत और 20 वीं सदी की शुरुआत में बायोमेट्रिक सांख्यिकीविदों द्वारा स्थापित किए गए सम्मेलनों से आए हैं (ज्यादातर यह पियर्सन और फिशर और उनके सहयोगियों द्वारा किया गया था)। अंकन के शुरुआती उपयोग की एक उपयोगी सूची को अर्थशास्त्री जॉन एल्डरिक ने यहां रखा है , और अंग्रेजी बायोमेट्रिक स्कूल का एक ऐतिहासिक खाता एल्डरिच (2003) में प्रकाशित हुआ है । (यदि आपके पास इस विषय के बारे में और पूछताछ हो, तो एल्ड्रिच संभवतः आंकड़ों में अंकन के इतिहास में दुनिया का सबसे अग्रणी जीवित विशेषज्ञ है।)

इस स्पष्ट कार्य के अलावा, ऐसी बहुत सी पुस्तकें हैं जो क्षेत्र को परिचय देती हैं, और ये आम धारणाओं के अनुरूप संकेतन को परिभाषित करने के लिए सावधान हैं, क्योंकि वे जाते हैं। इस क्षेत्र में कई प्रसिद्ध सम्मेलन हैं जो साहित्य के माध्यम से लगातार चलते हैं, और सांख्यिकीविदों को अभ्यास के माध्यम से इन से अच्छी तरह से परिचित हैं, यहां तक ​​कि इन शोधकर्ताओं की सिफारिशों को पढ़े बिना भी।

वितरण-केंद्रित नोटेशन की अस्पष्टता: "वितरण-केंद्रित" नोटेशन का उपयोग एक मानक सम्मेलन है जो पूरे सांख्यिकीय साहित्य में उपयोग किया जाता है। हालांकि, इस अंकन के बारे में एक दिलचस्प बात यह है कि वास्तव में इसका क्या अर्थ है, इसके बारे में थोड़ा-सा स्थान है। मानक कन्वेंशन इन बयानों के दाईं ओर ऑब्जेक्ट को पढ़ने के लिए होता है क्योंकि प्रायिकता माप के विवरण के कुछ प्रकार (जैसे, वितरण फ़ंक्शन, घनत्व फ़ंक्शन, आदि) और फिर पढ़ें।अर्थ के साथ संबंध "... का वितरण है ..." या "... में संभाव्यता माप है ...", आदि इस व्याख्या के तहत संबंध दो अलग-अलग चीजों की तुलना करता है; बायीं ओर की वस्तु एक यादृच्छिक चर है और दायीं ओर की वस्तु प्रायिकता माप का विवरण है।

हालाँकि, यह राईट-हैंड-साइड की व्याख्या करने के लिए एक रैंडम वैरिएबल (डिस्ट्रीब्यूशन के विपरीत) के संदर्भ में भी समान रूप से वैध है और इसका अर्थ " रिलेशन" ... "के समान डिस्ट्रीब्यूशन है ..." । इस व्याख्या के तहत संबंध यादृच्छिक चर की तुलना में एक समतुल्य संबंध है ; बाएँ और दाएँ हाथ की ओर की वस्तुएं यादृच्छिक चर दोनों हैं और संबंध प्रतिवर्ती, सममित और सकर्मक है।

यह एक बयान की दो संभव (और समान रूप से मान्य) व्याख्याएं देता है:

XN(μ,σ2).
  • वितरण संबंधी व्याख्या: " में प्रायिकता वितरण " । यह व्याख्या बाद की वस्तु को एक सामान्य संभाव्यता माप (उदाहरण के लिए, इसकी घनत्व फ़ंक्शन, वितरण फ़ंक्शन आदि) के कुछ विवरण के रूप में लेती है।XN(μ,σ2)

  • रैंडम वैरिएबल व्याख्या: " में के समान संभावना वितरण है ।" यह व्याख्या बाद की वस्तु को एक सामान्य यादृच्छिक चर बनाती है।XN(μ,σ2)

प्रत्येक व्याख्या के फायदे और नुकसान हैं। यादृच्छिक-चर व्याख्या का लाभ यह है कि यह एक मानक संबंध का उल्लेख करने के लिए मानक प्रतीक का उपयोग करता है , लेकिन इसका नुकसान यह है कि इसके वितरण कार्यों के समान संकेतन के साथ यादृच्छिक चर के संदर्भ की आवश्यकता होती है। वितरणात्मक व्याख्या का लाभ यह है कि यह वितरण के लिए समान संकेतन का उपयोग करता है, और दिए गए तर्क मान के साथ उनके कार्यात्मक रूप; नुकसान यह है कि यह एक तरह से प्रतीक का उपयोग करता है जो एक समतुल्य संबंध नहीं है।


एल्ड्रिच, जे। (2003) द लैंग्वेज ऑफ द इंग्लिश बायोमेट्रिक स्कूल इंटरनेशनल स्टैटिस्टिकल रिव्यू 71 (1) , पीपी 109-131।

हेल्परिन, एम।, हार्टले, एचओ और होएल, पीजी (1965) ने सांख्यिकीय प्रतीकों और संकेतन के लिए अनुशंसित मानकद अमेरिकन स्टेटिस्टिशियन 19 (3) , पीपी। 12-14।

सैंडर्स, जेआर और पुघ, आरसी (1972) सांख्यिकीय प्रतीकों और अधिसूचनाओं के एक मानक सेट के लिए सिफारिशशैक्षिक शोधकर्ता 1 (11) , पीपी 15-16।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.