क्या जनसंख्या की कोई मात्रात्मक संपत्ति "पैरामीटर" है?


13

मैं आँकड़ों और पैरामीटर के बीच के अंतर से अपेक्षाकृत परिचित हूँ। मैं एक आँकड़ों को नमूना डेटा में एक फ़ंक्शन को लागू करने से प्राप्त मूल्य के रूप में देखता हूं। हालांकि, मापदंडों के अधिकांश उदाहरण पैरामीट्रिक वितरण को परिभाषित करने से संबंधित हैं। एक सामान्य उदाहरण सामान्य वितरण या गुणांक और त्रुटि विचलन को रेखीय मानदंड में सुधार करने के लिए औसत और मानक विचलन है।

हालांकि, जनसंख्या वितरण के कई अन्य मूल्य हैं जो कम प्रोटोटाइप (जैसे, एकाधिक प्रतिगमन में, न्यूनतम, अधिकतम, आर-वर्ग), .25 क्वांटाइल, मध्यिका, गैर-शून्य गुणांक वाले पूर्ववर्तियों की संख्या, स्केलेनेस, संख्या है। सहसंबंध मैट्रिक्स में सहसंबंधों की तुलना में .3, आदि)।

इस प्रकार, मेरे प्रश्न हैं:

  • क्या किसी जनसंख्या की मात्रात्मक संपत्ति को "पैरामीटर" लेबल किया जाना चाहिए?
  • यदि हाँ, तो क्‍यों?
  • यदि नहीं, तो किन विशेषताओं को एक पैरामीटर लेबल नहीं किया जाना चाहिए? उन्हें क्या लेबल किया जाना चाहिए? और क्यों?

भ्रम पर विस्तार

अनुमानकर्ताओं पर विकिपीडिया लेख बताता है:

एक "अनुमानक" या "बिंदु अनुमान" एक सांख्यिकीय (जो डेटा का एक फ़ंक्शन) है, जिसका उपयोग एक सांख्यिकीय मॉडल में अज्ञात पैरामीटर के मूल्य का अनुमान लगाने के लिए किया जाता है।

लेकिन मैं अज्ञात मान को .25 मात्रात्मक के रूप में परिभाषित कर सकता हूं और मैं उस अज्ञात के लिए एक अनुमानक विकसित कर सकता हूं। यानी, जनसंख्या के सभी मात्रात्मक गुण उसी तरह के पैरामीटर नहीं हैं जो कहते हैं कि माध्य और एसडी एक सामान्य वितरण के पैरामीटर हैं, फिर भी किसी भी मात्रात्मक जनसंख्या संपत्ति का अनुमान लगाना वैध है।

जवाबों:


15

यह प्रश्न दिल में जाता है कि आँकड़े क्या हैं और एक अच्छा सांख्यिकीय विश्लेषण कैसे किया जाता है। यह कई मुद्दों को उठाता है, कुछ शब्दावली और अन्य सिद्धांत। उन्हें स्पष्ट करने के लिए, चलिए प्रश्न के निहित संदर्भ को ध्यान में रखते हुए शुरू करते हैं और वहां से जाने पर प्रमुख शब्दों "पैरामीटर," "संपत्ति," और "अनुमानक" को परिभाषित करें। सवाल के कई हिस्सों का जवाब दिया जाता है क्योंकि वे चर्चा में आते हैं। अंतिम समापन खंड प्रमुख विचारों को सारांशित करता है।

राज्य के रिक्त स्थान

"डिस्ट्रीब्यूशन" का एक सामान्य सांख्यिकीय उपयोग, जैसा कि "डिस्ट्रीब्यूशन के साथ पीडीएफ में सामान्य वितरण टू " वास्तव में एक है (गंभीर) अंग्रेजी के दुरुपयोग, क्योंकि स्पष्ट रूप से यह एक वितरण नहीं है: यह वितरण के एक पूरे परिवार है parameterized प्रतीकों से और । इस के लिए एक मानक संकेत "राज्य अंतरिक्ष" है , एक सेटμσΩΩexp(12(xμ)/σ)2)dxμσΩवितरण के। (मैं विस्तार के लिए यहां थोड़ा सा सरलीकरण कर रहा हूं और जब तक हम संभव हो, कठोर होते हुए भी सरल हो जाते रहेंगे।) इसकी भूमिका हमारी सांख्यिकीय प्रक्रियाओं के संभावित लक्ष्यों को पूरा करना है: जब हम किसी चीज का अनुमान लगाते हैं, तो हम होते हैं। एक (या कभी-कभी) तत्वों को बाहर निकालना ।Ω

कभी-कभी राज्य रिक्त स्थान को स्पष्ट रूप से जाता है, जैसे कि । इस विवरण में ऊपरी आधे विमान में tuples के सेट और वितरण के बीच एक-से-एक पत्राचार है जो हम अपने डेटा को मॉडल करने के लिए उपयोग करेंगे। इस तरह के एक मानकीकरण का एक मूल्य यह है कि अब हम वास्तविक संख्याओं के एक आदेशित जोड़े के माध्यम से में वितरण के लिए संक्षिप्त रूप से संदर्भित कर सकते हैं ।{ ( μ , σ ) } ΩΩ={N(μ,σ2)|μR,σ>0}{(μ,σ)}Ω

अन्य मामलों में राज्य रिक्त स्थान को स्पष्ट रूप से पैरामीटर नहीं किया गया है। एक उदाहरण सभी अनिमॉडल निरंतर वितरण का सेट होगा। नीचे, हम इस सवाल का समाधान करेंगे कि क्या इस तरह के मामलों में पर्याप्त पैरामीटर मिल सकता है।

parameterizations

आम तौर पर, एक parameterization की एक पत्राचार (गणितीय है समारोह के उपसमूह से) (साथ परिमित) को । यही है, यह वितरण को लेबल करने के लिए -tuples के आदेशित सेट का उपयोग करता है । लेकिन यह सिर्फ कोई पत्राचार नहीं है: इसे "अच्छी तरह से व्यवहार किया जाना है।" इसे समझने के लिए, उन सभी सतत वितरणों के सेट पर विचार करें जिनकी PDF में अपेक्षाएँ कम हैं। इसे व्यापक रूप से इस अर्थ में "गैर-पैरामीट्रिक" माना जाएगा कि इस सेट को मानकीकृत करने के किसी भी "प्राकृतिक" प्रयास में वास्तविक संख्याओं (किसी भी ऑर्थोगोनल आधार में विस्तार का उपयोग करके) की गणना योग्य अनुक्रम शामिल होगा। फिर भी, क्योंकि इस सेट में कार्डिनैलिटी हैआर डी डी Ω 1 आरΩRddΩd1 , जो , इन वितरणों और बीच कुछ एक-से-एक पत्राचार मौजूद होना चाहिए । विडंबना यह है कि है कि यह एक बनाने के लिए प्रतीत होता है पैरामिट्रीकृत एक साथ राज्य अंतरिक्ष एकल वास्तविक पैरामीटर!R

विरोधाभास यह देखते हुए हल किया जाता है कि एक भी वास्तविक संख्या वितरण के साथ "अच्छे" रिश्ते का आनंद नहीं ले सकती है: जब हम उस संख्या के मूल्य को बदलते हैं, तो वितरण कुछ मामलों में होना चाहिए जो कट्टरपंथी तरीकों में बदलता है। हम इस तरह के "पैथोलॉजिकल" मापदंडों का पालन करते हैं, जिनके लिए आवश्यक है कि उनके मापदंडों के करीबी मूल्यों के अनुरूप वितरण खुद एक दूसरे के लिए "करीब" होना चाहिए। "करीब" की उपयुक्त परिभाषाओं पर चर्चा करना हमें बहुत दूर तक ले जाएगा, लेकिन मुझे उम्मीद है कि यह विवरण यह प्रदर्शित करने के लिए पर्याप्त है कि किसी विशेष वितरण के नामकरण की तुलना में पैरामीटर होने के लिए बहुत कुछ है।

वितरण के गुण

बार-बार आवेदन के माध्यम से, हम वितरण के एक "संपत्ति" के बारे में सोचने के आदी हो जाते हैं, जैसा कि कुछ समझदार मात्रा में होता है जो अक्सर हमारे काम में दिखाई देता है, जैसे कि इसकी अपेक्षा, भिन्नता, और इसी तरह। "संपत्ति" की एक संभावित परिभाषा के रूप में इसके साथ समस्या यह है कि यह बहुत अस्पष्ट है और पर्याप्त रूप से सामान्य नहीं है। (यह वह जगह है जहां गणित 18 वीं शताब्दी के मध्य में था, जहां "कार्यों" को वस्तुओं पर लागू होने वाली परिमित प्रक्रियाओं के रूप में सोचा गया था।) इसके बजाय, "संपत्ति" की एकमात्र समझदार परिभाषा के बारे में, जो हमेशा काम करेगी एक संपत्ति के बारे में सोचना है एक संख्या होने के नाते जो विशिष्ट रूप से प्रत्येक वितरण को में असाइन किया गया हैΩ Ω Ω t 1 ΩΩ। इसमें माध्य, विचरण, किसी भी क्षण, किसी भी बीजगणित के संयोजन, किसी भी मात्रात्मक, और बहुत कुछ शामिल हैं, जिसमें ऐसी चीजें भी शामिल हैं जिन्हें गणना भी नहीं की जा सकती है। हालांकि, यह करता है नहीं चीजें हैं जो के तत्वों में से कुछ के लिए कोई मतलब नहीं होगा शामिल । उदाहरण के लिए, यदि सभी छात्र टी वितरण में शामिल है, तो इसका मतलब लिए एक वैध संपत्ति नहीं है (क्योंकि का कोई मतलब नहीं है)। यह हमारे ऊपर एक बार फिर से प्रभाव डालता है कि हमारे विचार इस बात पर निर्भर करते हैं कि वास्तव में क्या है।ΩΩΩt1Ω

गुण हमेशा पैरामीटर नहीं होते हैं

एक संपत्ति एक ऐसा जटिल कार्य हो सकता है कि यह एक पैरामीटर के रूप में काम नहीं करेगा। "सामान्य वितरण" के मामले पर विचार करें। हम यह जानना चाहते हैं कि क्या सही वितरण का मतलब, जब निकटतम पूर्णांक तक गोल हो, तो भी। वह एक संपत्ति है। लेकिन यह एक पैरामीटर के रूप में काम नहीं करेगा।

पैरामीटर जरूरी गुण नहीं हैं

जब पैरामीटर और वितरण एक-से-एक पत्राचार में होते हैं तो स्पष्ट रूप से किसी भी पैरामीटर, और उस मामले के मापदंडों के किसी भी कार्य, हमारी परिभाषा के अनुसार एक संपत्ति है। लेकिन मापदंडों और वितरणों के बीच एक-से-एक पत्राचार की आवश्यकता नहीं है: कभी-कभी कुछ वितरणों को मापदंडों के दो या अधिक अलग-अलग मूल्यों द्वारा वर्णित किया जाना चाहिए। उदाहरण के लिए, क्षेत्र पर बिंदुओं के लिए एक स्थान पैरामीटर स्वाभाविक रूप से अक्षांश और देशांतर का उपयोग करेगा। यह ठीक है - दो ध्रुवों को छोड़कर, जो किसी दिए गए अक्षांश और किसी भी वैध देशांतर के अनुरूप है । स्थान(बिंदु पर क्षेत्र) वास्तव में एक संपत्ति है, लेकिन इसका देशांतर एक संपत्ति नहीं है। हालाँकि, विभिन्न डोज हैं (उदाहरण के लिए, केवल एक ध्रुव के देशांतर को शून्य घोषित करें), यह मुद्दा एक संपत्ति के बीच महत्वपूर्ण वैचारिक अंतर (जो वितरण के साथ विशिष्ट रूप से जुड़ा हुआ है) और एक पैरामीटर (लेबलिंग का एक तरीका है ) पर प्रकाश डालता है वितरण (अद्वितीय नहीं हो सकता है)।

सांख्यिकीय प्रक्रियाएं

एक अनुमान का लक्ष्य एक कहा जाता है estimand । यह महज एक संपत्ति है। सांख्यिकीविद् आकलन का चयन करने के लिए स्वतंत्र नहीं है : वह उसके ग्राहक का प्रांत है। जब कोई आपके पास जनसंख्या का एक नमूना लेकर आता है और आपसे जनसंख्या के 99 वें प्रतिशत का अनुमान लगाने के लिए कहता है, तो आप संभवतः इसके बजाय अनुमानक की आपूर्ति करने में रिमिस होंगे! आपका काम, सांख्यिकीविद के रूप में, आपके द्वारा दिए गए अनुमान के आकलन के लिए एक अच्छी प्रक्रिया की पहचान करना है । (कभी-कभी आपका काम आपके ग्राहक को मनाने के लिए होता है कि उसने अपने वैज्ञानिक उद्देश्यों के लिए गलत अनुमान का चयन किया है, लेकिन यह एक अलग मुद्दा है ...)

परिभाषा के अनुसार, एक प्रक्रिया डेटा से एक संख्या प्राप्त करने का एक तरीका है। प्रक्रियाओं को आमतौर पर डेटा पर लागू होने वाले फ़ार्मुलों के रूप में दिया जाता है, जैसे "उन्हें सभी जोड़ें और उनकी गिनती से विभाजित करें।" शाब्दिक रूप से किसी भी प्रक्रिया को किसी दिए गए अनुमान का "अनुमानक" कहा जा सकता है। उदाहरण के लिए, मैं यह घोषणा कर सकता हूं कि नमूना माध्य (डेटा पर लागू एक सूत्र) जनसंख्या भिन्नता का अनुमान लगाता है (जनसंख्या की एक संपत्ति, हमारे ग्राहक को यह मानते हुए कि संभव आबादी के को केवल उन लोगों को शामिल करने के लिए सीमित किया गया है ) ।Ω

आकलनकर्ता

एक अनुमानक को अनुमान के लिए कोई स्पष्ट संबंध नहीं होना चाहिए। उदाहरण के लिए, क्या आप नमूना माध्य और जनसंख्या विचरण के बीच कोई संबंध देखते हैं? न तो मैं करता हूं। लेकिन फिर भी, नमूना का मतलब वास्तव में कुछ निश्चितΩ (जैसे कि पॉसन वितरण के सेट के रूप में) के लिए जनसंख्या विचरण का एक सभ्य अनुमानक है । इसमें आकलनकर्ताओं को समझने के लिए एक कुंजी निहित है: उनके गुण संभव राज्यों के सेट पर निर्भर करते हैं । लेकिन वह इसका केवल एक हिस्सा है।Ω

tθ FΩFst(s)θ(F)Ft(s)θ(F)FΩ

FΩt1tt

(ए "बायेसियन" सांख्यिकीविद हमेशा संभावित राज्यों के "पूर्व" वितरण (आमतौर पर ग्राहक की आपूर्ति) पर औसत से जोखिमों की तुलना करेंगे । "फ्रीक्वेंटिस्ट" सांख्यिकीविद ऐसा कर सकते हैं, अगर ऐसा पूर्व में उचित रूप से मौजूद है, लेकिन यह भी तैयार है। अन्य तरीकों से जोखिमों की तुलना करें।

निष्कर्ष

tθθtθθ

Ωt


2
Ω

11

परिभाषाओं पर कई प्रश्नों के साथ, उत्तर के लिए दोनों अंतर्निहित सिद्धांतों पर ध्यान देने की आवश्यकता होती है और व्यवहार में शर्तों का उपयोग किया जाता है, जो अक्सर कम से कम थोड़ा ढीले या असंगत हो सकते हैं, यहां तक ​​कि उन लोगों द्वारा भी जो अच्छी तरह से सूचित हैं, और अधिक महत्वपूर्ण रूप से, समुदाय से समुदाय में परिवर्तनशील।

एक सामान्य सिद्धांत यह है कि एक आंकड़ा एक नमूने की एक संपत्ति है, और एक ज्ञात स्थिरांक है, और एक पैरामीटर आबादी की इसी संपत्ति है, और इसलिए एक अज्ञात निरंतर है। शब्द "संगत" को यहां काफी लोचदार के रूप में समझा जाना है। संयोग से, ठीक यह भेद और ठीक यह शब्दावली एक शताब्दी पुरानी से कम है, जिसे आरए फिशर द्वारा पेश किया जा रहा है।

परंतु

  1. नमूना और जनसंख्या का एक सेट अप हमारी सभी समस्याओं की विशेषता नहीं है। समय श्रृंखला उदाहरणों की एक प्रमुख श्रेणी है जिसमें विचार अंतर्निहित अंतर्निहित प्रक्रिया के बजाय होता है, और ऐसा कुछ यकीनन गहरा और अधिक सामान्य विचार है।

  2. ऐसे सेट-अप हैं जिनमें पैरामीटर बदलते हैं। फिर से, समय श्रृंखला विश्लेषण उदाहरण प्रदान करता है।

  3. यहां मुख्य बिंदु पर, हम व्यवहार में आबादी या प्रक्रिया के सभी गुणों को मापदंडों के रूप में नहीं समझते हैं। यदि कुछ प्रक्रिया एक सामान्य वितरण के मॉडल को मानती है, तो न्यूनतम और अधिकतम पैरामीटर नहीं हैं। (वास्तव में, मॉडल के अनुसार, न्यूनतम और अधिकतम किसी भी तरह से बड़ी नकारात्मक और सकारात्मक संख्याएं हैं, न कि यह कि हमें चिंता करनी चाहिए।)

मैं कहूंगा कि एक बार विकिपीडिया यहां सही दिशा में इशारा कर रहा है, और अभ्यास और सिद्धांत दोनों का सम्मान किया जाता है यदि हम कहते हैं कि एक पैरामीटर वह है जो हम अनुमान लगा रहे हैं

यह उन अन्य सवालों के साथ भी मदद करता है जिनकी वजह से पहेली बनी है। उदाहरण के लिए, यदि हम 25% छंटनी वाले माध्य की गणना करते हैं, तो हम क्या अनुमान लगा रहे हैं? एक उचित उत्तर जनसंख्या की संबंधित संपत्ति है, जो प्रभाव में अनुमान पद्धति द्वारा परिभाषित किया गया है। एक शब्दावली यह है कि एक अनुमानक के पास एक अनुमान है, जो भी वह अनुमान लगा रहा है। एक संपत्ति के कुछ प्लैटोनिक विचार के साथ शुरू करना "वहाँ से बाहर" (एक वितरण का तरीका कहो) और यह सोचना कि कैसे उचित है, जैसा कि अनुमान लगाने पर माना जाता है कि डेटा का विश्लेषण करने और जो वे करते हैं उसके माध्यम से सोचने के लिए अच्छे व्यंजनों के बारे में सोच रहे हैं।

जैसा कि अक्सर लागू गणित या विज्ञान में, एक पैरामीटर के लिए एक दुगुना पहलू होता है। हम अक्सर इसके बारे में कुछ ऐसा सोचते हैं, जो हम खोज रहे हैं, लेकिन यह भी सच है कि यह प्रक्रिया के हमारे मॉडल द्वारा परिभाषित कुछ है, ताकि इसका मॉडल के संदर्भ से कोई मतलब न हो।

दो बिल्कुल अलग बिंदु:

  1. कई वैज्ञानिक "पैरामीटर" शब्द का उपयोग उस तरह से करते हैं जैसे कि सांख्यिकीविद चर का उपयोग करते हैं। मेरे पास एक वैज्ञानिक व्यक्तित्व के साथ-साथ एक सांख्यिकीय भी है, और मैं कहूंगा कि यह दुर्भाग्यपूर्ण है। चर और गुण बेहतर शब्द हैं।

  2. यह व्यापक अंग्रेजी उपयोग में उल्लेखनीय रूप से सामान्य है कि पैरामीटर का अर्थ सीमा या सीमा माना जाता है, जो "पैरामीटर" और "परिधि" के बीच कुछ मूल भ्रम से उपजा हो सकता है।

अनुमान बिंदु पर एक नोट

शास्त्रीय स्थिति यह है कि हम पहले से एक पैरामीटर की पहचान करते हैं और फिर तय करते हैं कि इसका अनुमान कैसे लगाया जाए, और यह बहुमत का अभ्यास है, लेकिन प्रक्रिया को उलटना बेतुका नहीं है और कुछ समस्याओं के लिए सहायक हो सकता है। मैं इसे देखने का अनुमान कहता हूं। यह साहित्य में कम से कम 50 वर्षों से है। टके (1962, पृ। 60) ने आग्रह किया कि

"हमें एक अनुमानक के साथ शुरू करने पर अधिक ध्यान देना चाहिए और यह पता लगाना चाहिए कि एक उचित अनुमान क्या है, यह पता लगाने के लिए कि अनुमान लगाने वाले के रूप में अनुमान लगाने के लिए क्या उचित है।"

बिकेल और लेहमन (1975) द्वारा अनौपचारिक रूप से काफी विस्तार और गहराई से औपचारिक रूप से विस्तार किया गया है और अनौपचारिक रूप से मोस्टेलर और टुकी (1977, पीपी.32-34) द्वारा काफी स्पष्टता के साथ।

एक प्रारंभिक संस्करण भी है। नमूना माध्यिका या ज्यामितीय माध्य का उपयोग करते हुए संबंधित जनसंख्या पैरामीटर का अनुमान लगाने का मतलब समझ में आता है कि अंतर्निहित वितरण सममित है या नहीं, और समान सद्भावना को बढ़ाया जा सकता है (जैसे) नमूना छंटनी का मतलब है, जो उनके जनसंख्या समकक्षों के अनुमानक के रूप में माना जाता है। ।

बिकल, पीजे और ईएल लेहमैन। 1975. गैर-समरूप मॉडल के लिए वर्णनात्मक आँकड़े। द्वितीय। स्थानसांख्यिकी 3 के इतिहास : 1045-1069।

एस्टरेलर, एफ। और जेडब्ल्यू तुकी। 1977. डेटा विश्लेषण और प्रतिगमन। पढ़ना, एमए: एडिसन-वेस्ले।

Tukey, JW 1962. डेटा विश्लेषण का भविष्यगणितीय सांख्यिकी 33: 1-67।


इसमें से अधिकांश मानक सांख्यिकीय साहित्य के साथ बाधाओं को देखते हैं, विशेष रूप से आपके पैरामीटर की परिभाषा। यह अनुमान लगाने के लिए एक प्रक्रिया खोजने और अनुमान लगाने की प्रक्रिया की पहचान करने की प्रक्रियाओं को भ्रमित करने के लिए प्रकट होता है उत्तरार्द्ध - एस्टैंडैंड चुनना - यह निर्धारित करने के लिए वैज्ञानिक या अन्वेषक के लिए एक मामला है। पूर्व को तब सांख्यिकीविद् द्वारा चुना जाता है जिसमें अनुमान लगाने के लिए सभी संभावित प्रक्रियाओं के बीच वांछनीय गुण होते हैं। तकनीकी मुद्दे भी हैं; यह कहना कि एक पैरामीटर एक मनमाना अनुमान से अधिक प्रतिबंधित है।
whuber

मैं इसे संबोधित करने के लिए अपने उत्तर का विस्तार करूंगा।
निक कॉक्स

1
मैं टुके से सहमत हूं, हालांकि आप इस उत्तर के बारे में मेरे विचार से सोच सकते हैं कि मैं "ossified" सांख्यिकीविदों में से एक हूं जो वह चुनौती देता है। समस्या यह है कि आपने उनके उद्धरण को संदर्भ से बाहर ले लिया है। Tukey विशेष रूप से इस सवाल का समाधान कर रही है कि प्रक्रियाओं के गुणों का मूल्यांकन कैसे किया जाए "जब परिकल्पना जिन पर वे विकसित होते हैं, वे पकड़ में नहीं आते हैं। यह किसी भी तरह से पैरामीटर, अनुमानक और अनुमान जैसी चीजों की परिभाषा को नहीं बदलता है । विशेष रूप से, एक पैरामीटर अभी भी नहीं है "हम जो भी अनुमान लगा रहे हैं।"
whuber

3
बहुत सोचा यहाँ के लिए खाना। एक त्वरित उत्तर के रूप में: मेरे उत्तर का अर्थ यह नहीं था कि हम लिबर्टी हॉल में हैं जहाँ कुछ भी जाता है। तुकी के उद्धरण का मैं स्वागत करता हूं, क्योंकि मेरा दृष्टिकोण यह है कि यह सामान्य है कि प्रथागत परिकल्पना अभी तक पकड़ में नहीं आती है क्योंकि सभी मॉडल अनुमानित हैं जो डेटा द्वारा बिल्कुल मेल नहीं खाते हैं। काटने से दूर, यह खंड अलग-अलग दृष्टिकोण के मूल्य को रेखांकित करता है। सामान्य तौर पर, मैं प्रयास नहीं कर रहा हूं, न ही उत्पादन करने के लिए योग्य हूं, अधिक सार और अधिक गणितीय रूप से परिष्कृत औपचारिक परिभाषाएं।
निक कॉक्स

6


pdf=12πσ2e12(xiμ)2σ2
12π3.1415926e2.718281828Xxiमूल्य भी। दूसरे शब्दों में, एक बार जब मुझे पता चल जाता है कि उपरोक्त समीकरण वह है जिसके साथ मुझे काम करने की आवश्यकता है, तो मुझे पता है कि सब कुछ पता है, एक बार जब मैं और लिए मान सीखता हूंμσ2 । वे मान पैरामीटर हैं । विशेष रूप से वे अज्ञात स्थिरांक हैं जो वितरण के व्यवहार को नियंत्रित करते हैं। इस प्रकार, उदाहरण के लिए, यदि मैं अनुरूप होने वाले मान को जानना चाहता था, तो मैं और जानने के बाद (या उस वितरण के बारे में कुछ भी) निर्धारित कर सकता हूं। (लेकिन आसपास दूसरा रास्ता नहीं)। उपरोक्त समीकरण विशेषाधिकारX25th%μσ2μऔर इस तरह से है कि यह किसी अन्य मूल्य के लिए नहीं है। σ2

इसी तरह, अगर मैं एक ओएलएस मल्टीपल रिग्रेशन मॉडल के साथ काम कर रहा था, जहां डेटा जनरेट करने की प्रक्रिया मानी जाती है: तो, एक बार मैं सीखना (व्यवहार में, अनुमान ) के मूल्यों , , , और , मुझे सब पता है वहाँ है पता करने के लिए । कुछ भी, जैसे कि का सशर्त वितरण का जहाँ , मैं अपने ज्ञान के आधार पर की गणना कर सकता हूँ
β 0 β 1 β 2 σ 2 25 वें % Y एक्स = एक्स मैं β 0 β 1 β 2 σ 2 β 0 β 1 β 2 σ 2

Y=β0+β1X1+β2X2+εwhere εN(0,σ2)
β0β1β2σ225th%YX=xiβ0, , , और । विशेषाधिकार , , , और ऊपर एकाधिक प्रतिगमन मॉडल इस तरह से है कि यह किसी अन्य मूल्य के लिए नहीं है। β1β2σ2β0β1β2σ2

(यह सभी मानते हैं, कि जनसंख्या वितरण या डेटा बनाने की प्रक्रिया का मेरा मॉडल सही है। यह हमेशा की तरह ध्यान में रखने योग्य है कि "सभी मॉडल गलत हैं, लेकिन कुछ उपयोगी हैं" - जॉर्ज बॉक्स ।)

आपके सवालों के अधिक स्पष्ट रूप से उत्तर देने के लिए, मैं कहूंगा:

  • नहीं, किसी भी पुराने मात्रात्मक को "पैरामीटर" लेबल नहीं किया जाना चाहिए।
  • n / a
  • जिन विशेषताओं को "पैरामीटर" लेबल किया जाना चाहिए, वे मॉडल विनिर्देश पर निर्भर करते हैं। मेरे पास अन्य मात्रात्मक विशेषताओं के लिए एक विशेष नाम नहीं है, लेकिन मुझे लगता है कि उन्हें गुणों या विशेषताओं या परिणामों , आदि को कॉल करना ठीक होगा ।

धन्यवाद। लेकिन आप उन सभी जनसंख्या मूल्यों का वर्णन करने के लिए क्या शब्दावली का उपयोग करते हैं जो एक पैरामीट्रिक मॉडल से प्राप्त किए जा सकते हैं लेकिन उस मॉडल का प्रतिनिधित्व करने के लिए सुविधाजनक मापदंडों के सेट में नहीं हैं? या वैकल्पिक रूप से, एक मामला हो सकता है, जहां आप जनसंख्या मॉडल को नहीं जानते हैं और विशेष रूप से देखभाल नहीं करते हैं, लेकिन जनसंख्या मॉडल के एक विशेष गैर-मानक पहलू में रुचि रखते हैं।
जेरोमे एंग्लीम

मेरा कोई विशेष रूप से लागू नाम नहीं है, लेकिन कुछ विशेष मूल्यों के नाम हैं। उदाहरण के लिए, यदि आप वास्तव में विश्वास नहीं करते कि आपके आबादी के लिए पर्याप्त रूप से किसी भी अच्छी तरह से अध्ययन वितरण के करीब है, तो आप अपने मंझला, चतुर्थकों, काज अंक, इत्यादि से विशेषताएं बताने का प्रयत्न कर सकता है
फिर से बहाल करते मोनिका - गुंग

3
मापदंडों के बारे में एक सूक्ष्म मुद्दा एक पुरानी कंप्यूटर ट्रिक द्वारा उजागर किया गया है: एक नया बाइनरी बनाने के लिए (चार के समूहों द्वारा ) बाइनरी (या दशमलव) निरूपण और का प्रतिनिधित्व करते हैं और उन्हें (या दशमलव) संख्या । स्पष्ट रूप से यह प्रक्रिया प्रतिवर्ती है: आप पहले, पाँचवें, नौवें, ..., इत्यादि अंकों के को पढ़ सकते हैं , और इसी तरह से। इसलिए "एक बार [आप] the का मूल्य सीखते हैं , [आप] जानते हैं कि सब कुछ पता है।" लेकिन है नहीं एक वैध पैरामीटर कारण पीला पड़ जिस तरह यह संभव वितरण लेबल करने के लिए। σ θ बीटा 0 θ θ θβ0,β1,β2,σθβ0θθθ
व्हीबर

3

इस सवाल के कुछ शानदार जवाब हैं, मैंने सोचा था कि मैं एक दिलचस्प संदर्भ का सारांश दूंगा जो अनुमानकर्ताओं की काफी कठोर चर्चा प्रदान करता है।

वर्चुअल लैबोरेट्रीज पेज पर अनुमानक परिभाषित करते हैं

  • "परिणाम चर का एक अवलोकन समारोह" के रूप में एक आंकड़ा
  • "तकनीकी अर्थ में, एक पैरामीटर X के वितरण का एक कार्य है"θ

एक वितरण के एक समारोह की अवधारणा एक बहुत ही सामान्य विचार है। इस प्रकार, ऊपर दिए गए प्रत्येक उदाहरण को एक निश्चित वितरण के कार्य के रूप में देखा जा सकता है।

  • मिन, माध्यिका, 25 वीं मात्रात्मक सहित प्रत्येक मात्रात्मक, अधिकतम वितरण का एक कार्य हो सकता है।
  • तिरछा वितरण का एक कार्य है। यदि वह जनसंख्या वितरण सामान्य है, तो ये शून्य होंगे, लेकिन इससे इन मूल्यों की गणना नहीं रुकती है।
  • एक निश्चित मान से अधिक सहसंबंधों की संख्या की गणना करना सहसंयोजक मैट्रिक्स का एक कार्य है जो बदले में एक बहुभिन्नरूपी वितरण का एक कार्य है।
  • आर-वर्ग वितरण का एक कार्य है।

1
मैंने एक और विस्तृत जवाब देने का एक कारण यह बताया कि "पैरामीटर" की यह परिभाषा पर्याप्त अच्छी नहीं है। एक प्रतिवाद के लिए मेरी टिप्पणी @ गंग के उत्तर पर देखें । Intuitively, का एक सेट पैरामिट्रीकृत वितरण एक परिमित आयामी संस्थानिक कई गुना-साथ-सीमा बनाती है; एक पैरामीटर को कई गुना पर परिभाषित एक निरंतर फ़ंक्शन होना चाहिए । यह सिर्फ एक तकनीकी आवश्यकता से अधिक है, क्योंकि यह अनुमानों के नमूना वितरण से संबंधित है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.