हमेशा 0 और मानक विचलन 1 वितरण का उपयोग क्यों किया जाता है?


15

मेरे आँकड़े स्वयं सिखाए गए हैं, लेकिन बहुत सारी सामग्री मैं एक डेटासेट को इंगित करता हूं जिसका अर्थ है 0 और मानक विचलन 1।

अगर ऐसा है तो:

  1. मतलब 0 और SD 1 एक अच्छी संपत्ति क्यों है?

  2. इस नमूने से 0.5 के बराबर एक यादृच्छिक चर क्यों निकाला जाता है? 0.001 ड्राइंग का मौका 0.5 के समान है इसलिए यह फ्लैट वितरण होना चाहिए ...

  3. जब लोग Z स्कोर के बारे में बात करते हैं तो वे वास्तव में यहाँ क्या मतलब है?

जवाबों:


11
  1. शुरुआत में सबसे उपयोगी उत्तर संभवतः 0 का मतलब है और 1 का sd गणितीय रूप से सुविधाजनक है। यदि आप 0 के माध्य से वितरण के लिए प्रायिकताओं को हल कर सकते हैं और 1 का मानक विचलन कर सकते हैं, तो आप उन्हें बहुत ही सरल समीकरण के साथ किसी भी समान वितरण के लिए काम कर सकते हैं।

  2. मैं इस सवाल का पालन नहीं कर रहा हूं। 0 का मतलब और 1 का मानक विचलन आमतौर पर मानक सामान्य वितरण पर लागू होता है, जिसे अक्सर घंटी वक्र कहा जाता है। सबसे अधिक संभावित मूल्य का मतलब है और यह दूर गिर जाता है जैसे ही आप दूर हो जाते हैं। यदि आपके पास वास्तव में फ्लैट वितरण है, तो दूसरे की तुलना में अधिक संभावना नहीं है। यहां आपका प्रश्न खराब है। क्या आप सिक्का के बारे में सवालों को देख रहे थे शायद? द्विपद वितरण और केंद्रीय सीमा प्रमेय को देखें।

  3. "यहाँ मतलब है"? कहाँ पे? Z- स्कोर के लिए सरल उत्तर यह है कि वे आपके स्कोर को घटाते हैं जैसे कि आपका मतलब 0 था और मानक विचलन 1. इसके बारे में सोचने का एक और तरीका यह है कि यह एक व्यक्तिगत स्कोर लेता है क्योंकि स्कोर से मानक मानक विचलन की संख्या होती है मतलब है। समीकरण (स्कोर - माध्य) / मानक विचलन की गणना कर रहा है। आपके द्वारा किए जाने वाले कारण काफी विविध हैं, लेकिन एक यह है कि इंट्रो सांख्यिकी पाठ्यक्रमों में आपके पास अलग-अलग z- स्कोर (उत्तर देखें) के लिए संभावनाओं की तालिकाएँ हैं।

यदि आप पहले z- स्कोर को देखते हैं, तो विकिपीडिया में भी, आपको बहुत अच्छे उत्तर मिलेंगे।


2) मेरा मानना ​​है कि भ्रम वह है जो p (X = .01) का अर्थ है जब X एक सतत यादृच्छिक चर है। सहज रूप से, संभावना हर जगह शून्य प्रतीत होती है क्योंकि कोई भी मौका नहीं है X बिल्कुल ठीक है ।01। प्रश्नकर्ता को निरंतर मामले में एक घनत्व फ़ंक्शन की परिभाषा की समीक्षा करनी चाहिए, जिसे संचयी घनत्व फ़ंक्शन के व्युत्पन्न के रूप में परिभाषित किया गया है।
ट्रिस्टन

7

यहां हम जो बात कर रहे हैं, उसके साथ शुरू करने के लिए मानक सामान्य वितरण, 0 के माध्य से एक सामान्य वितरण और 1 का मानक विचलन है। एक चर के लिए लघु-हाथ जो मानक सामान्य वितरण के रूप में वितरित किया जाता है, वह है।

यहाँ आपके सवालों के जवाब हैं।

(1) मुझे लगता है कि मानक सामान्य वितरण आकर्षक होने के दो प्रमुख कारण हैं। सबसे पहले, किसी भी सामान्य रूप से वितरित चर को मानक विचलन द्वारा प्रत्येक अवलोकन को विभाजित करने से पहले प्रत्येक अवलोकन से इसके मतलब को घटाकर एक मानक सामान्य में परिवर्तित या परिवर्तित किया जा सकता है। इसे Z- परिवर्तन या Z- स्कोर का निर्माण कहा जाता है। यह विशेष रूप से कंप्यूटर से पहले के दिनों में बहुत उपयोगी है।

यदि आप अपने चर से कुछ घटना की संभावना का पता लगाना चाहते थे जो सामान्य रूप से 10.2 के मानक विचलन के साथ 65.6 के साथ वितरित किया जाता है, तो क्या बिना कंप्यूटर के बैक साइड में एक सही दर्द नहीं होगा? बता दें कि यह चर अमेरिकी महिलाओं के इंच में ऊंचाइयां हैं। और कहते हैं कि हम इस संभावना को खोजने में रुचि रखते हैं कि आबादी से बेतरतीब ढंग से खींची गई एक महिला बहुत लंबी होगी - 75 इंच से अधिक लंबा। वैसे यह एक कंप्यूटर के साथ पता लगाने के लिए थोड़ा दर्द है क्योंकि मुझे मेरे साथ हर संभव सामान्य वितरण के लिए एक मेज के चारों ओर ले जाना होगा। हालाँकि, अगर मैं इसे एक Z- स्कोर में बदल देता हूं, तो मैं एक तालिका का उपयोग संभावना का पता लगाने के लिए कर सकता हूं, इस प्रकार:

(xix¯)σx=Z(7565.6)10.2=0.9215
Z तालिका का उपयोग करने पर मुझे पता चलता है कि संचयी प्रायिकता P (z <Z) - 0.8212 और इसलिए 75 इंच से अधिक लंबी या लम्बी महिला को खोजने की संभावना 17.88% है। हम इसे किसी भी सामान्य रूप से वितरित चर के साथ कर सकते हैं और इसलिए यह मानक सामान्य वितरण बहुत आसान है।

मानक सामान्य वितरण का बार-बार उपयोग किए जाने का दूसरा कारण Z- स्कोर के संदर्भ में व्याख्या प्रदान करना है। जेड-रूपांतरित चर में प्रत्येक "अवलोकन" कितने मानक विचलन है जो मूल अप्रतिष्ठित अवलोकन माध्य से था। यह मानकीकृत परीक्षणों के लिए विशेष रूप से आसान है जहां कच्चे या निरपेक्ष प्रदर्शन सापेक्ष प्रदर्शन की तुलना में कम महत्वपूर्ण है।

(२) मैं यहाँ आपका अनुसरण नहीं करता। मुझे लगता है कि आप एक संचयी वितरण फ़ंक्शन के रूप में हमारे लिए भ्रमित हो सकते हैं। ध्यान दें कि मानक सामान्य वितरण का अपेक्षित मान 0 है, और यह मान संबंधित संचयी वितरण फ़ंक्शन पर .5 के मूल्य से मेल खाता है।

(3) जेड-स्कोर एक चर में व्यक्तिगत "अवलोकन" या डेटम हैं जो जेड-रूपांतरित हो गए हैं। चर के मेरे उदाहरण पर लौटें - इंच में अमेरिकी महिलाओं की ऊंचाई। जिनमें से एक विशेष अवलोकन 75 इंच की ऊँचाई वाली महिला हो सकती है। इसके लिए Z- स्कोर, Z- परिवर्तनशील का परिणाम है जैसा कि हमने पहले किया था: इस मामले में Z- स्कोर 0.9215 है। जेड-स्कोर की व्याख्या यह है कि यह विशेष महिला औसत ऊँचाई से 0.9215 मानक विचलन है। एक व्यक्ति जो 55.4 इंच लंबा था, का Z-स्कोर 1 है और औसत ऊंचाई से 1 मानक विचलन होगा।

(xix¯)σx=Z(7565.6)10.2=0.9215

1

चूंकि आपको ग्राहम और जॉन से उत्कृष्ट स्पष्टीकरण प्राप्त हुए हैं, मैं सिर्फ आपके आखिरी प्रश्न का उत्तर देने जा रहा हूं:

जब लोग Z स्कोर के बारे में बात करते हैं तो वे वास्तव में यहाँ क्या मतलब है?

इसका उत्तर देने का सबसे अच्छा तरीका इस प्रश्न के बारे में सोचना है: कक्षा CS 101 में ग्रेड सामान्य रूप से = 80 और = के साथ वितरित किया जाता है। ग्रेड 65 के लिए z- स्कोर क्या है?μσ

तो: (65-80) / 5 = -3

आप कह सकते हैं कि ग्रेड 65 के लिए z- स्कोर -3 है ; या दूसरे शब्दों में बाईं ओर 3 मानक विचलन।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.