अनुभवजन्य सीडीएफ बनाम सीडीएफ


22

मैं अनुभवजन्य संचयी वितरण समारोह के बारे में सीख रहा हूँ। लेकिन मुझे अभी भी समझ नहीं आ रहा है

  1. इसे 'एम्पिरिकल' क्यों कहा जाता है?

  2. क्या Empirical CDF और CDF में कोई अंतर है?



एक बॉक्स मॉडल में टिकट के संदर्भ में एक सरल, सरल, सुरुचिपूर्ण विवरण है : सीडीएफ का वर्णन है कि मूल बॉक्स में क्या है। ईसीडीएफ वह है जो आपको अपना नमूना डालते समय मिलता है (जो मूल बॉक्स से निकाले गए टिकटों का एक सेट है: एक खाली बॉक्स में तथाकथित "अनुभवजन्य" डेटा)।
whuber

एक बात का ध्यान रखें कि आपका अनुभवजन्य वितरण आमतौर पर इसके निर्माण के तरीके से घिरा होता है, जबकि CDF नहीं हो सकता है। उदाहरण के लिए, यदि आप Poisson चर के अवलोकनों से आनुभविक CDF का निर्माण करते हैं, तो प्राप्त ECDF उच्चतम अवलोकन आवृत्ति से घिरा होने जा रहा है, जबकि सही CDF अबाधित है।
अक्कल

जवाबों:


28

आज्ञा देना X एक यादृच्छिक चर है।

  • संचयी बंटन फ़ंक्शन F(x) देता है P(Xx)
  • एक अनुभवजन्य संचयी बंटन फ़ंक्शन समारोह G(x) देता है P(Xx) अपने नमूना में टिप्पणियों पर आधारित।

भेद वह है जिसमें संभाव्यता माप का उपयोग किया जाता है। अनुभवजन्य सीडीएफ के लिए, आप एक अनुभवजन्य नमूने में आवृत्ति गणना द्वारा परिभाषित संभावना माप का उपयोग करते हैं।

सरल उदाहरण (सिक्का फ्लिप):

बता दें कि X एक एकल चर फ्लिप के परिणाम को दर्शाते हुए एक यादृच्छिक चर है जहां X=1 सिर को दर्शाता है और X=0 पूंछ को दर्शाता है।

उचित सिक्के के लिए CDF द्वारा दिया गया है:

F(x)={0for x<012for 0x<11for 1x

यदि आप 2 सिर और 1 पूंछ फड़फड़ाते हैं, तो अनुभवजन्य CDF होगा:

G(x)={0for x<023for 0x<11for 1x

अनुभवजन्य CDF को प्रतिबिंबित करेगा कि आपके नमूने में, 2/3 अपने flips के प्रमुखों थे।

एक अन्य उदाहरण ( सामान्य वितरण के लिए F सीडीएफ है):

आज्ञा देना 0 और मानक विचलन 1 के साथ एक्स को सामान्य रूप से वितरित यादृच्छिक चर है ।01

CDF द्वारा दिया गया है:

एफ(एक्स)=-एक्स12π-एक्स22

मान लीजिए कि आपके पास 3 IID ड्रॉ थे और मानों को प्राप्त किया एक्स1<एक्स2<एक्स3 । अनुभवजन्य CDF होगा:

जी(y)={0के लिये y<एक्स113के लिये एक्स1y<एक्स223के लिये एक्स2y<एक्स31के लिये एक्स3y

पर्याप्त IID ड्रॉ (और कुछ नियमितता शर्तों को पूरा किया जाता है) के साथ, अनुभवजन्य CDF आबादी के अंतर्निहित CDF पर अभिसरण होगा।


12

क्या Empirical CDF और CDF में कोई अंतर है?

हां, वे अलग हैं। एक अनुभवजन्य cdf एक उचित cdf है, लेकिन आनुभविक cdfs हमेशा असतत वितरण से न खींचे जाने पर भी असतत रहेगा, जबकि वितरण का cdf असतत के अलावा अन्य चीजें भी हो सकता है।

यदि आप किसी नमूने का इलाज करते हैं जैसे कि यह मानों की आबादी थी, तो हर एक समान रूप से संभावित (यानी प्रत्येक अवलोकन पर 1 / n जगह) तो उस वितरण का cdf डेटा का ECDF होगा।

इसे 'एम्पिरिकल' क्यों कहा जाता है?

यह नमूना के आधार पर जनसंख्या cdf का अनुमान है; विशेष रूप से यदि आप प्रत्येक अलग डेटा मूल्य पर नमूने के अनुपात का इलाज करते हैं और इसका इलाज करते हैं जैसे कि यह आबादी में एक संभावना थी, तो आपको ईसीडीएफ मिलता है।

अनुभवजन्य का अर्थ "सिद्धांत के बजाय अवलोकन द्वारा" जैसा कुछ है, और इस मामले में वास्तव में इसका अर्थ है ... वितरण समारोह का निर्धारण करने के लिए टिप्पणियों का उपयोग करना।


11

अनुभवजन्य सीडीएफ एक वास्तविक डेटा सेट से बनाया गया है (नीचे दिए गए प्लॉट में, मैंने मानक सामान्य वितरण से 100 नमूनों का उपयोग किया है)। सीडीएफ एक सैद्धांतिक निर्माण है - यह वह है जो आप देखेंगे यदि आप असीम रूप से कई नमूने ले सकते हैं।

अनुभवजन्य सीडीएफ आमतौर पर सीडीएफ को काफी अच्छी तरह से अनुमानित करता है, विशेष रूप से बड़े नमूनों के लिए (वास्तव में, इस बात के बारे में प्रमेय हैं कि नमूना आकार बढ़ने पर यह सीडीएफ में कितनी जल्दी परिवर्तित होता है)।

अनुभवजन्य सीडीएफ बनाम सीडीएफ


10

अनुभवजन्य वह चीज है जो आप डेटा और टिप्पणियों से बनाते हैं। उदाहरण के लिए, मान लीजिए कि आप किसी देश में लोगों की ऊंचाई के वितरण के बारे में जानना चाहते हैं। आप लोगों को मापने के द्वारा शुरू करते हैं और एक हिस्टोग्राम के साथ आते हैं जिसे वितरण के लिए अनुमानित किया जा सकता है। फिर आप अनुभवजन्य सीडीएफ की गणना करते हैं।

यदि आप एक सांख्यिकीय वितरण का उपयोग कर रहे हैं (एक निर्धारित सूत्र जो समान मापदंडों के साथ सटीक समान आउटपुट देता है) तो आप इसकी सीडीएफ भी गणना कर सकते हैं।

आप कह सकते हैं "इस देश में लोगों की ऊँचाई को सामान्य वितरण के समान 1.75 मीटर और मानक विचलन 0.1 मीटर के साथ वितरित किया जाता है। तब आप ~ की CDF का उपयोग कर सकते हैं।एन(μ=1.75 ,σ=0.1 ) अनुभवजन्य वितरण की निर्मित सीडीएफ के बजाय।


क्या एक विश्वास मापक नियोजित किया गया है जो इस बात की संभावना व्यक्त करता है कि सीडीएफ और एम्परिकल सीडीएफ दुनिया में सभी प्रयोगात्मक नमूने की सीमा में समान जनसंख्या का वर्णन करते हैं? उदाहरण के लिए, इलेक्टोरल पोलिंग के लिए आवेदन करना प्रतीत होता है। (हालांकि शायद नहीं, क्योंकि उत्पादन एक फ़ंक्शन के रूप में कड़ाई से वर्णन करने योग्य नहीं है ...)
बेनपेन

3

Dictionary.com के अनुसार , "अनुभवजन्य" की परिभाषाओं में शामिल हैं:

अनुभव या प्रयोग से प्राप्त या निर्देशित।

इसलिए, अनुभवजन्य सीडीएफ आपके डेटा से प्राप्त सीडीएफ है। यह सैद्धांतिक सीडीएफ (जिसे अक्सर "सीडीएफ" कहा जाता है) के साथ विरोधाभास होता है, जो सामान्य वितरण जैसे सांख्यिकीय या संभाव्य मॉडल से प्राप्त होता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.