मैं अनुभवजन्य संचयी वितरण समारोह के बारे में सीख रहा हूँ। लेकिन मुझे अभी भी समझ नहीं आ रहा है
इसे 'एम्पिरिकल' क्यों कहा जाता है?
क्या Empirical CDF और CDF में कोई अंतर है?
मैं अनुभवजन्य संचयी वितरण समारोह के बारे में सीख रहा हूँ। लेकिन मुझे अभी भी समझ नहीं आ रहा है
इसे 'एम्पिरिकल' क्यों कहा जाता है?
क्या Empirical CDF और CDF में कोई अंतर है?
जवाबों:
आज्ञा देना एक यादृच्छिक चर है।
भेद वह है जिसमें संभाव्यता माप का उपयोग किया जाता है। अनुभवजन्य सीडीएफ के लिए, आप एक अनुभवजन्य नमूने में आवृत्ति गणना द्वारा परिभाषित संभावना माप का उपयोग करते हैं।
बता दें कि एक एकल चर फ्लिप के परिणाम को दर्शाते हुए एक यादृच्छिक चर है जहां सिर को दर्शाता है और पूंछ को दर्शाता है।
उचित सिक्के के लिए CDF द्वारा दिया गया है:
यदि आप 2 सिर और 1 पूंछ फड़फड़ाते हैं, तो अनुभवजन्य CDF होगा:
अनुभवजन्य CDF को प्रतिबिंबित करेगा कि आपके नमूने में, अपने flips के प्रमुखों थे।
आज्ञा देना 0 और मानक विचलन 1 के साथ को सामान्य रूप से वितरित यादृच्छिक चर है ।
CDF द्वारा दिया गया है:
मान लीजिए कि आपके पास 3 IID ड्रॉ थे और मानों को प्राप्त किया । अनुभवजन्य CDF होगा:
पर्याप्त IID ड्रॉ (और कुछ नियमितता शर्तों को पूरा किया जाता है) के साथ, अनुभवजन्य CDF आबादी के अंतर्निहित CDF पर अभिसरण होगा।
क्या Empirical CDF और CDF में कोई अंतर है?
हां, वे अलग हैं। एक अनुभवजन्य cdf एक उचित cdf है, लेकिन आनुभविक cdfs हमेशा असतत वितरण से न खींचे जाने पर भी असतत रहेगा, जबकि वितरण का cdf असतत के अलावा अन्य चीजें भी हो सकता है।
यदि आप किसी नमूने का इलाज करते हैं जैसे कि यह मानों की आबादी थी, तो हर एक समान रूप से संभावित (यानी प्रत्येक अवलोकन पर 1 / n जगह) तो उस वितरण का cdf डेटा का ECDF होगा।
इसे 'एम्पिरिकल' क्यों कहा जाता है?
यह नमूना के आधार पर जनसंख्या cdf का अनुमान है; विशेष रूप से यदि आप प्रत्येक अलग डेटा मूल्य पर नमूने के अनुपात का इलाज करते हैं और इसका इलाज करते हैं जैसे कि यह आबादी में एक संभावना थी, तो आपको ईसीडीएफ मिलता है।
अनुभवजन्य का अर्थ "सिद्धांत के बजाय अवलोकन द्वारा" जैसा कुछ है, और इस मामले में वास्तव में इसका अर्थ है ... वितरण समारोह का निर्धारण करने के लिए टिप्पणियों का उपयोग करना।
अनुभवजन्य सीडीएफ एक वास्तविक डेटा सेट से बनाया गया है (नीचे दिए गए प्लॉट में, मैंने मानक सामान्य वितरण से 100 नमूनों का उपयोग किया है)। सीडीएफ एक सैद्धांतिक निर्माण है - यह वह है जो आप देखेंगे यदि आप असीम रूप से कई नमूने ले सकते हैं।
अनुभवजन्य सीडीएफ आमतौर पर सीडीएफ को काफी अच्छी तरह से अनुमानित करता है, विशेष रूप से बड़े नमूनों के लिए (वास्तव में, इस बात के बारे में प्रमेय हैं कि नमूना आकार बढ़ने पर यह सीडीएफ में कितनी जल्दी परिवर्तित होता है)।
अनुभवजन्य वह चीज है जो आप डेटा और टिप्पणियों से बनाते हैं। उदाहरण के लिए, मान लीजिए कि आप किसी देश में लोगों की ऊंचाई के वितरण के बारे में जानना चाहते हैं। आप लोगों को मापने के द्वारा शुरू करते हैं और एक हिस्टोग्राम के साथ आते हैं जिसे वितरण के लिए अनुमानित किया जा सकता है। फिर आप अनुभवजन्य सीडीएफ की गणना करते हैं।
यदि आप एक सांख्यिकीय वितरण का उपयोग कर रहे हैं (एक निर्धारित सूत्र जो समान मापदंडों के साथ सटीक समान आउटपुट देता है) तो आप इसकी सीडीएफ भी गणना कर सकते हैं।
आप कह सकते हैं "इस देश में लोगों की ऊँचाई को सामान्य वितरण के समान 1.75 मीटर और मानक विचलन 0.1 मीटर के साथ वितरित किया जाता है। तब आप ~ की CDF का उपयोग कर सकते हैं। अनुभवजन्य वितरण की निर्मित सीडीएफ के बजाय।
Dictionary.com के अनुसार , "अनुभवजन्य" की परिभाषाओं में शामिल हैं:
अनुभव या प्रयोग से प्राप्त या निर्देशित।
इसलिए, अनुभवजन्य सीडीएफ आपके डेटा से प्राप्त सीडीएफ है। यह सैद्धांतिक सीडीएफ (जिसे अक्सर "सीडीएफ" कहा जाता है) के साथ विरोधाभास होता है, जो सामान्य वितरण जैसे सांख्यिकीय या संभाव्य मॉडल से प्राप्त होता है।