यदि हम नेत्रहीन रूप से एक सतत डेटा का वितरण देखना चाहते हैं, तो हिस्टोग्राम और पीडीएफ में से किसका उपयोग किया जाना चाहिए?
हिस्टोग्राम और पीडीएफ के बीच क्या अंतर हैं, फॉर्मूला वार नहीं?
यदि हम नेत्रहीन रूप से एक सतत डेटा का वितरण देखना चाहते हैं, तो हिस्टोग्राम और पीडीएफ में से किसका उपयोग किया जाना चाहिए?
हिस्टोग्राम और पीडीएफ के बीच क्या अंतर हैं, फॉर्मूला वार नहीं?
जवाबों:
डिर्क बिंदु स्पष्ट करने के लिए:
कहते हैं कि आपका डेटा एक सामान्य वितरण का एक नमूना है। आप निम्नलिखित कथानक का निर्माण कर सकते हैं:
लाल रेखा आनुभविक घनत्व का अनुमान है, नीली रेखा अंतर्निहित सामान्य वितरण की सैद्धांतिक पीडीएफ है। ध्यान दें कि हिस्टोग्राम घनत्व में व्यक्त किया गया है और यहां आवृत्तियों में नहीं। यह प्लॉटिंग उद्देश्यों के लिए किया जाता है, सामान्य आवृत्तियों में हिस्टोग्राम में उपयोग किया जाता है।
तो अपने प्रश्न का उत्तर देने के लिए: आप अनुभवजन्य वितरण (यानी हिस्टोग्राम) का उपयोग करते हैं यदि आप अपने नमूने का वर्णन करना चाहते हैं, और पीडीएफ यदि आप अंतर्निहित अंतर्निहित वितरण का वर्णन करना चाहते हैं।
R में निम्नलिखित कोड द्वारा प्लॉट तैयार किया जाता है:
x <- rnorm(100)
y <- seq(-4,4,length.out=200)
hist(x,freq=F,ylim=c(0,0.5))
lines(density(x),col="red",lwd=2)
lines(y,dnorm(y),col="blue",lwd=2)
हिस्टोग्राम एक घनत्व का पूर्व-कंप्यूटर आयु अनुमान है। एक घनत्व का अनुमान एक विकल्प है।
इन दिनों हम दोनों का उपयोग करते हैं, और एक समृद्ध साहित्य है जिसके बारे में चूक का उपयोग करना चाहिए।
दूसरी ओर एक पीडीएफ, एक के लिए एक बंद-रूप अभिव्यक्ति है दिए गए वितरण के । यह आपके डेटासेट का अनुमानित घनत्व या हिस्टोग्राम के साथ वर्णन करने से अलग है ।
यहां कोई कठिन और तेज़ नियम नहीं है। यदि आप अपनी आबादी का घनत्व जानते हैं, तो एक पीडीएफ बेहतर है। दूसरी ओर, अक्सर हम नमूनों से निपटते हैं और एक हिस्टोग्राम कुछ जानकारी दे सकता है जो अनुमानित घनत्व को कवर करता है। उदाहरण के लिए, एंड्रयू गेलमैन इस बिंदु को बनाता है:
हिस्टोग्राम का एक प्रमुख लाभ यह है कि, कच्चे डेटा के एक भूखंड के रूप में, इसमें स्वयं के त्रुटि मूल्यांकन के बीज होते हैं। या, इसे दूसरे तरीके से रखने के लिए, थोड़ा अंडरस्टेड हिस्टोग्राम की दांतेदारता नेत्रहीन रूप से नमूना परिवर्तनशीलता का संकेत देकर एक उपयोगी सेवा करती है। इसीलिए, यदि आप मेरी किताबों और प्रकाशित लेखों में हिस्टोग्राम देखते हैं, तो मैं हमेशा बहुत सारे डिब्बे का उपयोग करता हूं। मैं भी लगभग कभी उन कर्नेल घनत्व का अनुमान नहीं लगाता जो लोग कभी-कभी एक आयामी वितरण को प्रदर्शित करने के लिए उपयोग करते हैं। मैं नहीं बल्कि हिस्टोग्राम देखना होगा और पता चल जाएगा कि डेटा कहाँ हैं
सापेक्ष आवृत्ति हिस्टोग्राम ( असतत )
घनत्व हिस्टोग्राम ( असतत )
संभाव्यता घनत्व फ़ंक्शन पीडीएफ ( निरंतर )
ये संदर्भ सहायक थे :) http://stattrek.com/statistics/dfox.aspx?definition=Probability_density_function
उपरोक्त साइट से Continuous_probability_distribution
http://www.geog.ucsb.edu/~joel/g210_w07/lecture_notes/lect04/oh07_04_1.html