क्या कोई कृपया बहुत ही बुनियादी शब्दों में पर्याप्त आँकड़ों की व्याख्या कर सकता है ? मैं एक इंजीनियरिंग पृष्ठभूमि से आता हूं, और मैं बहुत सारी चीजों से गुजरा हूं, लेकिन सहज ज्ञान की खोज में असफल रहा।
क्या कोई कृपया बहुत ही बुनियादी शब्दों में पर्याप्त आँकड़ों की व्याख्या कर सकता है ? मैं एक इंजीनियरिंग पृष्ठभूमि से आता हूं, और मैं बहुत सारी चीजों से गुजरा हूं, लेकिन सहज ज्ञान की खोज में असफल रहा।
जवाबों:
एक पर्याप्त आँकड़ा एक नमूने में निहित सभी जानकारी को संक्षेप में प्रस्तुत करता है ताकि आप एक ही पैरामीटर का अनुमान लगा सकें कि क्या हमने आपको नमूना दिया है या केवल सांख्यिकीय। यह सूचना के नुकसान के बिना डेटा की कमी है।
यहाँ एक उदाहरण है। मान लीजिए कि में शून्य के बारे में एक सममित वितरण है। आपको एक नमूना देने के बजाय, मैं आपको इसके बजाय पूर्ण मूल्यों का एक नमूना सौंपता हूं (यह आँकड़ा है)। आपको साइन देखने को नहीं मिलता है। लेकिन आप जानते हैं कि वितरण सममित है, इसलिए किसी दिए गए मान के लिए x , - x और x समान रूप से संभव हैं (सशर्त संभावना 0.5 है )। तो आप एक उचित सिक्का फ्लिप कर सकते हैं। यदि यह सिर पर आता है, तो उस एक्स को ऋणात्मक बना दें। यदि पूंछता है, तो इसे सकारात्मक बनाएं। यह आपको X ′ से एक नमूना देता है , जिसका मूल डेटा X के समान वितरण है। आप मूल रूप से आँकड़ों से डेटा को फिर से संगठित करने में सक्षम थे। वही इसे पर्याप्त बनाता है।
बायेसियन संदर्भ में, आप कुछ नमूदार संपत्ति है और एक पैरामीटर । के लिए संयुक्त वितरण निर्दिष्ट है, लेकिन की सशर्त वितरण के रूप में शामिल होती है और की पूर्व वितरण । वह आंकड़ा इस मॉडल के लिए पर्याप्त है यदि और केवल यदि का पिछला वितरण की तरह ही है , के हर पहले वितरण के लिए । शब्दों में, के बारे में अपने अद्यतन अनिश्चितता का मूल्य जानने के बाद के बारे में अपने अद्यतन अनिश्चितता रूप में ही है मूल्य जानने के बाद का ,जो भी पहले जानकारी आप के बारे में है । ध्यान रखें कि पर्याप्तता एक मॉडल पर निर्भर अवधारणा है।
कहते हैं कि आपके पास एक सिक्का है, और आप नहीं जानते कि यह उचित है या नहीं। दूसरे शब्दों में, इसमें सिर ( H ) और 1 - p के ऊपर आने की संभावना ( t ) है, और आपको इसका मूल्य नहीं पता है।
आप कई बार सिक्का उछालकर के मूल्य का अंदाजा लगाने की कोशिश करते हैं , कहते हैं कि बार ।
मान लीजिए कि और आपको प्राप्त होने वाला परिणाम अनुक्रम ।
अब आप चाहते हैं कि आपका सांख्यिकीविद् मित्र मूल्य का अनुमान लगा ले लिए p, और शायद आपको बताए कि क्या सिक्का उचित है या नहीं। आपको उन्हें बताने के लिए क्या जानकारी चाहिए ताकि वे अपनी गणना कर सकें और अपना निष्कर्ष निकाल सकें?
आप उन्हें डेटा यानी एच , एच , टी , एच , टी ) के सभी बता सकते हैं । हालांकि यह आवश्यक है? क्या आप किसी भी प्रासंगिक जानकारी को खोए बिना इस डेटा को सारांशित कर सकते हैं?
यह स्पष्ट है कि सिक्के के टॉस का क्रम अप्रासंगिक है, क्योंकि आप प्रत्येक सिक्के के टॉस के लिए एक ही काम कर रहे थे, और सिक्का के टोकन एक दूसरे को प्रभावित नहीं करते थे। उदाहरण के लिए यदि परिणाम , तो हमारे निष्कर्ष कोई भिन्न नहीं होंगे। यह इस प्रकार है कि आपको वास्तव में अपने सांख्यिकीविद् मित्र को यह बताने की आवश्यकता है कि कितने प्रमुख थे।
हम यह कहकर व्यक्त करते हैं कि सिर की संख्या p के लिए पर्याप्त आँकड़ा है ।
यह उदाहरण अवधारणा का स्वाद देता है। यदि आप यह देखना चाहते हैं कि यह औपचारिक परिभाषा से कैसे जुड़ता है, तो पढ़ें।
औपचारिक रूप से, एक आँकड़ा एक पैरामीटर के लिए पर्याप्त होता है यदि, आँकड़ों के मूल्य को देखते हुए, परिणामों की संभाव्यता वितरण में पैरामीटर शामिल नहीं होता है।
, ) are equally likely (in fact there are ten possibilities so they all have probability ). So the distribution no longer has anything to do with . Intuitively this means whichever specific outcome we observe won't tell us any more information about , because the outcomes aren't affected by .
As an aside, note that the probability before we know the number of heads only depends on through the . It turns out that this is equivalent to the being sufficient for .