वास्तव में 'पूल डेटा' का क्या अर्थ है?


16

मैंने सोचा था कि 'पूलिंग डेटा' का मतलब केवल उन डेटा को संयोजित करना था जो पहले श्रेणियों में विभाजित थे ... अनिवार्य रूप से, श्रेणियों की अनदेखी और डेटा को डेटा का एक विशाल 'पूल' बना देता है। मुझे लगता है कि यह आंकड़ों के आवेदन की तुलना में शब्दावली के बारे में अधिक सवाल है।

उदाहरण के लिए: मैं 2 साइटों की तुलना करना चाहता हूं, और प्रत्येक साइट के भीतर मेरे पास दो वर्ष-प्रकार (अच्छे और गरीब) हैं। अगर मैं 2 साइटों की 'समग्र' (जो कि वर्ष प्रकारों की अनदेखी कर रहा है) की तुलना करना चाहता हूं, तो क्या यह कहना सही है कि मैं प्रत्येक साइट के डेटा को पूल कर रहा हूं? इसके अलावा, चूंकि कई वर्षों के डेटा में अच्छे और खराब वर्ष प्रकार शामिल होते हैं, क्या यह कहना भी सही है कि मैं प्रत्येक साइट के भीतर 'अच्छे वर्ष' और 'खराब वर्ष' के डेटा सेट को प्राप्त करने के लिए वर्षों के बीच डेटा को पूल कर रहा हूं? आपकी सहायताके लिए धन्यवाद! मॉग

जवाबों:


13

हां, आपके उदाहरण सही हैं।

ऑक्सफोर्ड इंग्लिश डिक्शनरी ने पूल को परिभाषित किया है:

पूल, वी।

(पुल)

१.१ ट्रांस। समझौते के अनुसार वितरित किए जाने वाले सामान्य स्टॉक या फंड में फेंकने के लिए; आम लाभ के लिए (पूंजी या हितों) गठबंधन करने के लिए; कल्पना। प्रतिस्पर्धी रेलवे कंपनियों, आदि के लिए: साझा करने या विभाजित करने के लिए (यातायात या रसीदें)।

एक और उदाहरण होगा:

आप पुरुषों और महिलाओं में पदार्थ एक्स के रक्त स्तर को मापते हैं। आप दो समूहों के बीच सांख्यिकीय अंतर नहीं देखते हैं इसलिए आप प्रायोगिक विषय के लिंग की अनदेखी करते हुए डेटा को एक साथ जोड़ते हैं।

क्या ऐसा करना सांख्यिकीय रूप से सही है, यह विशिष्ट मामले पर बहुत निर्भर करता है।


12

पूलिंग डेटा के संयोजन का उल्लेख कर सकता है, लेकिन यह कच्चे डेटा के बजाय संयोजन जानकारी का भी उल्लेख कर सकता है। पूलिंग के सबसे आम उपयोगों में से एक विचरण का अनुमान लगाना है। यदि हम मानते हैं कि 2 आबादी में एक ही विचरण है, लेकिन समान रूप से एक ही माध्य नहीं है, तो हम 2 समूहों के नमूनों से विचरण के 2 अनुमानों की गणना कर सकते हैं, फिर एकल अनुमान प्राप्त करने के लिए उन्हें पूल (भारित औसत लें) आम विचरण। हम संयुक्त डेटा से विचरण के एक अनुमान की गणना नहीं करते हैं क्योंकि यदि साधन समान नहीं हैं तो यह विचरण अनुमान को बढ़ा देगा।


धन्यवाद @Greg स्पष्ट करने के लिए (क्योंकि मैं साहित्य से भी भिन्नताओं को संयोजित करने की कोशिश कर रहा हूं), आप क्या कह रहे हैं कि कई आबादी के लिए 'औसत' रूपांतर प्राप्त करने के लिए, मैं गणना किए गए संस्करणों का भारित अर्थ ले सकता हूं? मैं उन संस्करणों का वजन कैसे करूंगा? क्या प्रत्येक जनसंख्या = 1 नहीं है?
मोग

यदि नमूना आकार समान हैं, तो सरल औसत काम करता है। आम तौर पर हम प्रत्येक डेटा पॉइंट को बराबर वजन देते हैं, मानक फॉर्मूला प्रत्येक चर को स्वतंत्रता की डिग्री (या समूह, n-1 की तुलना में हर में संख्या) से गुणा करने के लिए है, फिर सभी टुकड़ों को जोड़ते हैं, फिर योग के योग से विभाजित करते हैं स्वतंत्रता की डिग्री (सभी n_i-1)।
ग्रेग स्नो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.