भारित भिन्न, एक बार


17

निष्पक्ष भारित विचरण पहले से ही यहां और अन्य जगहों पर संबोधित किया गया था, लेकिन अभी भी भ्रम की एक आश्चर्यजनक राशि प्रतीत होती है। पहली कड़ी में और साथ ही विकिपीडिया लेख में प्रस्तुत सूत्र के प्रति एक आम सहमति प्रतीत होती है । यह आर, गणितज्ञ और जीएसएल (लेकिन MATLAB नहीं) द्वारा उपयोग किए गए सूत्र जैसा दिखता है। हालाँकि, विकिपीडिया लेख में निम्न पंक्ति भी है जो एक भारित विचरण कार्यान्वयन के लिए एक महान पवित्रता जाँच की तरह लगती है:

उदाहरण के लिए, यदि मान {2,2,4,5,5,5} समान वितरण से तैयार किए गए हैं, तो हम इस सेट को बिना वजन वाले नमूने के रूप में मान सकते हैं, या हम इसे भारित नमूने {2,4 के रूप में मान सकते हैं। 5} इसी वजन के साथ {2,1,3}, और हमें समान परिणाम प्राप्त करने चाहिए।

मेरी गणना मूल मानों के विचरण के लिए 2.1667 और भारित विचरण के लिए 2.9545 का मूल्य देती है। क्या मुझे वास्तव में उनसे ऐसा ही होने की उम्मीद करनी चाहिए? क्यों या क्यों नहीं?


6
यह प्रश्न वास्तव में कार्यान्वयन के बारे में नहीं है, लेकिन इसके पीछे सिद्धांत
उलझन

जवाबों:


16

हां, आपको समान परिणाम देने के लिए दोनों उदाहरणों (बिना भार के बनाम भारित) की अपेक्षा करनी चाहिए।

मैंने विकिपीडिया लेख से दो एल्गोरिदम लागू किए हैं।

यह एक काम करता है:

यदि सभी xi समान वितरण से तैयार किए गए हैं और पूर्णांक भार wi , तो मैं नमूने में घटना की आवृत्ति को इंगित करता हूं , तो भारित जनसंख्या विचरण के निष्पक्ष अनुमानक द्वारा दिया जाता है:

s2 =1V11i=1Nwi(xiμ)2,

हालांकि यह एक (आंशिक वजन का उपयोग करके) मेरे लिए काम नहीं करता है:

xi1/wi

s2 =V1V12V2i=1Nwi(xiμ)2

मैं अभी भी उन कारणों की जांच कर रहा हूं जो दूसरे समीकरण के अनुसार काम नहीं करते हैं।

/ संपादित करें: मैंने सोचा था कि दूसरे समीकरण के काम नहीं करने का कारण मिला: आप दूसरे समीकरण का उपयोग केवल तभी कर सकते हैं जब आपके पास वजन या भिन्नता ("विश्वसनीयता") भार है, और यह निष्पक्ष नहीं है, क्योंकि यदि आप नहीं करते हैं "रिपीट" वेट का उपयोग करें (किसी अवलोकन की संख्या की गणना करते समय और इस प्रकार आपके गणित कार्यों में दोहराया जाना चाहिए), आप कुल टिप्पणियों की संख्या की गणना करने की क्षमता खो देते हैं, और इस प्रकार आप एक सुधार कारक का उपयोग नहीं कर सकते हैं।

तो यह आपके परिणामों में भारित और गैर-भारित विचरण का उपयोग करते हुए अंतर बताता है: आपकी गणना पक्षपाती है।

इस प्रकार, यदि आप एक निष्पक्ष भारित विचरण करना चाहते हैं, तो केवल "पुनरावृत्ति" भार का उपयोग करें और मेरे द्वारा ऊपर पोस्ट किए गए पहले समीकरण का उपयोग करें। यदि यह संभव नहीं है, तो ठीक है, आप इसकी मदद नहीं कर सकते।

यदि आप अधिक जानकारी चाहते हैं तो मैंने विकिपीडिया के लेख को भी अपडेट किया है: http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance

और निष्पक्ष भारित सहसंयोजक के बारे में एक जुड़ा हुआ लेख (जो वास्तव में ध्रुवीकरण पहचान के कारण एक ही रूपांतर है ): भारित निष्पक्ष नमूना सहसंयोजक के लिए सही समीकरण


इसके माध्यम से बहुत कुछ पढ़ने और सोचने के बाद भी मुझे "विश्वसनीयता भार" शब्द का सहज अर्थ या उदाहरण नहीं मिलता है। क्या आप कृपया उस पर थोड़ा विस्तार कर सकते हैं?
पीटर

@Peter विश्वसनीयता वज़न सामान्यीकृत वज़न है, उदाहरण के लिए, 0 और 1 या -1 के बीच बँधा हुआ और 1. वे एक आवृत्ति का प्रतिनिधित्व करते हैं (जैसे, 0.1 का मतलब है कि यह नमूना अन्य सभी नमूनों की तुलना में 10% समय देखा गया था)। मैंने शब्द का आविष्कार नहीं किया, यह प्रकाशनों में पाया जा सकता है। दोहराने के वजन के लिए यह विपरीत है, प्रत्येक वजन घटनाओं की संख्या का प्रतिनिधित्व करता है, कार्डिनैलिटी (उदाहरण, 10 अगर नमूना 10 बार देखा गया था)।
विस्तृत

यह भ्रामक है क्योंकि जिसे आप रिपीट वेट कहते हैं , उसे अक्सर फ़्रीक्वेंसी वेट भी कहा जाता है , लेकिन मुझे लगता है कि मुझे अंतर मिला। यह सामान्यीकरण पर निर्भर करता है, है ना?
पीटर

नहीं, फ़्रीक्वेंसी वेट विश्वसनीयता वज़न के लिए एक वैकल्पिक नाम है। बार-बार वजन के लिए, यह आवृत्तियों की संख्या है, आवृत्ति नहीं। दोहराए गए वज़न के साथ, कोई भी सामान्यीकरण नहीं होता है, यह बिंदु है: जब तक आप अपने वज़न को सामान्य करते हैं, आप बेस आवृत्ति को खो देते हैं, इसलिए आप अपनी गणना को पूरी तरह से निष्पक्ष नहीं कर सकते। एकमात्र तरीका कुल घटनाओं की संख्या रखना है। यदि आप वास्तव में आवृत्ति भार का उपयोग करना चाहते हैं, तो मुझे लगता है कि यदि आप कुल एन संख्याओं को पहले से संग्रहीत करते हैं, तो आप आवृत्ति द्वारा वज़न को एन द्वारा गुणा करके दोहराए जा सकते हैं, तो यह ठीक है।
लोबस

और यदि आपका वजन 1 / भिन्न वजन है, तो आप उन लोगों को कैसे बुलाएंगे? क्या तब "विश्वसनीयता भार" होगा?
टॉम वेन्सलेर्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.