भिन्नता के गुणांक की व्याख्या कैसे करें?


33

मैं भिन्नता के गुणांक को समझने की कोशिश कर रहा हूं । जब मैं इसे डेटा के निम्नलिखित दो नमूनों पर लागू करने का प्रयास करता हूं तो मैं यह समझने में असमर्थ हूं कि परिणामों की व्याख्या कैसे करें।

मान लीजिए कि नमूना 1 और नमूना 2 । यहाँ नमूना 2 नमूना 1 जैसा कि आप देख सकते हैं।10 , 15 , 17 , 22 , 21 , 27 = + 100,5,7,12,1 1,1710,15,17,22,21,27=+ 10

दोनों में समान मानक विचलन लेकिन और ।μ 2 = 18.67 μ 1 = 8.66667σ2=σ1=५.९५,५३९μ2=18.67μ1=८.६६,६६७

अब भिन्नता का गुणांक भिन्न होगा। नमूना 2 के लिए यह नमूना 1 से कम होगा। लेकिन मैं उस परिणाम की व्याख्या कैसे करूं? विचरण के संदर्भ में दोनों समान हैं; केवल उनके साधन अलग हैं। तो यहाँ भिन्नता के गुणांक का क्या उपयोग है? यह सिर्फ मुझे गुमराह कर रहा है, या शायद मैं परिणामों की व्याख्या करने में असमर्थ हूं।σ/μ


यदि 10 जोड़ने की बजाय आप 1000 जोड़ते हैं तो दूसरा सेट संख्या पहले सेट की तुलना में औसत के सापेक्ष बहुत कम होगा। भिन्नता का गुणांक इसी की अभिव्यक्ति है।

बहुत निकटता से संबंधित: आँकड़ें ।stackexchange.com / questions / 113437/…
व्हिबर

जवाबों:


42

जब डेटा बस additively अलग आपके जैसे उदाहरणों में, यानी हम कुछ निरंतर जोड़ने सब कुछ करने के लिए है, तो आप बाहर बिंदु के रूप में मानक विचलन, अपरिवर्तित है मतलब बिल्कुल कि निरंतर से बदल गया है, और इतने से विविधताएं परिवर्तित के गुणांक σ / μ करने के लिए σ / ( μ + कश्मीर ) , जो न तो दिलचस्प है और न ही उपयोगी है।kσ/μσ/(μ+कश्मीर)

यह गुणात्मक परिवर्तन है जो दिलचस्प है और जहां भिन्नता के गुणांक का कुछ उपयोग है। कुछ निरंतर द्वारा सब कुछ गुणा करने के लिए का तात्पर्य है कि भिन्नता का गुणांक हो जाता है कश्मीर σ / कश्मीर μ , यानी पहले की तरह ही बनी हुई है। माप की इकाइयों को बदलना बिंदु में एक मामला है, जैसा कि @Aksalal और @Macond के उत्तर में है।कश्मीरकश्मीरσ/कश्मीरμ

चूंकि भिन्नता का गुणांक इकाई-मुक्त होता है, इसलिए यह आयाम-मुक्त भी होता है, क्योंकि अंतर्निहित चर द्वारा जो भी इकाइयां या आयाम होते हैं, वे विभाजन द्वारा धोए जाते हैं। यह भिन्नता के गुणांक को सापेक्ष परिवर्तनशीलता का मापक बनाता है , इसलिए लंबाई की सापेक्ष परिवर्तनशीलता की तुलना वजन के साथ की जा सकती है, और इसके बाद। एक क्षेत्र जहां भिन्नता के गुणांक में कुछ वर्णनात्मक उपयोग पाया गया है वह जीव विज्ञान में जीव के आकार के आकार का है।

सिद्धांत और व्यवहार में भिन्नता के गुणांक को केवल पूर्ण रूप से परिभाषित किया गया है और चर के लिए सभी उपयोगी हैं जो पूरी तरह से सकारात्मक हैं। इसलिए विस्तार में मूल्य के साथ आपका पहला नमूना एक उपयुक्त उदाहरण नहीं है। यह देखने का एक और तरीका है कि ध्यान दें कि शून्य कभी गुणांक अनिश्चित होगा और मतलब थे कि नकारात्मक गुणांक नकारात्मक होगा, बाद के मामले में यह मानते हुए कि मानक विचलन सकारात्मक है। या तो मामला सापेक्ष परिवर्तनशीलता के माप के रूप में बेकार बना देगा, या वास्तव में किसी अन्य उद्देश्य के लिए। 0

एक समतुल्य कथन यह है कि भिन्नता का गुणांक दिलचस्प और उपयोगी है यदि सभी मानों के लिए लॉगरिदम को सामान्य तरीके से परिभाषित किया गया है, और वास्तव में भिन्नता के गुणांक का उपयोग करना लॉगरिदम की परिवर्तनशीलता को देखने के बराबर है।

हालांकि यह यहां पाठकों के लिए अविश्वसनीय लग जाना चाहिए, मैं जलवायवीय और भौगोलिक प्रकाशनों जिसमें सेल्सियस तापमान की भिन्नता का गुणांक अनुभवहीन वैज्ञानिकों ने ध्यान दें कि गुणांक के रूप में औसत तापमान के करीब विस्फोट कर सकते हैं हैरान है देखा है सी और औसत तापमान के लिए नकारात्मक हो जाते हैं शून्य तापमान से नीचे। इससे भी अधिक विचित्र रूप से, मैंने उन सुझावों को देखा है जिनके बजाय फ़ारेनहाइट का उपयोग करके समस्या को हल किया जाता है। इसके विपरीत, भिन्नता के गुणांक को अक्सर एक माप के रूप में सही ढंग से उल्लेखित किया जाता है यदि और केवल अगर माप तराजू अनुपात पैमाने के रूप में योग्य हो। जैसा कि होता है, केल्विन में मापा तापमान के लिए भी भिन्नता का गुणांक विशेष रूप से उपयोगी नहीं है, लेकिन गणितीय या सांख्यिकीय के बजाय भौतिक कारणों से।0

जैसा कि जलवायु विज्ञान के विचित्र उदाहरणों के मामले में, जिन्हें मैं बिना किसी कारण के छोड़ देता हूं क्योंकि लेखकों को न तो श्रेय मिलता है और न ही शर्म, भिन्नता का गुणांक कुछ क्षेत्रों में अधिक उपयोग किया जाता है। कभी-कभी इसे एक प्रकार का जादू सारांश उपाय माना जाता है, जो औसत और मानक विचलन दोनों को जोड़ता है। यह स्वाभाविक रूप से आदिम सोच है, यहां तक ​​कि जब अनुपात समझ में आता है, तो माध्य और मानक विचलन को इससे पुनर्प्राप्त नहीं किया जा सकता है।

आंकड़ों में भिन्नता का गुणांक काफी स्वाभाविक पैरामीटर है यदि भिन्नता गामा या लॉगानॉर्मल का अनुसरण करती है, जैसा कि उन वितरणों के लिए भिन्नता के गुणांक के रूप को देखकर देखा जा सकता है।

यद्यपि भिन्नता का गुणांक कुछ उपयोग का हो सकता है, ऐसे मामलों में जहां यह अधिक उपयोगी कदम लागू होता है लॉगरिदमिक पैमाने पर काम करने के लिए, या तो लॉगरिदमिक परिवर्तन या सामान्यीकृत रैखिक मॉडल में लॉगरिदमिक लिंक फ़ंक्शन का उपयोग करके।

σ/|μ|


3
+1 इस पोस्ट में लघुगणक और सकारात्मकता के बारे में प्रमुख बिंदु शामिल हैं, जो इस मुद्दे की किसी भी चर्चा का हिस्सा बनना चाहिए। "युद्ध की कहानियाँ" इसे अच्छी तरह से पढ़ती हैं।
whuber

मुझे लगा कि अगर कोई चर = 0 है तो आप CV की गणना नहीं कर सकते?

1
@Jerf: इसके माध्यम से सोचो। यदि सभी मान 0 हैं, तो कोई भिन्नता नहीं है और गणना करने के लिए कुछ भी नहीं है। केवल इसलिए कोई समस्या नहीं है क्योंकि कुछ व्यक्तिगत मान 0 हैं, क्योंकि यह अपने मतलब से इंकार नहीं करता है। फिर भी आप हमेशा ऐसे उदाहरण पा सकते हैं जहां कुछ मान शून्य नहीं हैं, फिर भी इसका मतलब 0 है, उदाहरण -1, 0, 1, 1 सीवी किस मामले में अनिश्चित है। लेकिन व्यवहार में, सीवी सबसे उपयोगी है जब सभी मूल्य सकारात्मक होते हैं।
निक कॉक्स

13

कल्पना कीजिए कि मैंने कहा "इस शहर में 1,625,330 लोग हैं। प्लस या माइनस पांच।" आप मेरे सटीक जनसांख्यिकीय ज्ञान से प्रभावित होंगे।

लेकिन अगर मैंने कहा "इस घर में पांच लोग हैं। प्लस या माइनस पांच।" आपको लगता होगा कि मेरे पास कोई सुराग नहीं था कि घर में कितने लोग थे।

समान मानक विचलन, बहुत अलग सीवी।


1
यह समझाने का एक उचित तरीका है कि सीओवी क्या है, लेकिन यह स्पष्ट नहीं है कि यह ओपी के प्रश्न के लिए कितना प्रासंगिक है।
गूँग -

ओपी पूछता है: "विचरण के संदर्भ में दोनों समान हैं; केवल उनके साधन अलग हैं। तो यहाँ भिन्नता के गुणांक का उपयोग क्या है?" मुझे लगता है कि मेरा उदाहरण विचरण की व्याख्या करने के तरीके के रूप में सीवी के उपयोग को दिखाता है।
बार्ट

1
मैंने आपको निराश नहीं किया। ओपी के 2 स्पष्ट प्रश्न हैं: "मैं उस परिणाम की व्याख्या कैसे करूं?", और "यहां भिन्नता के गुणांक का उपयोग क्या है?"। आप का स्पष्टीकरण अच्छा है, लेकिन यह समझना कि सीओवी क्या है, उन प्रश्नों के उत्तर देने में केवल पहला कदम है, न कि उन प्रश्नों के उत्तर को पूरा करना।
गूँग - मोनिका

4

आम तौर पर, आप माप की विभिन्न इकाइयों या बहुत अलग तराजू के चर के लिए भिन्नता के गुणांक का उपयोग करते हैं। आप इसे शोर / सिग्नल अनुपात के रूप में सोच सकते हैं। उदाहरण के लिए, आप छात्रों के वजन और ऊंचाई की परिवर्तनशीलता की तुलना करना चाहते हैं; यूएसए और मोनाको की जीडीपी की परिवर्तनशीलता।

आपके मामले में, भिन्नता का गुणांक बहुत अधिक समझ में नहीं आ सकता है, क्योंकि मूल्य बहुत अलग नहीं हैं।



2

वास्तविकता में, यदि आप अपनी परिकल्पना और प्रयोग को नहीं जानते या समझते हैं, तो दोनों आँकड़े भ्रामक हो सकते हैं। इस वीभत्स उदाहरण पर विचार करें ... एक ढलान पर दो ऊंची इमारतों के पार चलना जैसा कि एक तख़्त पर चलने के विपरीत था। मान लीजिए कि कड़े का 1 इंच व्यास है, जबकि तख़्त 12 इंच चौड़ा है। 5 लोगों को रस्सी के सहारे चलने के लिए कहा गया और 5 को तख्ती चलने के लिए कहा गया। हमें निम्नलिखित परिणाम मिले:

रस्सी (इंच) के किनारे (या पक्ष) से ​​प्रत्येक चरण की औसत दूरी: 0.5, 0.2, 0.3, 0.6, 0.1

तख़्त (इंच) के किनारे (या किनारे) से प्रत्येक चरण की औसत दूरी: 5.5, 5.2, 5.3, 5.6, 5.6

जैसे आपके उदाहरण में, यह उदाहरण समान मानक विचलन का परिणाम देगा क्योंकि तख़्त के लिए मान केवल कसौटी के लिए उन लोगों के लिए +5 का अंतर है। हालाँकि, अगर मैंने आपसे कहा कि प्रत्येक प्रयोग के लिए मानक विचलन 0.2074 था, तो आप अच्छी तरह से कह सकते हैं कि दोनों प्रयोग बराबर थे। हालांकि, अगर मैंने आपसे कहा कि तख्तापलट के लिए सीवी 4% से 4% कम है, तो आप मुझे यह पूछने के लिए प्रेरित कर सकते हैं कि कितने लोग रस्सी से गिर गए।


0

सीवी एक सापेक्ष परिवर्तनशीलता है जिसका उपयोग विभिन्न नमूना डेटासेट की परिवर्तनशीलता की तुलना करने के लिए किया जाता है। आपके उदाहरण के लिए, छोटे माध्य के साथ समान मानक विचलन / विचरण एक छोटा सीवी उत्पन्न करेगा। यह इंगित करता है कि छोटे सीवी डाटासेट में छोटे सापेक्ष परिवर्तनशीलता है। मान लें कि आप १०००० मासिक कमाते हैं, और मैं १०० कमाता हूं। (भिन्न अर्थ) हम सभी शायद १०० मासिक (व्रीकरण) खो देते हैं, मैं आपसे बहुत अधिक आहत होऊंगा क्योंकि मुझे आपके ०.०१ की तुलना में बड़ा सीवी (cv = १) मिलता है, रिश्तेदार अधिक भिन्नता।


1
मेरा कहना है कि यह मौजूदा उत्तरों में कुछ भी नहीं जोड़ता है।
निक कॉक्स

0

इस स्थिति में, परिणाम बताने के लिए cv सही सांख्यिकीय उपकरण नहीं है।

इसलिए किए गए शोध की प्रकृति के आधार पर, उद्देश्य के लिए शोधकर्ता के पास एक विशिष्ट परिकल्पना या बिंदु है। उसे सबसे अच्छा और उपयुक्त सांख्यिकीय उपकरण का उपयोग करके डेटा को डिजाइन, निष्पादित करना और विश्लेषण करना होगा अर्थात यदि प्रयोग समूह 1 और समूह 2 के विकास की तुलना करना है, हालांकि दोनों का cv एक ही है, लेकिन T- परीक्षण या युग्मित T- का उपयोग करना परीक्षण या एनोवा (बड़ा प्रयोग) यह आसानी से दोनों समूह के बीच के अंतर को साबित कर सकता है।

यहां कुंजी परिणाम के बारे में एक सार्थक विवरण देने के लिए उपयुक्त सांख्यिकीय उपकरण को लागू करना है। याद रखें cv, Descriptive statistic में से एक है।

मेरे 2 सेंट

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.