अंतर सारांश आँकड़े हैं: Gini गुणांक और मानक विचलन


12

कई सारांश आँकड़े हैं। जब आप एक वितरण के प्रसार का वर्णन करना चाहते हैं तो आप मानक विचलन या गिन्नी गुणांक के लिए उपयोग कर सकते हैं ।

मुझे पता है कि मानक विचलन केंद्रीय प्रवृत्ति, मतलब से विचलन, और Gini फैलाव के एक सामान्य माप पर आधारित है। मुझे यह भी पता है कि गिन्नी गुणांक की निचली और ऊपरी सीमा [0 1] है, और मानक विचलन नहीं करता है । इन गुणों को जानना अच्छा है, लेकिन मानक विचलन क्या अंतर्दृष्टि दे सकते हैं कि गिन्नी वर्सा नहीं ले सकती है और क्या नहीं कर सकती है? अगर मुझे दोनों में से किसी एक का उपयोग करने के लिए चुनना था, तो जानकारीपूर्ण और व्यावहारिक होने की तुलना में दूसरे की तुलना में एक का उपयोग करने के क्या फायदे हैं।


1
आपके पास टैग्स का एक अजीब विकल्प था। मैंने उन्हें संपादित किया।
अमीबा

जवाबों:


8

दो बातों पर विचार करें

Gini स्वतंत्र है, जबकि SD मूल इकाइयों में है

मान लीजिए कि हमारे पास ऊपर और नीचे एक माप है। यदि एसडी माप अधिकतम सीमा पर है, तो अधिकतम अधिकतम मूल्य पर है, जबकि गिन्नी अधिकतम पर एक सीमा पर एक है और बाकी सभी दूसरे पर है।


क्या आपको लगता है कि मेटा-एनालिसिस में एकाग्रता / विषमता के लिए हम गिन्नी के उपयोग का विस्तार कर सकते हैं? यह विषमता में एकाग्रता की मात्रा निर्धारित करने के साधन के रूप में दिलचस्प हो सकता है ...
जो_ May४

1
चूंकि धारणा यह है कि प्रभाव सामान्य हैं, तो नहीं। लेकिन मुझे लगता है कि एक पूरी चर्चा इस विषय में ऑफ-टॉपिक है
mdewey

@mdewey अंतिम वाक्य असंवेदनशील था और इससे मुझे सबसे ज्यादा मदद मिली। धन्यवाद!
ओलिवियर_स_ज

@mdewey मैंने कुछ कोड के साथ खुद का परीक्षण किया, लेकिन क्या कहीं एक प्रकाशन इस पर चर्चा कर रहा है? या एक प्रमाण? (मैं आखिरी वाक्य की बात कर रहा हूं)
ओलिवियर_स_ज

@ विकिपीडिया लेख en.wikipedia.org/wiki/Gini_coefficient कुशल है।
mdewey

10

गिन्नी गुणांक पैमाने पर अपरिवर्तनीय है और बाध्य है, एक बदलाव के लिए मानक विचलन अपरिवर्तित है, और अनबाउंड, इसलिए उन्हें सीधे तुलना करना मुश्किल है। अब आप माध्य (भिन्नता के गुणांक) से विभाजित करके, मानक विचलन के पैमाने-अपरिवर्तनीय संस्करण को परिभाषित कर सकते हैं।

हालांकि, गिन्नी इंडेक्स अभी भी मूल्यों पर आधारित है, दूसरा चुकता मूल्यों पर आधारित है, इसलिए आप आउटलेर्स (अत्यधिक कम या उच्च मूल्यों) से प्रभावित होने वाले दूसरे की इच्छा करेंगे। यह आय असमानता के उपायों में पाया जा सकता है , F De Maio, 2007:

आय असमानता के इस उपाय की गणना आय के वितरण के मानक विचलन को उसके माध्यम से विभाजित करके की जाती है। अधिक समान आय वितरण में छोटे मानक विचलन होंगे; जैसे, सीवी अधिक समान समाजों में छोटा होगा। असमानता के सबसे सरल उपायों में से एक होने के बावजूद, सीवी का उपयोग सार्वजनिक स्वास्थ्य साहित्य में काफी सीमित रहा है और इसने आय असमानता की परिकल्पना पर शोध नहीं किया है। यह सीवी माप की महत्वपूर्ण सीमाओं के लिए जिम्मेदार ठहराया जा सकता है: (1) इसमें ऊपरी सीमा नहीं है, जिनी गुणांक के विपरीत, 18 व्याख्या करना और तुलना करना कुछ अधिक कठिन है; और (2) सीवी के दो घटक (माध्य और मानक विचलन) असमान रूप से कम या उच्च आय मूल्यों से प्रभावित हो सकते हैं। दूसरे शब्दों में,

इसलिए भिन्नता का गुणांक कम मजबूत है, और फिर भी अबाधित है। एक और कदम उठाने के लिए, आप माध्य को हटा सकते हैं, और इसके बजाय पूर्ण विचलन द्वारा विभाजित कर सकते हैं ( )। एक कारक पर, आप एक मानक अनुपात के साथ समाप्त होते हैं , जिसे सदिश वेक्टर, लिए बाध्य किया जा सकता है। ।1 / 2 एन 2 ( एक्स ) 1 ( एक्स ) 1(xm)=|xnm|1/2N2(x)1(x)N2(x)

अब आपके पास इंडेक्स और मानक अनुपात के साथ वितरण स्पार्सिटी के दो दिलचस्प उपाय, स्केल-इनवेरिएंट और बाउंड हैं।1/2

उनकी तुलना स्पार्सिटी , 2009 के तुलनात्मक माप में की जाती है । विभिन्न प्राकृतिक स्पर्सिटी गुणों (रॉबिन हुड, स्केलिंग, राइजिंग टाइड, क्लोनिंग, बिल गेट्स और शिशुओं) के खिलाफ परीक्षण किया गया, गिनी इंडेक्स सबसे अच्छा है। लेकिन इसका आकार हानि फ़ंक्शन के रूप में उपयोग करना मुश्किल बनाता है, और इस संदर्भ में नियमित संस्करणों का1/2 उपयोग किया जा सकता है।

इसलिए जब तक आप लगभग गौसियन वितरण को चिह्नित नहीं करना चाहते हैं, यदि आप एक स्पार्सिटी मापना चाहते हैं, तो गिन्नी इंडेक्स का उपयोग करें, यदि आप विभिन्न मॉडलों के बीच स्पार्सिटी को बढ़ावा देना चाहते हैं, तो आप इस तरह के एक मानक अनुपात की कोशिश कर सकते हैं।

अतिरिक्त व्याख्यान: गिन्नी के अंतर में अंतर: गैर-सामान्य वितरण के लिए परिवर्तनशीलता का एक बेहतर उपाय , श्लोमो यित्जाकी, 2003, जिसका सार ब्याज से प्रकट हो सकता है:

परिवर्तनशीलता के सभी उपायों में से, विचरण सबसे लोकप्रिय है। इस पत्र का तर्क है कि Gini का माध्य अंतर (GMD), परिवर्तनशीलता का एक वैकल्पिक सूचकांक, विचरण के साथ कई गुण साझा करता है, लेकिन सामान्यता से विदा होने वाले वितरण के गुणों के बारे में अधिक जानकारीपूर्ण हो सकता है


1

मानक विचलन का एक पैमाना (कहते हैं, ° K, मीटर, mmHg, ...) है। आमतौर पर, यह इसके परिमाण के हमारे निर्णय को प्रभावित करता है। इसलिए हम मानक त्रुटि के आधार पर भिन्नता के गुणांक या उससे भी बेहतर (कम परिमित नमूने) को प्राथमिकता देते हैं।

गिन्नी गुणांक का निर्माण (स्केललेस) प्रतिशत मूल्यों पर किया जाता है और इस प्रकार इसकी अपनी इकाई (जैसे मच संख्या) पर कोई पैमाना नहीं होता है। यदि आप कुछ सामान्य (100% के शेयरों) पर शेयरों की समानता की तुलना करना चाहते हैं तो Gini गुणांक का उपयोग करें। ध्यान दें कि इस एप्लिकेशन के लिए मानक विचलन का भी उपयोग किया जा सकता है, इसलिए मुझे लगता है कि लाभ और नुकसान की तुलना करने के लिए आपका प्रश्न केवल इस तरह के आवेदन पर लागू होता है। इस मामले में, मानक विचलन भी लिए बाध्य होगा । दोनों संकेतक (गैर-नकारात्मक) शेयरों की संख्या पर निर्भर करते हैं लेकिन एक विपरीत दिशा में: जैसे-जैसे संख्या बढ़ती है, मानक विचलन घटता जाता है।[0,1]

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.