QQ प्लॉट को मात्रा देना


10

Qq- प्लॉट का उपयोग यह देखने के लिए किया जा सकता है कि समान दो वितरण कैसे हैं (जैसे वितरण की समानता को एक सामान्य वितरण के लिए कल्पना करना, लेकिन दो आर्टवर्क डेटा वितरण की तुलना करना भी)। क्या कोई आँकड़े हैं जो एक अधिक उद्देश्य, संख्यात्मक माप उत्पन्न करते हैं जो उनकी समानता का प्रतिनिधित्व करते हैं (अधिमानतः एक सामान्यीकृत (0 <= x <= 1) रूप में)? Gini गुणांक उदाहरण के लिए अर्थशास्त्र में उपयोग किया जाता है जब लोरेंज वक्रों के साथ काम करते हैं; क्या QQ- प्लॉट्स के लिए कुछ है?

जवाबों:


8

जैसा कि मैं आपके पिछले प्रश्न पर आपकी टिप्पणी के जवाब में कहता हूं, कोलमोगोरोव-स्मिरनोव परीक्षण देखें। यह दो संचयी वितरण कार्यों के बीच अधिकतम निरपेक्ष दूरी का उपयोग करता है (वैकल्पिक रूप से क्यूक्यू प्लॉट में वक्र की अधिकतम निरपेक्ष दूरी 45 डिग्री लाइन से) के रूप में एक आँकड़ा के रूप में। केएस परीक्षण आर में पाया जा सकता है ks.test()'सांख्यिकी' पुस्तकालय में कमांड का उपयोग कर । इसके आर उपयोग के बारे में अधिक जानकारी यहाँ दी गई है।


ध्यान दें कि (जैसा कि मैं इसे समझता हूं), केएस परीक्षण एक प्राथमिकता वितरण के खिलाफ अनुभवजन्य डेटा के परीक्षण के लिए है। यह दो अनुभवजन्य वितरणों की तुलना करने के लिए उपयुक्त नहीं है, और न ही यह एक प्राथमिक वितरण के खिलाफ अनुभवजन्य डेटा की तुलना करने के लिए उपयुक्त है, जिनके पैरामीटर मानों का अनुभवजन्य डेटा से अनुमान लगाया गया था।
माइक लॉरेंस

4
@ माइक, आप दो समान रूप से व्युत्पन्न वितरणों की तुलना करने के लिए केएस परीक्षण का उपयोग कर सकते हैं, चार्ली के पूर्व उत्तर और टिप्पणियों के आँकड़े
एंडी डब्ल्यू

@Andy, आह, मैंने itl.nist.gov/div898/handbook/eda/section3/eda35g.htm से बिंदु 3 लिया, क्योंकि आप दो अनुभवजन्य CDFs की तुलना नहीं कर सकते हैं, लेकिन मुझे लगता है कि मेरी धारणा नहीं थी उचित। जानकर अच्छा लगा, धन्यवाद!
माइक लॉरेंस

2
हालाँकि, बिंदु 3 का अर्थ है कि आप यह जांचने के लिए केएस का उपयोग नहीं कर सकते हैं कि आपका डेटा सामान्य वितरण से आया है और डेटा से अनुमानित एसडी । यह मेरे द्वारा मिलने वाले मनोविज्ञान के छात्रों के बीच एक लोकप्रिय त्रुटि है।
स्टीफन कोलासा

1
(+1) इस उत्तर का श्रेष्ठ पहलू यह है कि केएस आँकड़ा को क्यूक्यू प्लॉट से सीधे पढ़ा जा सकता है।
whuber

2

मैंने हाल ही में अनुभवजन्य सीडीएफ और फिटेड सीडीएफ के बीच सहसंबंध का इस्तेमाल अच्छाई-की-फिट करने के लिए किया है, और मुझे आश्चर्य है कि क्या यह दृष्टिकोण वर्तमान मामले में भी उपयोगी हो सकता है, जैसा कि मैं समझता हूं कि इसमें दो अनुभवजन्य डेटा सेटों की तुलना करना शामिल है। यदि सेट के बीच भिन्न संख्या में अवलोकन हों तो इंटरपोलेशन आवश्यक हो सकता है।


आपके पेपर में बहुत अच्छे आंकड़े शामिल हैं :)
chl

@chi: वे सभी ggplot2 का उपयोग करके R में बनाए गए थे। यह एक शानदार ग्राफिक्स उत्पादन प्रणाली है!
माइक लॉरेंस

सज्जित सीडीएफ से आपका क्या अभिप्राय है?
एम्पलफॉथ

@Ampleforth, उस कागज में, मैं अनुभवजन्य डेटा के लिए एक वितरण फिट बैठता हूं, इसलिए "फिट सीडीएफ" से मेरा मतलब फिटेड वितरण का सैद्धांतिक सीडीएफ है। क्षमा करें, मैं देखता हूं कि मैं और अधिक स्पष्ट कैसे हो सकता था!
माइक लॉरेंस

ओह, कृपया माफी न मांगें। मेरे आँकड़ों की कमी बड़ी है और यहाँ केवल यही समस्या है;) इसके अलावा मैंने आपका पेपर नहीं पढ़ा, लेकिन केवल आपके ग्राफ़ के माध्यम से ही नज़र आया, जो मुझे बहुत पसंद था।
एम्पलॉफ

1

मैं कहूंगा कि दो वितरणों की तुलना करने के लिए अधिक या कम विहित तरीका ची-स्क्वेर्ड परीक्षण होगा। हालाँकि, आँकड़ा सामान्यीकृत नहीं है, और यह इस बात पर निर्भर करता है कि आप डिब्बे का चुनाव कैसे करते हैं। अंतिम बिंदु को निश्चित रूप से एक विशेषता के रूप में देखा जा सकता है, बग नहीं: उदाहरण के लिए, वितरण के बीच की तुलना में पूंछ में समानता के लिए उचित रूप से देखने के लिए आपको डिब्बे को चुनना उचित रूप से अनुमति देता है।


1

क्यूक्यू प्लॉट में रैखिकता के लिए "निकटता" का एक बहुत ही सीधा माप एक शापिरो-फ्रांसिया टेस्ट स्टेटिस्टिक होगा (जो बेहतर ज्ञात शपीरो-विल्क से निकटता से संबंधित है और इसे एक साधारण सन्निकटन माना जा सकता है)।

Shapiro-Francia आँकड़ा क्रमबद्ध डेटा मानों और अपेक्षित सामान्य क्रम आँकड़ों (कभी-कभी "सैद्धांतिक मात्रा" के रूप में लेबल किए गए) के बीच का सहसंबद्ध सहसंबंध होता है - अर्थात, यह कथानक का वर्ग होना चाहिए जिसे आप कथानक में देखते हैं, एक बहुत ही सीधा सारांश उपाय।

(शापिरो-विल्क समान है, लेकिन ऑर्डर के आंकड़ों के बीच सहसंबंधों को ध्यान में रखता है; इसकी शापिरो-फ्रांसिया के समान व्याख्या है और क्यूक्यू भूखंड के सारांश के रूप में बहुत समान रूप से उपयोगी है।)

किसी भी तरह से, क्यूक्यू प्लॉट को दर्शाता है की एक भी संख्या सारांश के लिए, उनमें से एक प्लॉट को संक्षेप में प्रस्तुत करने का एक उपयुक्त तरीका हो सकता है।

1W'

[कभी कभी मैं गुणा ( 1 - डब्ल्यू ' ) के साथ छोटा हो जाता है nn1-डब्ल्यू')nn(1-डब्ल्यू')nnnलॉग(n)लॉग(n)n

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.