QQ कथानक व्याख्या


12

निम्नलिखित कोड और आउटपुट पर विचार करें:

  par(mfrow=c(3,2))
  # generate random data from weibull distribution
  x = rweibull(20, 8, 2)
  # Quantile-Quantile Plot for different distributions
  qqPlot(x, "log-normal")
  qqPlot(x, "normal")
  qqPlot(x, "exponential", DB = TRUE)
  qqPlot(x, "cauchy")
  qqPlot(x, "weibull")
  qqPlot(x, "logistic")

यहाँ छवि विवरण दर्ज करें

ऐसा लगता है कि लॉग-नॉर्मल के लिए क्यूक्यू प्लॉट लगभग वैबुल के लिए क्यूक्यू प्लॉट के समान है। हम उन्हें कैसे भेद कर सकते हैं? इसके अलावा यदि अंक दो बाहरी काली रेखाओं द्वारा परिभाषित क्षेत्र के भीतर हैं, तो क्या यह इंगित करता है कि वे निर्दिष्ट वितरण का पालन करते हैं?


मेरा मानना ​​है कि आप कार पैकेज का उपयोग कर रहे हैं , क्या आप नहीं हैं? यदि हां, तो आपको library(car)अपने कोड में कथन को शामिल करना चाहिए ताकि लोगों का अनुसरण करना आसान हो सके। सामान्य तौर पर, आप set.seed(1)उदाहरण के लिए प्रतिलिपि प्रस्तुत करने योग्य बनाने के लिए बीज (जैसे ) सेट करना चाह सकते हैं , ताकि कोई भी आपके द्वारा प्राप्त किए गए डेटा बिंदुओं को ठीक से प्राप्त कर सके, हालांकि यह शायद उतना महत्वपूर्ण नहीं है।
गूँग - मोनिका

2
यह लिखित रूप में मेरे कंप्यूटर पर नहीं चलेगा। उदाहरण के लिए, कार पैकेज से qqPlot लॉग-सामान्य के लिए सामान्य और lnorm के लिए आदर्श चाहता है। मैं क्या खो रहा हूँ?
टॉम

2
@, मैं पैकेज के बारे में गलत था। जाहिर है, यह qualityTools पैकेज है। इसके अलावा, उदाहरण यहां से लिया गया लगता है
गूँग - मोनिका

एक दिलचस्प विकल्प कुलेन और फ्रे का ग्राफ है, उदाहरण के लिए , आँकड़े देखें ।stackexchange.com/questions/243973/…
kjetil b halvorsen

जवाबों:


12

यहाँ कुछ बातें कही जानी हैं:

  1. के लिए CDF के आकार लॉग-सामान्य की CDF के आकार के समान के लिए पर्याप्त है वेइबुल उन्हें कठिन वेइबुल और दूसरों के बीच समानता के स्तर से अलग करने के लिए बनाने के लिए।
  2. बाहरी काली रेखाएँ एक विश्वास बैंड बनाती हैं । इंट्रेंस बैंड में विश्वास बैंड का उपयोग फ़्रीक्वेंटिस्ट स्टैटिस्टिकल इंफ़ेक्शन के किसी भी अन्य मानक रूप के समान है। जब मान बैंड के भीतर आते हैं, हम अशक्त परिकल्पना को अस्वीकार नहीं कर सकते कि वितरित वितरण सही है। यह कहने के समान नहीं है कि हम जानते हैं कि वितरित वितरण सही है। (ध्यान दें कि इस बात का एक बड़ा उदाहरण है कि मैंने यहां एक अन्य जवाब में चर्चा की, जहां स्थिति परिकल्पना परीक्षण पर फिशरियन परिप्रेक्ष्य नेमैन-पीयरसन के लिए बेहतर होगा।)
  3. N

क्या छोटे नमूना आकारों के वितरण के परीक्षण के लिए तरीके हैं?
प्रोटॉन

वास्तव में ऐसा लगता है कि अंक सभी वितरणों के लिए विश्वास बैंड में निहित हैं। इसलिए हम वितरण में अंतर नहीं कर सकते?
प्रोटॉन

1
n=205%

2
छोटे नमूने के आकार पर +1। 300 नमूनों का उपयोग करने से चीजों को बहुत अलग करने में मदद मिलेगी। प्रोटॉन: नहीं, आप वास्तव में एक छोटे नमूने के साथ वितरण को अलग नहीं कर सकते। आप कैसे कर सकते हैं? यह 20 पिक्सेल के साथ एक चेहरे की पहचान करने की कोशिश कर रहा है।
वेन

3

ऐसा लगता है कि लॉग-नॉर्मल के लिए क्यूक्यू प्लॉट लगभग वैबुल के लिए क्यूक्यू प्लॉट के समान है।

हाँ।

हम उन्हें कैसे भेद कर सकते हैं?

उस नमूने के आकार पर, आप संभावना नहीं कर सकते।

इसके अलावा यदि अंक दो बाहरी काली रेखाओं द्वारा परिभाषित क्षेत्र के भीतर हैं, तो क्या यह इंगित करता है कि वे निर्दिष्ट वितरण का पालन करते हैं?

यह केवल इंगित करता है कि आप डेटा के वितरण को उस वितरण से अलग नहीं बता सकते। यह एक अंतर के सबूत की कमी है, अंतर की कमी का सबूत नहीं है।

आप लगभग निश्चित हो सकते हैं कि डेटा एक वितरण से हैं जो आपके द्वारा माना गया कोई भी नहीं है (यह उन लोगों में से किसी के साथ बिल्कुल क्यों होगा ?)।


इस वाक्यांश की तरह: "यह एक अंतर के सबूत की कमी है, अंतर की कमी का सबूत नहीं है।"
jlandercy
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.