+1 से @NickSabbe, 'प्लॉट सिर्फ आपको बताता है कि "कुछ गलत है", जो अक्सर क्यूक-प्लॉट का उपयोग करने का सबसे अच्छा तरीका है (क्योंकि यह समझना मुश्किल है कि उन्हें कैसे समझा जाए)। हालांकि, यह कैसे बनाया जाए, इस बारे में सोचकर एक qq- प्लॉट की व्याख्या करना सीखना संभव है।
आप अपने डेटा को क्रमबद्ध करके शुरू करेंगे, फिर आप न्यूनतम मूल्य से प्रत्येक को समान प्रतिशत के रूप में अपना रास्ता गिनाएंगे। उदाहरण के लिए, यदि आपके पास 20 डेटा बिंदु थे, जब आपने पहले एक (न्यूनतम) की गणना की थी, तो आप अपने आप से कहेंगे, 'मैंने अपने डेटा का 5% गिना था।' आप इस प्रक्रिया का पालन तब तक करेंगे जब तक आप अंत तक नहीं पहुंच जाते, जिस बिंदु पर आप अपने डेटा के 100% से गुजर चुके होंगे। इन प्रतिशत मानों की तुलना तत्कालीन सामान्य से समान प्रतिशत मानों से की जा सकती है (अर्थात, समान माध्य और SD के साथ सामान्य)।
जब आप इन्हें प्लॉट करने जाते हैं, तो आपको पता चलता है कि आपको अंतिम मूल्य से परेशानी है, जो कि 100% है, क्योंकि जब आप 100% सैद्धांतिक सामान्य से गुज़रे हैं तो आप 'इनफिनिटी' में हैं। प्रतिशत की गणना करने से पहले अपने डेटा में प्रत्येक बिंदु पर हर में एक छोटे से निरंतर जोड़कर इस समस्या से निपटा जाता है। एक विशिष्ट मान हर में 1 जोड़ना होगा; उदाहरण के लिए, आप अपने 1 (20 का) डेटा बिंदु 1 / (20 + 1) = 5% कहेंगे, और आपका अंतिम 20 / (20 + 1) = 95% होगा। अब यदि आप एक सामान्य सैद्धांतिक के विपरीत इन बिंदुओं को प्लॉट करते हैं, तो आपके पास एक पीपी-प्लॉट होगा(संभावनाओं के खिलाफ संभावनाओं की साजिश रचने के लिए)। इस तरह की साजिश आपके वितरण के बीच के विचलन और वितरण के केंद्र में एक सामान्य स्थिति को दर्शाती है। ऐसा इसलिए है क्योंकि एक सामान्य वितरण का 68% +/- 1 एसडी के भीतर है, इसलिए पीपी-प्लॉट का उत्कृष्ट समाधान है, और कहीं और खराब संकल्प। (इस बिंदु पर अधिक जानकारी के लिए, यहां मेरे उत्तर को पढ़ने में मदद मिल सकती है: पीपी-प्लॉट्स बनाम क्यूक्यू-प्लॉट्स ।)
अक्सर, हम सबसे अधिक चिंतित हैं कि हमारे वितरण की पूंछ में क्या हो रहा है। वहां बेहतर रिज़ॉल्यूशन प्राप्त करने के लिए (और इस तरह बीच में बदतर रिज़ॉल्यूशन), हम इसके बजाय qq- प्लॉट का निर्माण कर सकते हैं । हम अपनी संभावनाओं के सेट को ले कर और उन्हें सामान्य वितरण के CDF के व्युत्क्रम से गुजारते हैं (यह एक आँकड़ों की किताब के पीछे z- टेबल को पढ़ने की तरह है - आप एक संभाव्यता में पढ़ते हैं और एक z पढ़ते हैं- स्कोर)। इस ऑपरेशन का परिणाम क्वांटाइल्स के दो सेट हैं , जो एक दूसरे के खिलाफ इसी तरह साजिश रच सकते हैं।
@whuber सही है कि संदर्भ रेखा बाद में (आमतौर पर) सबसे अच्छी फिटिंग लाइन को 50% बिंदुओं के माध्यम से (यानी, पहले चतुर्थक से तीसरे तक) के द्वारा प्लॉट की जाती है। यह कथानक को पढ़ने में आसान बनाने के लिए किया जाता है। इस पंक्ति का उपयोग करके, आप प्लॉट की व्याख्या यह दिखा सकते हैं कि क्या आपके वितरण की मात्राएँ उत्तरोत्तर सामान्य से भिन्न होती हैं, जैसे आप पूंछ में जाते हैं। (ध्यान दें कि केंद्र से आगे बिंदुओं की स्थिति वास्तव में उन करीबियों से स्वतंत्र नहीं है; इसलिए तथ्य यह है कि, आपके विशिष्ट हिस्टोग्राम में, 'कंधों' के अलग होने के बाद पूंछ एक साथ आती है, इसका मतलब यह नहीं है कि मात्राएँ अब फिर से वही हैं।)
आप किसी प्लॉट किए गए बिंदु के लिए तुलना की गई कुल्हाड़ियों से पढ़े गए मूल्यों पर विचार करके एक क्यू-प्लॉट को विश्लेषणात्मक रूप से व्याख्या कर सकते हैं। यदि डेटा को एक सामान्य वितरण द्वारा अच्छी तरह से वर्णित किया गया था, तो मान उसी के बारे में होना चाहिए। उदाहरण के लिए, बहुत दूर नीचे के कोने पर चरम बिंदु लें: इसका मान कहीं-कहीं अतीत , लेकिन इसका मान केवल थोड़ा अतीत , इसलिए यह 'इसे' की तुलना में बहुत अधिक है। सामान्य तौर पर, क्यूक-प्लॉट की व्याख्या करने के लिए एक सरल रूब्रिक यह है कि यदि किसी दिए गए पूंछ को संदर्भ रेखा से वामावर्त घुमाते हैं, तो आपके वितरण की उस पूंछ में एक सैद्धांतिक सामान्य की तुलना में अधिक डेटा होता है, और यदि कोई पूंछ दक्षिणावर्त घुमाती है। है कम- 3 y - 2x−3y−.2सैद्धांतिक सामान्य की तुलना में आपके वितरण की उस पूंछ में डेटा। दूसरे शब्दों में:
- यदि दोनों पूंछ वामावर्त मोड़ लें तो आपके पास भारी पूंछ ( लेप्टोकार्टोसिस ) है,
- यदि दोनों घड़ी की दिशा में मुड़ते हैं, तो आपके पास हल्की पूंछ (प्लैटीक्यूरोसिस) होती है,
- अगर आपकी दाहिनी पूंछ मुड़ जाती है, तो वामावर्त और आपकी बाईं पूंछ, दक्षिणावर्त मुड़ जाती है, तो आपके दाहिने तिरछा है
- यदि आपकी बाईं पूंछ मुड़ जाती है तो वामावर्त और आपकी दाईं पूंछ घड़ी की दिशा में मुड़ जाती है, आपने तिरछा छोड़ दिया है