मुख्य कार्यकारी अधिकारी सारांश
इतिहास बहुत लंबा है और कई लोगों की तुलना में यह अधिक जटिल है।
कार्यकारी सारांश
Tukey जिसे बॉक्स प्लॉट कहा जाता है, उसका इतिहास इस बात से उलझा हुआ है कि अब अक्सर डॉट या स्ट्रिप प्लॉट (दर्जनों अन्य नाम) कहा जाता है और अनुभवजन्य मात्रात्मक फ़ंक्शन के अभ्यावेदन के साथ।
व्यापक रूप से मौजूदा रूपों में बॉक्स भूखंडों को जॉन वाइल्डर टुके (1970, 1972, 1977) के काम के माध्यम से जाना जाता है।
लेकिन माध्यिका और चतुर्थांश को मूल सारांश के रूप में दिखाने का विचार - एक साथ अक्सर लेकिन हमेशा सभी मूल्यों को दर्शाने वाले डॉट्स के साथ नहीं - भौगोलिक रूप से पर्सी रॉबर्ट क्रो (1933) द्वारा शुरू किए गए कम से कम फैलाव आरेख (कई प्रकार के नाम) पर वापस जाता है। ये भूगोलविदों के लिए मुख्य किराया थे और 1930 के दशक के उत्तरार्ध से कई पाठ्य पुस्तकों के साथ-साथ शोध पत्रों में भी इस्तेमाल किए गए थे।
बिब्बी (1986, पीपी.56, 59) ने 1897 के बारे में अपने व्याख्यान में और आर्थर लियोन बोले (बाद में सर आर्थर) द्वारा पढ़ाए गए इसी तरह के विचारों के संदर्भ में भी अपनी सिफारिश (बॉली, 1910, पी.62; 1952, पी। 7 .3) दिए। ) ग्राफिकल सारांश के आधार के रूप में न्यूनतम और अधिकतम और 10, 25, 50, 75 और 90% अंक का उपयोग करने के लिए।
चरम सीमा और चौकड़ी दिखाने वाले रेंज बार अक्सर मैरी एलीनॉर स्पीयर (1952) के लिए जिम्मेदार होते हैं, लेकिन मेरे पढ़ने में केनेथ डब्ल्यू हैमर (1948) को कम लोग उद्धृत करते हैं। 1950 के आसपास अमेरिकी सांख्यिकीविद् में सांख्यिकीय ग्राफिक्स पर हैमर के लेख आविष्कारशील थे और महत्वपूर्ण काटने और फिर से पढ़ने के लायक हैं। (कई पाठक jstor.org के माध्यम से उन्हें एक्सेस करने में सक्षम होंगे।) इसके विपरीत स्पीयर की किताबें (स्पीयर 1969 एक रिहाश है) अभिनव या विद्वानों के बजाय सुलभ और समझदार लेकिन जानबूझकर परिचयात्मक थीं।
बॉक्स भूखंडों के वेरिएंट जिसमें व्हिस्की का चयन चयनित प्रतिशत तक होता है, बहुत से लोगों को लगता है कि यह सामान्य है। फिर, 1930 के दशक से भूगोलविदों द्वारा समतुल्य भूखंडों का उपयोग किया गया था।
बॉक्स प्लॉट्स के टुकी के संस्करण में जो सबसे अधिक मूल है, वह है अलग-अलग प्लॉट किए जाने वाले पूंछों में बिंदुओं की पहचान करने के लिए सभी मानदंड पहले हैं और विस्तृत विचार के योग्य हैं - और अक्सर यह दर्शाता है कि एक परिवर्तनीय पैमाने पर एक चर का विश्लेषण किया जाना चाहिए। अंगूठे का उनका 1.5 IQR नियम बहुत प्रयोग के बाद ही सामने आया। इसने कुछ बिंदुओं में डेटा बिंदुओं को हटाने के लिए एक कठिन नियम के लिए उत्परिवर्तन किया है, जो कि कभी भी तुकी का इरादा नहीं था। एक छिद्रपूर्ण, यादगार नाम - बॉक्स प्लॉट - ने इन विचारों के अधिक व्यापक प्रभाव को सुनिश्चित करने में कोई नुकसान नहीं पहुंचाया। इसके विपरीत फैलाव आरेख बल्कि सुस्त और अस्पष्ट शब्द है।
यहाँ संदर्भों की काफी लंबी सूची है, संभवतः दिखावे के विपरीत, न कि संपूर्ण होने का इरादा। उद्देश्य बस कुछ साजिशकर्ताओं और बॉक्स प्लॉट के विकल्पों के लिए प्रलेखन प्रदान करना है। विशिष्ट संदर्भ विस्तृत प्रश्नों के लिए सहायक हो सकते हैं या यदि वे आपके क्षेत्र के करीब हैं। इसके विपरीत, अन्य क्षेत्रों में प्रथाओं के बारे में सीखना सलामत हो सकता है। ग्राफिकल - न केवल कार्टोग्राफिक - भूगोलवेत्ताओं की विशेषज्ञता को अक्सर कम करके आंका गया है।
अधिक जानकारी
हाइब्रिड डॉट-बॉक्स भूखंडों का इस्तेमाल क्रो (1933, 1936), मैथ्यूज (1936), हॉग (1948), मॉन्कहाउस और विल्किंसन (1952), किसान (1956), ग्रेगरी (1963), हैमंड और मैकुलग (1974), लुईस द्वारा किया गया था। (1975), मैथ्यूज (1981), विल्किंसन (1992, 2005), एलिसन (1993, 2001), वाइल्ड एंड सेबर (2000), क्विन एंड केफ (2002), यंग एट अल। (2006) और हेंड्री और नीलसन (2007) और कई अन्य। मिलर (1953, 1964) भी देखें।
क्वार्टराइल्स के बहुत सारे आईक्यूआर के भीतर डेटा बिंदुओं के बजाय विशेष प्रतिशत के लिए व्हिस्कर्स को आकर्षित करना, क्लीवलैंड (1985) द्वारा जोर दिया गया था, लेकिन मैथ्यू (1936) और ग्रोव (1956) द्वारा प्रत्याशित किया गया था, जिन्होंने इंटरओक्टाइल रेंज को प्लॉट किया था, जिसका अर्थ पहले और बीच में था। सातवें अष्टक, साथ ही साथ श्रेणी और अंतःक्षेत्रीय सीमा। दरी (1963), जॉनसन (1975), हैरिस (1999), मायट (2007), मायट एंड जॉनसन (2009, 2011) और डेविनो एट अल। (2014) से पता चला है कि इसका मतलब न्यूनतम, चतुर्थक, मध्य और अधिकतम है। श्मिट (१ ९ ५४) ने मध्यिका, चतुर्थक और ५ और ९ ५% अंकों के साथ सारांश रेखांकन दिखाया। बेंटले (1985, 1988), डेविस (2002), स्पेंस (2007, 2014) और मोटुलस्की (2010, 2014, 2018) ने 5 और 95% अंकों के लिए व्हिस्की को साजिश रची। मॉर्गन और हेनरियन (1990, पीपी .221, 241), स्पेंस (2001, पी.36), और गोटेली और एलिसन (2004, 2013, पीपी.72, 110, 213,) 416) व्हिस्की को 10% और 90% अंक पर प्लॉट किया। हैरिस (1999) ने 5 और 95% और 10 और 90% अंक दोनों के उदाहरण दिखाए। ऑल्टमैन (1991, pp.34, 63) और ग्रीनकेयर (2016) ने व्हिस्कर्स को 2.5% और 97.5% अंक दिए। रीमन एट अल। (2008, pp.46-47) ने 5% और 95% और 2% और 98% अंक को व्हिस्की खिलाया।
परिजन (1979 ए, 1979 बी, 1982) हाइब्रिड बॉक्स और क्वांटाइल प्लॉट को क्वांटाइल-बॉक्स प्लॉट के रूप में देखा गया। यह भी देखें (उदाहरण के लिए) शेरा (1991), मिलिटकी और मेलौन (1993), मेलून और मिलिटकी (1994)। हालांकि, ध्यान दें कि कीन (2010) का क्वांटाइल बॉक्स प्लॉट सिर्फ एक बॉक्स प्लॉट है जिसमें मूंछ चरम सीमा तक फैली हुई है। इसके विपरीत, JMP के क्वांटाइल बॉक्स प्लॉट स्पष्ट रूप से 0.5%, 2.5%, 10%, 90%, 97.5%, 99.5% के निशान वाले बॉक्स भूखंड हैं: Sall et al देखें। (2014, पीपी.143-4)।
यहां क्वांटाइल-बॉक्स प्लॉट के वेरिएंट पर कुछ नोट्स दिए गए हैं।
pp,1−p−p,1−p
p,1−p
मेरे द्वारा देखे गए साहित्य से, ऐसा लगता है कि इनमें से कोई भी सूत्र - क्वांटाइल-बॉक्स प्लॉट या बाद के संस्करण (ए) (बी) (सी) - एक दूसरे का हवाला देते हैं।
!!! 3 अक्टूबर 2018 तक कुछ संदर्भों के लिए विवरण अगले संपादन में दिए जाने की आवश्यकता है।
ऑल्टमैन, डीजी 1991।
मेडिकल रिसर्च में प्रैक्टिकल स्टेटिस्टिक्स।
लंदन: चैपमैन और हॉल।
बेंटले, जेएल 1985. प्रोग्रामिंग मोती: चयन।
एसीएम 28: 1121-1127 के संचार ।
बेंटले, जेएल 1988.
अधिक प्रोग्रामिंग मोती: इकबालिया ऑफ ए कोडर।
पढ़ना, एमए: एडिसन-वेस्ले।
बिब्बी, जे 1986.
टीचिंग टू हिस्ट्री ऑफ़ टीचिंग स्टैटिस्टिक्स।
एडिनबर्ग: जॉन बिब्बी (पुस्तकें)।
बॉली, एएल 1910।
सांख्यिकी का एक प्राथमिक मैनुअल।
लंदन: मैकडोनाल्ड और इवांस। (सातवां संस्करण 1952)
क्लीवलैंड, डब्ल्यूएस 1985। ग्राफिंग डेटा के तत्व।
मोंटेरे, सीए: वड्सवर्थ।
क्रो, पीआर 1933. बारिश की संभावना का विश्लेषण: एक ग्राफिकल विधि और यूरोपीय डेटा के लिए इसका अनुप्रयोग।
स्कॉटिश भौगोलिक पत्रिका 49: 73-91।
क्रो, पीआर 1936. पश्चिमी मैदानों की वर्षा शासन।
भौगोलिक समीक्षा 26: 463-484।
डेविस, जेसी 2002।
भूविज्ञान में सांख्यिकी और डेटा विश्लेषण।
न्यूयॉर्क: जॉन विली।
डिकिंसन, GC 1963.
सांख्यिकी मानचित्रण और सांख्यिकी की प्रस्तुति।
लंदन: एडवर्ड अर्नोल्ड। (दूसरा संस्करण 1973)
दरी, जीएच 1963.
ईस्ट मिडलैंड्स एंड पीक।
लंदन: थॉमस नेल्सन।
किसान, बीएच 1956. सीलोन के शुष्क क्षेत्र में वर्षा और पानी की आपूर्ति। ब्रिटिश ट्रॉपिकल लैंड्स पर स्टील, आरडब्ल्यू और सीए फिशर (एड)
भौगोलिक निबंध।
लंदन: जॉर्ज फिलिप, 227-268।
ग्रेगरी, एस। 1963. सांख्यिकीय तरीके और भूगोलवेत्ता।
लंदन: लॉन्गमैन। (बाद के संस्करण 1968, 1973, 1978; प्रकाशक बाद में लोंगमैन)
ग्रोव, एटी 1956। नाइजीरिया में मिट्टी का क्षरण। ब्रिटिश ट्रॉपिकल लैंड्स पर स्टील, आरडब्ल्यू और सीए फिशर (एड)
भौगोलिक निबंध।
लंदन: जॉर्ज फिलिप, 79-111।
हैमर, KW 1948. रेंज-बार चार्ट।
अमेरिकी सांख्यिकीविद 2 (2): 23
हेंड्री, डीएफ और बी नीलसन। 2007.
अर्थमितीय मॉडलिंग: एक संभावना दृष्टिकोण।
प्रिंसटन, एनजे: प्रिंसटन यूनिवर्सिटी प्रेस।
हॉग, डब्ल्यूएच 1948. वर्षा फैलाव आरेख: उनके फायदे और नुकसान की चर्चा।
भूगोल 33: 31-37।
इब्रीक, एच। और एमजी मॉर्गन। 1987. गैर-तकनीकी लोगों के लिए अनिश्चित मात्रा का ग्राफिकल संचार।
जोखिम विश्लेषण 7: 519-529।
जॉनसन, BLC 1975.
बांग्लादेश। लंदन: हनीमैन एजुकेशनल।
कीन, केजे 2010.
आर।
बोका रत्न के साथ सांख्यिकी और डेटा विश्लेषण के लिए ग्राफिक्स , एफएल: सीआरसी प्रेस। (दूसरा संस्करण 2018)
लुईस, सीआर 1975. शहरी स्थिति में बदलाव का विश्लेषण: मिड-वेल्स और मध्य वेल्श सीमा क्षेत्र में एक केस अध्ययन।
इंस्टीट्यूट ऑफ ब्रिटिश ज्योग्राफर्स
64: 49-65 के लेनदेन ।
मार्टिनेज, डब्ल्यूएल, एआर मार्टिनेज़ और जेएल सोलका। 2011.
MATLAB के साथ खोजपूर्ण डेटा विश्लेषण।
बोका रैटन, FL: CRC प्रेस।
मैथ्यूज, एचए 1936। कुछ परिचित भारतीय वर्षा का एक नया दृश्य।
स्कॉटिश भौगोलिक पत्रिका 52: 84-97।
मैथ्यू, जेए 1981।
भूगोल के लिए मात्रात्मक और सांख्यिकीय दृष्टिकोण: एक व्यावहारिक मैनुअल।
ऑक्सफोर्ड: पेरगामन।
मेलौन, एम। और जे। मिलित्स्की। 1994. विश्लेषणात्मक रसायन विज्ञान में कंप्यूटर-सहायक डेटा उपचार। I. एकतरफा डेटा का खोजपूर्ण विश्लेषण।
रासायनिक कागज 48: 151-157।
मिलिटकी, जे। और एम। मेलून। 1993. अन्वेषी खोज डेटा विश्लेषण के लिए कुछ ग्राफिकल एड्स।
एनालिटिका चिमीका एक्टा 277: 215-221।
मिलर, एए 1953.
पृथ्वी की त्वचा।
लंदन: मेथुएन। (दूसरा संस्करण 1964)
मॉन्कहाउस, एफजे और एचआर विल्किंसन। 1952.
मैप्स और डायग्राम: उनका संकलन और निर्माण।
लंदन: मेथुएन। (बाद के संस्करण 1963, 1971)
मॉर्गन, एमजी और एम। हेनरियन। 1990.
अनिश्चितता: मात्रात्मक जोखिम और नीति विश्लेषण में अनिश्चितता से निपटने के लिए एक गाइड।
कैम्ब्रिज: कैम्ब्रिज यूनिवर्सिटी प्रेस।
मायट, जीजे 2007।
मेकिंग सेंस ऑफ डेटा: ए प्रैक्टिकल गाइड टू एक्सप्लोरेटरी डेटा एनालिसिस एंड डेटा माइनिंग।
होबोकेन, एनजे: जॉन विली।
मयाट, जीजे और जॉनसन, WP 2009.
डेटा बनाना नब्ज II: एक व्यावहारिक गाइड टू डेटा विज़ुअलाइज़ेशन, एडवांस्ड डेटा माइनिंग मेथड्स, और एप्लीकेशन।
होबोकेन, एनजे: जॉन विली।
मयाट, जीजे और जॉनसन, WP 2011।
मेकिंग सेंस ऑफ डेटा III: इंटरेक्टिव डेटा विज़ुअलाइज़ेशन डिजाइन करने के लिए एक व्यावहारिक गाइड।
होबोकेन, एनजे: जॉन विली।
ओटावे, बी। 1973. फैलाव आरेख: कार्बन -14 तिथियों के प्रदर्शन के लिए एक नया दृष्टिकोण।
पुरातत्व 15: 5-12।
परजन, ई। 1979 ए। गैरपारंपरिक सांख्यिकीय डेटा मॉडलिंग।
जर्नल, अमेरिकन सांख्यिकीय एसोसिएशन 74: 105-121।
परजन, ई। 1979 बी। मजबूत आकलन पर एक घनत्व-मात्रात्मक फ़ंक्शन परिप्रेक्ष्य। लूनर में, आरएल और जीएन विल्किंसन (एड) सांख्यिकी में मजबूत ।
न्यू यॉर्क: अकादमिक प्रेस, 237-258।
परजन, ई। 1982. डेटा मॉडलिंग का उपयोग करते हुए मात्रात्मक और घनत्व-मात्रात्मक फ़ंक्शन। टियागो डे ओलिवेरा, जे और एपस्टीन में, बी (एड्स)
सांख्यिकी में कुछ हालिया अग्रिम। लंदन: अकादमिक प्रेस, 23-52।
क्विन, जीपी और एमजे केओफ। 2002.
जीवविज्ञानियों के लिए प्रायोगिक डिजाइन और डेटा विश्लेषण।
कैम्ब्रिज: कैम्ब्रिज यूनिवर्सिटी प्रेस।
रीमन, सी।, पी। फिल्ज्मोसर, आरजी गैरेट और आर। दुतेर्ते। 2008.
सांख्यिकीय डेटा विश्लेषण समझाया: आर। के साथ लागू पर्यावरण सांख्यिकी
Chichester: जॉन विली।
सल्ल, जे।, ए। लेहमन, एम। स्टीफंस और एल। क्रिएटन। 2014.
जेएमपी स्टार्ट स्टैटिस्टिक्स: जेएमपी का उपयोग करते हुए सांख्यिकी और डेटा विश्लेषण के लिए एक गाइड।
कैरी, एनसी: एसएएस इंस्टीट्यूट।
शेरा, डीएम 1991। डेटा प्रस्तुति को बढ़ाने के लिए क्वांटाइल प्लॉट्स के कुछ उपयोग।
कम्प्यूटिंग विज्ञान और सांख्यिकी 23: 50-53।
स्पीयर, एमई 1952. चार्टिंग स्टेटिस्टिक्स।
न्यूयॉर्क: मैकग्रा-हिल।
स्पीयर, एमई 1969. प्रैक्टिकल चार्टिंग तकनीक।
न्यूयॉर्क: मैकग्रा-हिल।
Tukey, JW 1970.
खोजी डेटा विश्लेषण। सीमित प्रारंभिक संस्करण। वॉल्यूम I
रीडिंग, एमए: एडिसन-वेस्ले।
Tukey, JW 1972। कुछ ग्राफिक और सेमी-ग्राफिक डिस्प्ले। बैनक्रॉफ्ट, टीए और ब्राउन में, जॉर्ज डब्ल्यू स्नेडेकर के सम्मान में एसए (एड)
सांख्यिकीय पेपर्स।
एम्स, आईए: आयोवा स्टेट यूनिवर्सिटी प्रेस, 293-316। ( http://www.edwardtufte.com/tufte/tukey पर भी पहुँचा जा सकता है )
Tukey, JW 1977.
खोजपूर्ण डेटा विश्लेषण।
पढ़ना, एमए: एडिसन-वेस्ले।
वाइल्ड, सीजे और जीएएफ सेबर। 2000.
चांस एनकाउंटर्स: ए फर्स्ट कोर्स इन डेटा एनालिसिस एंड इनविज़न।
न्यूयॉर्क: जॉन विली।