मेरे काम में, जब लोग किसी डेटा सेट के "माध्य" मान को संदर्भित करते हैं, तो वे आम तौर पर अंकगणित माध्य (यानी "औसत", या "अपेक्षित मूल्य") का उल्लेख करते हैं। यदि मैंने ज्यामितीय माध्य प्रदान किया है, तो लोग यह सोचेंगे कि मैं स्नाइड या गैर-सहायक हो रहा हूं, क्योंकि "मीन" की परिभाषा पहले से ज्ञात है।
मैं यह निर्धारित करने की कोशिश कर रहा हूं कि क्या डेटा सेट के "माध्यिका" की कई परिभाषाएं हैं। उदाहरण के लिए, एक सहकर्मी द्वारा प्रदान की गई परिभाषाओं में से एक समान तत्वों के साथ सेट किए गए डेटा का माध्य खोजने के लिए होगा:
एल्गोरिथम 'ए'
- तत्वों की संख्या को दो से विभाजित करें, नीचे गोल करें।
- वह मान माध्यिका का सूचकांक है।
- यानी निम्नलिखित सेट के लिए, माध्यिका होगी
5
। [4, 5, 6, 7]
यह समझ में आता है, हालांकि गोलाई-डाउन पहलू थोड़ा मनमाना लगता है।
एल्गोरिथम 'बी'
किसी भी मामले में, एक अन्य सहयोगी ने एक अलग एल्गोरिथ्म का प्रस्ताव दिया है, जो कि एक सांख्यिकी पाठ्यपुस्तक में था (नाम और लेखक को प्राप्त करने की आवश्यकता है):
- तत्वों की संख्या 2 से विभाजित करें, और राउंड-अप और राउंड-डाउन पूर्णांक की एक प्रति रखें। उनका नाम
n_lo
औरn_hi
। - तत्वों का अंकगणित माध्य लो
n_lo
औरn_hi
। - यानी निम्नलिखित सेट के लिए, माध्यिका होगी
(5+6)/2 = 5.5
। [4, 5, 6, 7]
हालांकि यह गलत लगता है, क्योंकि 5.5
इस मामले में औसत मूल्य वास्तव में मूल डेटा सेट में नहीं है। जब हमने कुछ परीक्षण कोड में 'बी' के लिए एल्गोरिदम 'ए' को स्वैप किया, तो यह बुरी तरह से टूट गया (जैसा कि हमें उम्मीद थी)।
सवाल
क्या डेटा सेट के माध्य की गणना करने के लिए इन दो तरीकों के लिए एक औपचारिक "नाम" है? यानी "कम-से-दो माध्यिका" बनाम "औसत-मध्यम-तत्वों और बनाने-नए-नए डेटा मध्यस्थ"?