क्रमिक चर के माध्य की गणना करें


20

मैंने कई स्थानों पर पढ़ा है कि एक सामान्य चर के माध्य की गणना अनुचित है। मैं यह अनुचित हो सकता है क्यों के लिए एक अंतर्ज्ञान प्राप्त करने की कोशिश कर रहा हूँ। मुझे लगता है कि ऐसा इसलिए है क्योंकि सामान्य तौर पर, एक सामान्य चर को सामान्य रूप से वितरित नहीं किया जाता है और इसलिए गणना करने से माध्य को गलत प्रतिनिधित्व मिलेगा। क्या कोई व्यक्ति इस बात के लिए अधिक विस्तृत तर्क दे सकता है कि एक सामान्य चर के माध्य की गणना अनुचित क्यों हो सकती है?


8
किसी माध्य की गणना करने के लिए, आपको पहले एक योग की आवश्यकता होती है। सार्थक होने के लिए, आपको 3 + 3 के समान होने के लिए 4 + 2 की आवश्यकता है; समान रूप से, आपको 4-3 = 3-2 = 2-1 चाहिए। क्रमिक डेटा के साथ - तब भी जब इसकी श्रेणियों को "1", "2", "3", "4" लेबल किया जाता है - यह (स्पष्ट रूप से) जरूरी नहीं है।
Glen_b -Reinstate मोनिका

और अंकगणित माध्य से माध्य अधिक उपयुक्त क्यों होगा?

जवाबों:


24

एक संक्षिप्त उत्तर यह है कि यह विवादास्पद है। आपके द्वारा उल्लेखित सलाह के विपरीत, कई क्षेत्रों में लोग क्रमिक माप के साधन लेते हैं और अक्सर खुश होते हैं कि इसका मतलब है कि वे जो चाहते हैं वह करते हैं। कई शैक्षिक प्रणालियों में ग्रेड-पॉइंट औसत या समकक्ष एक उदाहरण है।

हालांकि, सामान्य रूप से वितरित नहीं किया जा रहा क्रमिक डेटा एक वैध कारण नहीं है, क्योंकि इसका मतलब है

  • व्यापक रूप से गैर-सामान्य वितरण के लिए उपयोग किया जाता है

  • कुछ रोग संबंधी मामलों को छोड़कर, बहुत से गैर-सामान्य वितरणों के लिए गणितीय रूप से परिभाषित।

यदि व्यवहार में डेटा को सामान्य रूप से वितरित नहीं किया जाता है, तो इसका उपयोग करना एक अच्छा विचार नहीं हो सकता है, लेकिन यह अलग है।

क्रमिक डेटा के साथ माध्य का उपयोग नहीं करने का एक मजबूत कारण यह है कि इसका मूल्य कोडिंग पर सम्मेलनों पर निर्भर करता है। संख्यात्मक कोड जैसे 1, 2, 3, 4 आमतौर पर सिर्फ सादगी या सुविधा के लिए चुने जाते हैं, लेकिन सिद्धांत रूप में वे समान रूप से 1, 23, 456, 7890 के रूप में संबंधित के रूप में एक परिभाषित आदेश के अनुरूप हो सकते हैं। या तो मामले में माध्य लेने से उन सम्मेलनों को शाब्दिक रूप से लेना शामिल होगा (जैसे कि संख्याएं मनमानी नहीं थीं, लेकिन उचित हैं), और ऐसा करने के लिए कोई कठोर आधार नहीं हैं। आपको एक अंतराल पैमाने की आवश्यकता है जिसमें मूल्यों के बीच समान अंतर को साधनों को उचित ठहराने के लिए शाब्दिक रूप से लिया जा सकता है। यह मैं मुख्य तर्क मानता हूं, लेकिन जैसा कि पहले ही संकेत दिया गया है कि लोग अक्सर इसे और जानबूझकर अनदेखा करते हैं, क्योंकि वे इसका मतलब उपयोगी पाते हैं, जो कुछ मापदण्ड अधिकारी कहते हैं।

यहाँ एक अतिरिक्त उदाहरण है। अक्सर लोगों को "दृढ़ता से असहमत" में से एक चुनने के लिए कहा जाता है ... "दृढ़ता से सहमत" और (आंशिक रूप से सॉफ्टवेयर क्या चाहता है पर निर्भर करता है) शोधकर्ता कोड है कि 1 के रूप में .. 5 या 0 .. 4 या जो भी वे चाहते हैं, या इसकी घोषणा करें। एक आदेशित कारक के रूप में (या सॉफ़्टवेयर जो भी शब्द उपयोग करता है)। यहां कोडिंग मनमाना है और उन लोगों से छिपा है जो सवाल का जवाब देते हैं।

लेकिन अक्सर लोगों को 1 से 5 के पैमाने पर भी कहा (कहा जाता है), आप किसी चीज़ का मूल्यांकन कैसे करते हैं? उदाहरण लाजिमी है: वेबसाइट, खेल, अन्य प्रकार की प्रतियोगिताएं और वास्तव में शिक्षा। यहां लोगों को एक पैमाना दिखाया जा रहा है और इसे इस्तेमाल करने के लिए कहा जा रहा है। यह व्यापक रूप से समझा जाता है कि गैर-पूर्णांक समझ में आते हैं, लेकिन आपको केवल पूर्णांक को एक सम्मेलन के रूप में उपयोग करने की अनुमति दी जा रही है। क्या यह अध्यादेशीय पैमाना है? कुछ हां कहते हैं, कुछ कहते हैं कि नहीं। अन्यथा, समस्या का एक हिस्सा यह है कि सामान्य पैमाने क्या है, यह अपने आप में एक फजी या बहस का क्षेत्र है।

शैक्षणिक कार्यों के लिए फिर से ग्रेड पर विचार करें, ई से ए कहो। अक्सर ऐसे ग्रेड को भी संख्यात्मक रूप से व्यवहार किया जाता है, 1 से 5 के रूप में कहें, और नियमित रूप से लोग छात्रों, पाठ्यक्रमों, स्कूलों आदि के लिए औसत की गणना करते हैं और इस तरह के डेटा का आगे विश्लेषण करते हैं। हालांकि यह सही है कि संख्यात्मक अंकों के लिए कोई भी मानचित्रण मनमाना है, लेकिन स्वीकार्य है जब तक कि यह आदेश को बरकरार रखता है, फिर भी अभ्यास में लोगों को असाइन करने और ग्रेड प्राप्त करने से पता चलता है कि स्कोर में संख्यात्मक समकक्ष हैं और जानते हैं कि ग्रेड औसत होगा

साधनों का उपयोग करने का एक व्यावहारिक कारण यह है कि मध्यस्थ और मोड अक्सर डेटा में जानकारी के खराब सारांश होते हैं। मान लें कि आपके पास दृढ़ता से सहमत होने के लिए जोरदार तरीके से चल रहा है और सुविधा कोड के लिए उन बिंदुओं 1 से 5 तक। अब एक नमूना की कल्पना करें 1, 1, 2, 2, 2 और दूसरा 1, 2, 2, 4, 5. अब बढ़ाएं। आपके हाथ अगर आपको लगता है कि माध्य और मोड एकमात्र औचित्यपूर्ण सारांश हैं क्योंकि यह एक अध्यादेशीय पैमाना है। अब आप अपने हाथों को ऊपर उठाएं, यदि आप माध्य को भी उपयोगी पाते हैं, भले ही रकम अच्छी तरह से परिभाषित हो, आदि।

स्वाभाविक रूप से, इसका मतलब एक हाइपरसेंसिटिव सारांश होगा यदि कोड 1 से 5 के वर्ग या क्यूब्स थे, कहते हैं, और वह नहीं हो सकता है जो आप चाहते हैं। (यदि आपका उद्देश्य उच्च-उड़ान भरने वालों की पहचान करना है तो यह वास्तव में वही हो सकता है जो आप चाहते हैं!) लेकिन यही कारण है कि क्रमिक पूर्णांक कोड के साथ पारंपरिक कोडिंग एक व्यावहारिक विकल्प है, क्योंकि यह अक्सर अभ्यास में काफी अच्छी तरह से काम करता है। यह एक तर्क नहीं है जो माप सिद्धांतकारों के साथ किसी भी भार को वहन करता है, और न ही यह होना चाहिए, लेकिन डेटा विश्लेषकों को सूचना-समृद्ध सारांश बनाने में रुचि होनी चाहिए।

मैं किसी ऐसे व्यक्ति से सहमत हूं जो कहता है: ग्रेड आवृत्तियों के पूरे वितरण का उपयोग करें, लेकिन यह मुद्दे पर बात नहीं है।


1
महान जवाब और व्यावहारिकता महत्वपूर्ण है, लेकिन मैं सावधानी के एक नोट जोड़ूंगा। केवल औपचारिक रूप से स्थापित विधियों का उपयोग करने का एक अच्छा कारण यह है कि आपको निश्चितता और सी के अनुमानों तक पहुंच मिलती है। उदाहरण के लिए यदि हमारे पास दो GPA हैं, तो 4.53 और 4.34 कहें, हम जानना चाह सकते हैं कि क्या एक दूसरे से "बेहतर" है। लेकिन ग्रेड के औसत में औपचारिकता की कमी के कारण, हमें विश्वास अंतराल और सी जैसी चीजें नहीं मिलती हैं।
स्टीफन मैकएयर

1
@StephenMcAteer मैं एक विशिष्ट परिचयात्मक पाठ या पाठ्यक्रम में सिखाई गई विधियों के संदर्भ में आपकी बात देखता हूँ। लेकिन अगर यही इच्छा थी, तो बूटस्ट्रैपिंग ने लगभग 40 वर्षों के लिए विश्वास अंतराल की अनुमति देने वाली एक तकनीक प्रदान की है।
निक कॉक्स

3

मान लीजिए कि हम क्रमिक मूल्यों को लेते हैं, जैसे कि दृढ़ता से असहमत के लिए 1, असहमत के लिए 2, सहमत के लिए 3, और दृढ़ता से सहमत होने के लिए 4। यदि चार लोग 1,2,3 और 4 प्रतिक्रियाएँ देते हैं, तो इसका क्या मतलब होगा? यह (1 + 2 + 3 + 4) / 4=2.50 है।

जब चार व्यक्तियों की औसत प्रतिक्रिया "असहमत या सहमत" होती है, तो इसकी व्याख्या कैसे की जानी चाहिए? इसलिए हमें ऑर्डिनल डेटा के लिए माध्य का उपयोग नहीं करना चाहिए।


3
शैतान के अधिवक्ता की भूमिका निभाते हुए, इस उदाहरण में, मैं 2.5 को 2, "असहमत" और 3 के बीच आधे रास्ते के रूप में व्याख्या करता हूं, "सहमत"। यह एक औसत के रूप में समझ में आता है कि हम "दृढ़ता से सहमत" बनाम "दृढ़ता से सहमत" हैं, और "असहमत" बनाम "सहमत" हैं।
टीओटी

1
इस संदर्भ में सहमत का मतलब 2.5 का अर्थ अभी भी मुझे समझ में आता है - असहमति और सहमति के बीच आधा या दूसरे शब्दों में, तटस्थ।
लुसियानो

3
मुझे लगता है कि अज़ीम को एक मजबूत उदाहरण की आवश्यकता है। आप एक ही आधार पर प्रति परिवार 1, 2, 3, 4 बच्चों के औसत के रूप में 2.5 पर आपत्ति कर सकते हैं, यह कैसे समझा जाए क्योंकि यह परिभाषित मूल्यों में से एक नहीं है। वह विभिन्न मुद्दों को उठाता है।
निक कॉक्स

2
मुझे लगता है कि आप अपने जवाब को मजबूत कर सकते हैं और मैं आपको ऐसा करने के लिए प्रोत्साहित करता हूं। "क्योंकि माध्य एक अपरिभाषित मान हो सकता है" तार्किक या मनोवैज्ञानिक रूप से यहाँ एक मजबूत तर्क नहीं है, और इस बात के गहरे मुद्दे पर ध्यान केंद्रित नहीं करता है कि क्या समान अंतर वास्तव में समान अंतर का अर्थ है।
निक कॉक्स

1
मुझे नहीं पता कि मैं इसे कैसे भी स्पष्ट कर सकता हूं, लेकिन (जैसे) "0-4", "5-19", "20-114" का आदेश दिया जाता है (क्रमिक) उस माप में केवल एक प्राकृतिक आदेश है (उलटफेर की कमी)। यदि आप उन्हें अन्य चीजों को भी कॉल करना चाहते हैं, तो यह मेरे द्वारा ठीक है।
निक कॉक्स

2

मैं @ अज़ीम से पूरी तरह सहमत हूँ। लेकिन बस इस बिंदु घर को चलाने के लिए मुझे थोड़ा और विस्तृत करना चाहिए।

मान लें कि आपके पास @Azeem से उदाहरण में अध्यादेशीय डेटा है, जहां आपका स्केल 1 से 4 तक है। और मान लीजिए कि आपके पास इस पैमाने पर कुछ लोगों की रेटिंग (जैसे आइसक्रीम) है। कल्पना कीजिए कि आपको निम्नलिखित परिणाम प्राप्त होंगे:

  • व्यक्ति A ने कहा ४
  • व्यक्ति बी ने कहा 3
  • व्यक्ति C ने कहा 1
  • व्यक्ति डी ने कहा 2

जब आप परिणामों की व्याख्या करना चाहते हैं, तो आप कुछ हद तक निष्कर्ष निकाल सकते हैं:

  • पर्सन ए को पर्सन बी से ज्यादा आइसक्रीम पसंद है
  • पर्सन डी को पर्सन सी से ज्यादा आइसक्रीम पसंद थी

हालाँकि, आप रेटिंग्स के बीच के अंतराल के बारे में कुछ नहीं जानते हैं। क्या 1 और 2 के बीच का अंतर 3 और 4 के बीच समान है? क्या 4 की रेटिंग का वास्तव में मतलब है कि वह व्यक्ति आइसक्रीम से 4 गुना अधिक पसंद करता है जो इसे 1 के रूप में रेट करता है? और इसी तरह ... जब आप अंकगणित माध्य की गणना करते हैं, तो आप संख्याओं के साथ ऐसा व्यवहार करते हैं जैसे कि उनके बीच के अंतर समान थे। लेकिन यह एक बहुत ही मजबूत धारणा है, जो डेटा के साथ है और आपको इसे सही ठहराना होगा।


मैंने उपरोक्त उत्तर के संदर्भ को संपादित किया। उत्तर क्रम बदल सकते हैं और वास्तव में जो उत्तर ऊपर था वह इस क्षण नीचे है, और वह बदल सकता है। तो पोस्टरों को क्रॉस-रेफर करें, स्थिति नहीं।
निक कॉक्स

0

मैं इस अवधारणा से सहमत हूं कि अंकगणितीय माध्य वास्तव में क्रमिक पैमाने डेटा में उचित नहीं हो सकता है। गणना के बजाय हम ऐसी स्थितियों में मोड या माध्यिका का उपयोग कर सकते हैं जो हमें हमारे परिणामों की अधिक सार्थक व्याख्या दे सकते हैं।


यह इस प्रश्न को संबोधित नहीं करता है कि यह अनुचित क्यों हो सकता है।
निक कॉक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.