एक्सेल में चतुर्थांश


10

मैं quartile की परिभाषा में दिलचस्पी रखता हूं जो आमतौर पर तब उपयोग किया जाता है जब आप मूल आँकड़ों में होते हैं। मेरे पास एक स्टेट 101 प्रकार की पुस्तक है और यह सिर्फ एक सहज परिभाषा देती है। "डेटा का लगभग एक चौथाई भाग पहली चतुर्थक या उससे नीचे आता है ..." लेकिन, यह एक उदाहरण देता है जहां यह डेटा के सेट के लिए Q1, Q2 और Q3 की गणना करता है।

5, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 18, 20, 21, 37

चूंकि डेटा के 15 टुकड़े हैं, यह 15 को मंझले, Q2 के रूप में चुनता है। फिर यह शेष डेटा को दो हिस्सों में विभाजित करता है, 5 में 14 के माध्यम से, और 16 को 37 के माध्यम से। इनमें से प्रत्येक में 7 टुकड़े होते हैं और वे क्रमशः 10 और 18 इन सेटों में से प्रत्येक को Q1 और Q3 के रूप में ढूंढते हैं। इस तरह से मैं खुद इसकी गणना करूंगा।

मैंने विकिपीडिया के लेख को देखा और यह 2 तरीके देता है। एक उपरोक्त के साथ सहमत है, और एक कहता है कि आप दोनों सेटों में माध्यिका 15 को भी शामिल कर सकते हैं (लेकिन आप माध्यिका को शामिल नहीं करेंगे यदि यह डेटा संख्याओं के मामले में दो मध्य संख्याओं का औसत था)। यह सब मेरे लिए मायने रखता है।

लेकिन, फिर मैंने एक्सेल को चेक किया कि एक्सेल इसकी गणना कैसे करता है। मैं एक्सेल 2010 का उपयोग कर रहा हूं, जिसमें 3 अलग-अलग कार्य हैं। क्वार्टाइल 2007 और पिछले संस्करणों में उपलब्ध था। ऐसा लगता है कि वे चाहते हैं कि आप 2010 में इसका उपयोग बंद कर दें लेकिन यह अभी भी उपलब्ध है। Quartile.Inc नया है, लेकिन जहाँ तक मैं बता सकता हूँ, Quartile के साथ बिल्कुल सहमत हैं। और, वहाँ Quartile.Exc भी है। मेरे विचार से 2010 में अंतिम 2 दोनों नए हैं। इस बार, मैंने अभी पूर्णांक 1, 2, 3, ..., 10. का उपयोग करने की कोशिश की है। मुझे उम्मीद है कि एक्सेल 5.5 के मध्यांक, 3 की Q1, और Q3 देने की उम्मीद कर रहा है। सांख्यिकी पुस्तक से विधि, साथ ही साथ चूंकि विकिपीडिया पर दोनों विधियाँ इन उत्तरों को देती हैं, क्योंकि मध्य दो संख्याओं का औसत औसत है। एक्सेल देता है

quartile number, Quartile.Inc, Quartile.Exc
1,               3.25,         2.75 
2,               5.5,          5.5
3,               7.75,         8.25

इनमें से कोई भी इससे सहमत नहीं है जो मैंने पहले बात की है।

एक्सेल के लिए मदद फ़ाइल में विवरण हैं:

Quartile.Inc - एक डेटा सेट की चतुर्थक लौटाता है, जो 0..1 से समावेशी मूल्यों पर आधारित है।

Quartile.Exc - 0..1 से अनन्य मानों के आधार पर, डेटा सेट की चतुर्थक लौटाता है।

क्या कोई मुझे यह समझने में मदद कर सकता है कि एक्सेल क्या उपयोग कर रहा है?


5
किसी भी सांख्यिकीय के लिए एक्सेल का उपयोग नहीं करने का एक और महान चित्रण। :-)
वेन

1
दोस्तों आँकड़ों के लिए एक्सेल का उपयोग न करने दें। दुख की बात है लेकिन सच है
क्रिस बीले

जवाबों:


11

आमतौर पर, एक रैंक (के बीच 1 और एन के लिए n डेटा) एक प्रतिशत में बदल जाती है पी सूत्र के माध्यम सेr1nnp

p=100rαn+12α

α01rp

r=(n+12α)(p/100)+α.

α=1PERCENTILEQUARTILEQUARTILE.INCQUARTILE.EXC

(1,2,3,4,5,6,7,8,9,10)n=10p{25,50,75}α=19(0.25)+1=3.259(0.50)+1=5.59(0.75)+1=7.75QUARTILE.INC

α=011(0.25)=2.7511(0.50)=5.511(0.75)=8.25QUARTILE.EXC

α

वैसे, रेखीय प्रक्षेप के माध्यम से भिन्नात्मक रैंकों को डेटा मूल्यों में परिवर्तित किया जाता है। इस प्रक्रिया को Percentiles और EDF प्लॉट्स में मेरे पाठ्यक्रम नोट्स में समझाया और चित्रित किया गया है - उस पृष्ठ के नीचे के पास। गणना को दर्शाने वाले एक एक्सेल स्प्रेडशीट का लिंक भी है।

यदि आप एक्सेल में एक सामान्य प्रतिशतक कार्य को लागू करना चाहते हैं , तो यह करने के लिए एक VBA मैक्रो है:

'
' Converts a percent, computed using plotting position constant A,
' into a percent appropriate for the Excel Percentile() and
' Quartile() functions.  (The default value of A for Excel is 1;
' most values in use are between 0 and 0.5.)
'
Public Function PercentileA(P As Double, N As Integer, A As Double) As Double
    If N < 1 Or A < 0# Or A > 1# Or P < 0# Or P > 1# Then
        Exit Function
    End If
    If N < 2 Then
        PercentileA = 0.5
    Else
        PercentileA = ((N - 2 * A + 1) * P + A - 1) / (N - 1)
    End If
End Function

यह नाममात्र प्रतिशत (जैसे 25/100) को प्रतिशत में परिवर्तित करता है जिससे एक्सेल का PERCENTILEकार्य वांछित मान वापस आ सकेगा । यह सेल फ़ार्मुलों में उपयोग के लिए है, जैसे कि =PERCENTILE(Data, PercentileA(0.25, Count(Data), 0.5))


ध्यान दें कि एक बार जब आप समझ जाते हैं कि एक्सेल क्या कर रहा है, तो आप इसे सांख्यिकीय कार्य के लिए प्रभावी रूप से उपयोग कर सकते हैं।
whuber

5
यदि मैं आपकी टिप्पणी से विन्रम रूप से असहमत हो सकता हूं: एक्सेल को सांख्यिकीय कार्यों के लिए प्रभावी रूप से इस्तेमाल किया जा सकता है, यदि आप एक सांख्यिकीय विज़ार्ड हैं जो पहले-सिद्धांतों से साबित हो सकता है कि क्या किया जाना चाहिए, तो रिवर्स-इंजीनियर एक्सेल के तरीकों का निर्धारण करने के लिए कि यह वास्तव में क्या कर रहा है। जब आप वह अच्छा करते हैं, तो कोई भी उपकरण करेगा। हालाँकि मैं यह भी बताता हूँ कि इस सूत्र में, इस चर्चा में शामिल 100% जादूगर अब तक एक्सेल के नवीनतम संस्करण तक नहीं पहुँच पाए हैं, इसलिए वास्तव में इसका उपयोग करने की संभावना नहीं है।
वेन

टौच ’, @Wayne। (लेकिन हम में से कुछ अभी भी Excel के पुराने संस्करणों :-) का उपयोग करें।)
whuber

1
Whuber, VBA समाधान साझा करने के लिए धन्यवाद। यह बेहद मददगार होगा। जैसा कि किसी को स्टैट्स करने की आवश्यकता होती है, लेकिन केवल आसानी से उपलब्ध टूल के रूप में एक्सेल के साथ अटक जाता है (हाँ, मैंने आर की कोशिश की है, लेकिन इसके चारों ओर मेरा सिर नहीं मिल सकता है), मैं एक्सेल को मेरी ज़रूरतों में मदद करने के लिए टूल की सराहना करता हूं।
डीएवी

4

यह मुझे प्रतीत होता है कि एक्सेल quartile.incमूल quartileसे सहमत है, जो आर की डिफ़ॉल्ट और अन्य परिभाषाओं से सहमत है।

व्हीबर से मददगार संकेत के साथ, मैंने पाया कि एक्सेल की मात्रा quartile.exc(1..10 मामले पर) आर की type=6मात्रा के परिभाषा के साथ सहमत लगती है :

   > For types 4 through 9, Q[i](p) is a continuous function of p, with
    > gamma = g and m given below. The sample quantiles can be obtained
    > equivalently by linear interpolation between the points (p[k],x[k])
    > where x[k] is the kth order statistic. Specific expressions for p[k]
    > are given below.
    > 
    > ...
    > 
    > 
    > Type 6 m = p
    >       .p[k] = k / (n + 1). Thus p[k] = E[F(x[k])].
    >       This is used by Minitab and by SPSS.

जो स्पष्ट रूप से आपके प्रश्न का उत्तर देता है: "हां, मिनिताब और एसपीएसएस करते हैं।"


क्या R की मात्रा की नौ परिभाषाएँ नहीं हैं ? (संपादन के लिए +1, Btw)
whuber

@ शुभकर्ता: पर्दे के पीछे आदमी पर ध्यान न दें! (मैं अपनी प्रतिक्रिया को संपादित करूँगा। आगे की परीक्षा पर, यह आर की अन्य परिभाषाओं में से एक से मेल खाता है, जो स्पष्ट रूप से मिनिटैब और एसपीएसएस का उपयोग करता है। धन्यवाद!)
वेन

2

मुझे लगता है कि चतुर्थक का औसत स्वाद सिर्फ 5 और 37 (आपके मूल डेटा में न्यूनतम और अधिकतम) की अनदेखी कर रहा है।

Stata में, डिफ़ॉल्ट और वैकल्पिक दोनों संस्करण आपको इस डेटा के साथ quartile.exc मान देते हैं।


यह अनुमान उस दस्तावेज के साथ असंगत प्रतीत होता है जो यह दावा करता है कि अधिकतम और न्यूनतम वास्तव में वापस आ सकते हैं QUARTILE.EXC
whuber

Excel 2010 के मेरे संस्करण में, QUARTILE.EXC (सेल रेंज, k) #NUM वापस आएगा! जब तक k = {1,2,3}, जो दिखाई देने वाले पॉप-अप मेनू के अनुसार 25 वें, 50 वें और 75 वें प्रतिशत के अनुरूप है। मूल क्वार्टर भी 0 और 4 को दूसरे तर्क के रूप में स्वीकार करेगा, जो कि न्यूनतम और अधिकतम के अनुरूप है।
दिमित्री वी। मास्टरोव

1
प्रलेखन में कहा गया है, "अगर क्वार्ट or 0 या यदि क्वार्ट QU 4, QUARTILE.EXC #NUM! त्रुटि मान देता है।" जो सच लगता है। दूसरा कथन "MIN, MEDIAN, और MAX उसी मान को QUARTILE.EXC के रूप में लौटाता है, जब quart 0 (शून्य), 2, और 4 के बराबर होता है," तब तक गलत प्रतीत होता है जब तक कि मैं कुछ याद नहीं कर रहा हूं। क्या झंझट है!
दिमित्री वी। मास्टरोव

nn11#NUM!PERCENTILE

1
पर्सेंटाइल के 3 फ्लेवर मेरे लिए चतुर्थक के समान व्यवहार करते हैं। 5-37 डेटा के लिए, PERCENTILE.EXC (रेंज, k) #NUM देता है! k = {0,1} के लिए। K = 0.25 के लिए, PERCENTILE.EXC 10 देता है। अगर मैं 5 और 37 को फेंक दूं, तो यह 10.5 देता है, जो अन्य 2 तरीकों से सहमत है।
दिमित्री वी। मास्टरोव

2

दिलचस्प विस्तृत सामग्री के बहुत सारे लेकिन मूल प्रश्न पर वापस जाने के लिए मैं यह नहीं देखता कि दो अलग-अलग तरीके जो वास्तव में एक ही उत्तर दे सकते हैं वास्तव में मायने नहीं रखते हैं। पहला क्वैश्चन वह बिंदु है जिस पर 25% प्रेक्षण इसके नीचे या नीचे आते हैं। आपके नमूना आकार पर निर्भर करता है कि डेटा में एक सटीक बिंदु हो सकता है या नहीं। इसलिए यदि एक बिंदु नीचे है और अगला ऊपर है, तो यह पहला चतुर्थक वास्तव में अच्छी तरह से परिभाषित नहीं है और इन दोनों के बीच का कोई भी बिंदु समान रूप से अच्छी तरह से सेवा कर सकता है। माध्यिका के लिए भी यही सच है जब नमूना आकार समान है। नियम नीचे और ऊपर डेटा बिंदुओं के बीच के मध्य बिंदु को चुनता है। लेकिन वास्तव में कुछ भी नहीं कहता है कि नियम द्वारा दिया गया विकल्प वास्तव में किसी भी अन्य बिंदु से बेहतर है।


α1/31/2

0

आप में से जो लोग एक्सेल का उपयोग करते हैं, उनके लिए यहां विभिन्न संस्करण विधियों का एक अच्छा ब्रेकडाउन है http://peltiertech.com/WordPress/comparison/


2
बेहतर होगा कि आप उन्हें अपने जवाब में सारांशित कर सकें। जब भी लिंक प्रश्न का उत्तर दे सकता है वे कभी-कभी आउट ऑफ़ डेट हो जाते हैं तो इस स्थिति में आपका उत्तर भविष्य के पाठकों के लिए मददगार नहीं होगा।
एंडी

0

excel 2016 में मैंने देखा, कि यदि कोई चतुर्थक का सही मान प्राप्त कर सकता है:

  • डेटा सेट में विषम संख्या में प्रविष्टियाँ हैं: QUARTILE.EXC का उपयोग करें
  • डेटा सेट में प्रविष्टियों की संख्या भी होती है: QUARTILE.EXC और QUARTILE.INC का औसत उपयोग करें

1
यह देखते हुए कि कुछ अन्य उत्तरों में बताई गई मात्राओं की कितनी परिभाषाएँ हैं, क्या आप बता सकते हैं कि आप सही मूल्यों से क्या मतलब रखते हैं?
mdewey
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.