मैं सांख्यिकीय तालिका में (अंतर प्रक्षेपित) नहीं दिए गए मानों को कैसे ढूँढूँ?


19

अक्सर लोग पी-मान प्राप्त करने के लिए कार्यक्रमों का उपयोग करते हैं, लेकिन कभी-कभी - जो भी कारण से - तालिकाओं के एक सेट से महत्वपूर्ण मूल्य प्राप्त करने के लिए आवश्यक हो सकता है।

कई महत्वपूर्ण स्तरों के साथ एक सांख्यिकीय तालिका, और स्वतंत्रता की डिग्री की एक सीमित संख्या को देखते हुए, मैं अन्य महत्वपूर्ण स्तरों या स्वतंत्रता की डिग्री (जैसे , ची-स्क्वायर, या टेबल) के साथ अनुमानित महत्वपूर्ण मान कैसे प्राप्त करूं ?tF

यही है, मैं एक तालिका में मूल्यों को "बीच में" मान कैसे पाता हूं?

जवाबों:


26

यह उत्तर दो मुख्य भागों में है: पहला, रैखिक प्रक्षेप का उपयोग करना , और दूसरा, अधिक सटीक प्रक्षेप के लिए परिवर्तनों का उपयोग करना। जब आपके पास सीमित टेबल उपलब्ध हैं, तो यहां चर्चा किए गए दृष्टिकोण हाथ की गणना के लिए उपयुक्त हैं, लेकिन यदि आप पी-मूल्यों का उत्पादन करने के लिए कंप्यूटर की दिनचर्या को लागू कर रहे हैं, तो बहुत बेहतर दृष्टिकोण हैं (यदि थकाऊ जब हाथ से किया जाता है) तो इसके बजाय इसका उपयोग किया जाना चाहिए।

यदि आप जानते हैं कि एक z- परीक्षण के लिए १०% (एक पूंछ) महत्वपूर्ण मूल्य १.२ 10 था और २०% महत्वपूर्ण मूल्य ०. guess४ था, तो १५% महत्वपूर्ण मूल्य पर एक मोटा अनुमान आधे रास्ते में होगा - (१.२ + + ०. )४) / 2 = 1.06 (वास्तविक मूल्य 1.0364 है), और 12.5% ​​मूल्य का अनुमान लगाया जा सकता है कि आधे रास्ते में और 10% मूल्य (1.28 + 1.06) / 2 = 1.17 (वास्तविक मूल्य 1.15+)। यह वही है जो रैखिक प्रक्षेप करता है - लेकिन 'आधे रास्ते के बीच' के बजाय, यह दो मानों के बीच के रास्ते के किसी भी अंश को देखता है।

रैखिक रैखिक प्रक्षेप

आइए सरल रैखिक प्रक्षेप के मामले को देखें।

तो हमारे पास कुछ फ़ंक्शन ( कहना है ), जो हमें लगता है कि हम अनुमानित मूल्य के पास लगभग रैखिक हैं, और हमारे पास फ़ंक्शन का एक मूल्य है जो हम चाहते हैं, उदाहरण के लिए, जैसे:x

xy89.316y162015.6

दो मान जिनके हम जानते हैं 12 (20-8) अलग हैं। देखें कि कैसे -value (वह जिसे हम अनुमानित -value चाहते हैं ) 12 के अंतर को 8: 4 (16-8 और 20-16) के अनुपात में विभाजित करता है? यही है, यह पहले -value से आखिरी तक की दूरी का 2/3 है । यदि संबंध रैखिक थे, तो y- मानों की संबंधित सीमा समान अनुपात में होगी।x xxyxyx

रैखिक सेपक

तो लगभग उसी तरह होना चाहिए जैसा कि । 16-8y169.315.69.3168208

यहy169.315.69.3168208

उलटफेर:

y169.3+(15.69.3)168208=13.5

सांख्यिकीय तालिकाओं के साथ एक उदाहरण: यदि हमारे पास 12 डीएफ के लिए निम्नलिखित महत्वपूर्ण मानों के साथ एक टी-टेबल है:

(2-tail)αt0.013.050.022.680.052.180.101.78

हम 12 df के साथ t का महत्वपूर्ण मान और 0.025 का दो-पूंछ वाला अल्फा चाहते हैं। यही है, हम उस तालिका के 0.02 और 0.05 पंक्ति के बीच में अंतर करते हैं:

αt0.022.680.025?0.052.18

" " का मान मान है जो हम अनुमानित रैखिक का उपयोग करना चाहते हैं। ( मेरा वास्तव में मतलब है कि वितरण के उलटा का बिंदु ।)t 0.025 t 0.025 1 - 0.025 / 2 t 12?t0.025t0.02510.025/2t12

पहले की तरह, विभाजित से अंतराल करने के लिए अनुपात में के लिए (यानी ) और अज्ञात -value विभाजित चाहिए रेंज करने के लिए उसी अनुपात में; समतुल्य, होता है साथ रास्ते का वें भाग , इसलिए अज्ञात -value को साथ वें रास्ते में होना चाहिए ।0.02 0.05 ( 0.025 - 0.02 ) ( 0.05 - 0.025 )0.0250.020.05(0.0250.02)(0.050.025)टी टी 2.68 2.18 0.025 ( 0.025 - 0.02 ) / ( 0.05 - 0.02 ) = 1 / 6 एक्स टी 1 / 6 टी1:5tt2.682.180.025(0.0250.02)/(0.050.02)=1/6xt1/6t

यह या समकक्ष हैt0.0252.682.182.680.0250.020.050.02

t0.0252.68+(2.182.68)0.0250.020.050.02=2.680.5162.60

वास्तविक उत्तर ... जो विशेष रूप से करीब नहीं है क्योंकि हम जिस फ़ंक्शन का अनुमान लगा रहे हैं, वह उस श्रेणी में रैखिक के करीब नहीं है (लगभग यह है)।2.56α=0.5

टी-टेबल में महत्वपूर्ण मूल्य के रैखिक प्रक्षेप

परिवर्तन के माध्यम से बेहतर सन्निकटन

हम अन्य कार्यात्मक रूपों द्वारा रैखिक प्रक्षेप की जगह ले सकते हैं; वास्तव में, हम एक ऐसे पैमाने में बदल जाते हैं, जहां रैखिक प्रक्षेप बेहतर काम करता है। इस मामले में, पूंछ में, कई सारणीबद्ध महत्वपूर्ण मान महत्व स्तर के से लगभग अधिक रैखिक होते हैं । जब हम s लेते हैं , तो हम पहले की तरह रैखिक प्रक्षेप लागू करते हैं। चलिए कोशिश करते हैं कि उपरोक्त उदाहरण पर:loglog

αlog(α)t0.023.9122.680.0253.689t0.0250.052.9962.18

अभी

t0.0252.682.182.68log(0.025)log(0.02)log(0.05)log(0.02)=3.6893.9122.9963.912

या समकक्ष

t0.0252.68+(2.182.68)3.6893.9122.9963.912=2.680.50.2432.56

जो आंकड़ों की उद्धृत संख्या के लिए सही है। इसका कारण यह है - जब हम x- स्केल को लघुगणक रूप देते हैं - संबंध लगभग रैखिक है:

लॉग अल्फा में रैखिक प्रक्षेप
दरअसल, नेत्रहीन वक्र (ग्रे) सीधी रेखा (नीला) के शीर्ष पर बड़े करीने से स्थित होता है।

कुछ मामलों में, logit महत्व स्तर (के ) एक व्यापक रेंज पर अच्छी तरह से काम कर सकता है, लेकिन आमतौर पर आवश्यक नहीं है (हम आमतौर पर केवल सटीक महत्वपूर्ण मूल्यों के बारे में परवाह करते हैं, जब काफी छोटा होता है, तो काफी अच्छी तरह से काम करता है)।logit(α)=log(α1α)=log(11α1)αlog

स्वतंत्रता के विभिन्न अंशों में प्रक्षेप

t , chi-square और tables में स्वतंत्रता की डिग्री भी होती है, जहाँ हर df ( -) मान को सारणीबद्ध नहीं किया जाता है। ज्यादातर महत्वपूर्ण मान df में रैखिक प्रक्षेप द्वारा सही ढंग से दर्शाए नहीं गए हैं। वास्तव में, अक्सर यह लगभग मामला है कि सारणीबद्ध मान df, के पारस्परिक में रैखिक होते हैं ।Fν1/ν

(पुरानी तालिकाओं में आप अक्सर साथ काम करने के लिए एक सिफारिश देखेंगे - अंश पर निरंतर कोई फर्क नहीं पड़ता, लेकिन पूर्व-कैलकुलेटर दिनों में अधिक सुविधाजनक था क्योंकि 120 में बहुत सारे कारक हैं, इसलिए अक्सर एक पूर्णांक होता है, जिससे गणना थोड़ी सरल हो जाती है।)120/ν120/ν

यहाँ बताया गया है कि व्युत्क्रम प्रक्षेप 5 से 5% महत्वपूर्ण मान पर और । यही है, केवल समापन बिंदु में प्रक्षेप में भाग लेते हैं । उदाहरण के लिए, लिए महत्वपूर्ण मान की गणना करने के लिए , हम लेते हैं (और ध्यान दें कि यहाँ cdf के व्युत्क्रम का प्रतिनिधित्व करता है):F4,νν=601201/νν=80F

F4,80,.95F4,60,.95+1/801/601/1201/60(F4,120,.95F4,60,.95)

उलटा df में उलटा

( यहां आरेख से तुलना करें )


ज्यादातर लेकिन हमेशा नहीं। यहां एक उदाहरण है जहां df में रैखिक प्रक्षेप बेहतर है, और तालिका से कैसे बताएं कि रेखीय प्रक्षेप सटीक होने वाला है, इसकी व्याख्या।

यहां ची-स्क्वैयर टेबल का एक टुकड़ा है

            Probability less than the critical value
 df           0.90      0.95     0.975      0.99     0.999
______   __________________________________________________

 40         51.805    55.758    59.342    63.691    73.402
 50         63.167    67.505    71.420    76.154    86.661
 60         74.397    79.082    83.298    88.379    99.607
 70         85.527    90.531    95.023   100.425   112.317

कल्पना कीजिए कि हम स्वतंत्रता की 57 डिग्री के लिए 5% महत्वपूर्ण मूल्य (95 वीं प्रतिशतता) प्राप्त करना चाहते हैं।

करीब से देखने पर, हम देखते हैं कि तालिका की प्रगति में 5% महत्वपूर्ण मूल्य लगभग रैखिक रूप से यहाँ हैं:

यहाँ छवि विवरण दर्ज करें

(हरी रेखा 50 और 60 df के मान से जुड़ती है; आप देख सकते हैं कि यह 40 और 70 के लिए डॉट्स को छूती है)

तो रैखिक प्रक्षेप बहुत अच्छा करेगा। लेकिन निश्चित रूप से हमारे पास ग्राफ खींचने का समय नहीं है; लीनियर इंटरपोलेशन का उपयोग कब करना है और कब और अधिक जटिल कुछ करने की कोशिश करना है?

साथ ही हम जो भी तलाश करते हैं उसका मान, अगला निकटतम मान (इस मामले में 70) लेते हैं। यदि मध्य सारणीबद्ध मान (df = 60 के लिए एक) अंत मानों (50 और 70) के बीच रैखिक के करीब है, तो रैखिक प्रक्षेप उपयुक्त होगा। इस मामले में मूल्यों equispaced कर रहे हैं तो यह विशेष रूप से आसान है: है के करीब ?x 60 , 0.95(x50,0.95+x70,0.95)/2x60,0.95

हम पाते हैं कि , जब 60 df, 79.082 के वास्तविक मूल्य की तुलना में, हम देख सकते हैं कि लगभग तीन पूर्ण आंकड़ों के लिए सटीक है, जो आमतौर पर प्रक्षेप के लिए बहुत अच्छा है, इसलिए इस मामले में, तुम रैखिक प्रक्षेप के साथ रहना होगा; मूल्य के लिए बेहतर कदम के साथ हमें जरूरत है कि हम अब प्रभावी ढंग से 3 आंकड़ा सटीकता की उम्मीद करेंगे।(67.505+90.531)/2=79.018

तो हम मिलते हैं: याx67.50579.08267.50557506050

x67.505+(79.08267.505)5750605075.61

वास्तविक मूल्य 75.62375 है, इसलिए हमें वास्तव में सटीकता के 3 आंकड़े मिले हैं और केवल चौथे आंकड़े में 1 से बाहर थे।

अधिक सटीक प्रक्षेप अभी भी परिमित अंतर के तरीकों (विशेष रूप से, विभाजित मतभेदों के माध्यम से) का उपयोग करके हो सकता है, लेकिन यह संभवतः सबसे अधिक परिकल्पना परीक्षण समस्याओं के लिए ओवरकिल है।

यदि आपकी स्वतंत्रता की डिग्री आपकी तालिका के अंत में जाती है, तो यह प्रश्न उस समस्या पर चर्चा करता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.