यह उत्तर दो मुख्य भागों में है: पहला, रैखिक प्रक्षेप का उपयोग करना , और दूसरा, अधिक सटीक प्रक्षेप के लिए परिवर्तनों का उपयोग करना। जब आपके पास सीमित टेबल उपलब्ध हैं, तो यहां चर्चा किए गए दृष्टिकोण हाथ की गणना के लिए उपयुक्त हैं, लेकिन यदि आप पी-मूल्यों का उत्पादन करने के लिए कंप्यूटर की दिनचर्या को लागू कर रहे हैं, तो बहुत बेहतर दृष्टिकोण हैं (यदि थकाऊ जब हाथ से किया जाता है) तो इसके बजाय इसका उपयोग किया जाना चाहिए।
यदि आप जानते हैं कि एक z- परीक्षण के लिए १०% (एक पूंछ) महत्वपूर्ण मूल्य १.२ 10 था और २०% महत्वपूर्ण मूल्य ०. guess४ था, तो १५% महत्वपूर्ण मूल्य पर एक मोटा अनुमान आधे रास्ते में होगा - (१.२ + + ०. )४) / 2 = 1.06 (वास्तविक मूल्य 1.0364 है), और 12.5% मूल्य का अनुमान लगाया जा सकता है कि आधे रास्ते में और 10% मूल्य (1.28 + 1.06) / 2 = 1.17 (वास्तविक मूल्य 1.15+)। यह वही है जो रैखिक प्रक्षेप करता है - लेकिन 'आधे रास्ते के बीच' के बजाय, यह दो मानों के बीच के रास्ते के किसी भी अंश को देखता है।
रैखिक रैखिक प्रक्षेप
आइए सरल रैखिक प्रक्षेप के मामले को देखें।
तो हमारे पास कुछ फ़ंक्शन ( कहना है ), जो हमें लगता है कि हम अनुमानित मूल्य के पास लगभग रैखिक हैं, और हमारे पास फ़ंक्शन का एक मूल्य है जो हम चाहते हैं, उदाहरण के लिए, जैसे:x
x81620y9.3y1615.6
दो मान जिनके हम जानते हैं 12 (20-8) अलग हैं। देखें कि कैसे -value (वह जिसे हम अनुमानित -value चाहते हैं ) 12 के अंतर को 8: 4 (16-8 और 20-16) के अनुपात में विभाजित करता है? यही है, यह पहले -value से आखिरी तक की दूरी का 2/3 है । यदि संबंध रैखिक थे, तो y- मानों की संबंधित सीमा समान अनुपात में होगी।य x य xxyxyx
तो लगभग उसी तरह होना चाहिए जैसा कि । 16-8y16−9.315.6−9.316−820−8
यहy16−9.315.6−9.3≈16−820−8
उलटफेर:
y16≈9.3+(15.6−9.3)16−820−8=13.5
सांख्यिकीय तालिकाओं के साथ एक उदाहरण: यदि हमारे पास 12 डीएफ के लिए निम्नलिखित महत्वपूर्ण मानों के साथ एक टी-टेबल है:
(2-tail)α0.010.020.050.10t3.052.682.181.78
हम 12 df के साथ t का महत्वपूर्ण मान और 0.025 का दो-पूंछ वाला अल्फा चाहते हैं। यही है, हम उस तालिका के 0.02 और 0.05 पंक्ति के बीच में अंतर करते हैं:
α0.020.0250.05t2.68?2.18
" " का मान मान है जो हम अनुमानित रैखिक का उपयोग करना चाहते हैं। ( मेरा वास्तव में मतलब है कि वितरण के उलटा का बिंदु ।)t 0.025 t 0.025 1 - 0.025 / 2 t 12?t0.025t0.0251−0.025/2t12
पहले की तरह, विभाजित से अंतराल करने के लिए अनुपात में के लिए (यानी ) और अज्ञात -value विभाजित चाहिए रेंज करने के लिए उसी अनुपात में; समतुल्य, होता है साथ रास्ते का वें भाग , इसलिए अज्ञात -value को साथ वें रास्ते में होना चाहिए ।0.02 0.05 ( 0.025 - 0.02 ) ( 0.05 - 0.025 )0.0250.020.05(0.025−0.02)(0.05−0.025)टी टी 2.68 2.18 0.025 ( 0.025 - 0.02 ) / ( 0.05 - 0.02 ) = 1 / 6 एक्स टी 1 / 6 टी1:5tt2.682.180.025(0.025−0.02)/(0.05−0.02)=1/6xt1/6t
यह या समकक्ष हैt0.025−2.682.18−2.68≈0.025−0.020.05−0.02
t0.025≈2.68+(2.18−2.68)0.025−0.020.05−0.02=2.68−0.516≈2.60
वास्तविक उत्तर ... जो विशेष रूप से करीब नहीं है क्योंकि हम जिस फ़ंक्शन का अनुमान लगा रहे हैं, वह उस श्रेणी में रैखिक के करीब नहीं है (लगभग यह है)।2.56α=0.5
परिवर्तन के माध्यम से बेहतर सन्निकटन
हम अन्य कार्यात्मक रूपों द्वारा रैखिक प्रक्षेप की जगह ले सकते हैं; वास्तव में, हम एक ऐसे पैमाने में बदल जाते हैं, जहां रैखिक प्रक्षेप बेहतर काम करता है। इस मामले में, पूंछ में, कई सारणीबद्ध महत्वपूर्ण मान महत्व स्तर के से लगभग अधिक रैखिक होते हैं । जब हम s लेते हैं , तो हम पहले की तरह रैखिक प्रक्षेप लागू करते हैं। चलिए कोशिश करते हैं कि उपरोक्त उदाहरण पर:loglog
α0.020.0250.05log(α)−3.912−3.689−2.996t2.68t0.0252.18
अभी
t0.025−2.682.18−2.68≈=log(0.025)−log(0.02)log(0.05)−log(0.02)−3.689−−3.912−2.996−−3.912
या समकक्ष
t0.025≈=2.68+(2.18−2.68)−3.689−−3.912−2.996−−3.9122.68−0.5⋅0.243≈2.56
जो आंकड़ों की उद्धृत संख्या के लिए सही है। इसका कारण यह है - जब हम x- स्केल को लघुगणक रूप देते हैं - संबंध लगभग रैखिक है:
दरअसल, नेत्रहीन वक्र (ग्रे) सीधी रेखा (नीला) के शीर्ष पर बड़े करीने से स्थित होता है।
कुछ मामलों में, logit महत्व स्तर (के ) एक व्यापक रेंज पर अच्छी तरह से काम कर सकता है, लेकिन आमतौर पर आवश्यक नहीं है (हम आमतौर पर केवल सटीक महत्वपूर्ण मूल्यों के बारे में परवाह करते हैं, जब काफी छोटा होता है, तो काफी अच्छी तरह से काम करता है)।logit(α)=log(α1−α)=log(11−α−1)αlog
स्वतंत्रता के विभिन्न अंशों में प्रक्षेप
t , chi-square और tables में स्वतंत्रता की डिग्री भी होती है, जहाँ हर df ( -) मान को सारणीबद्ध नहीं किया जाता है। ज्यादातर महत्वपूर्ण मान df में रैखिक प्रक्षेप द्वारा सही ढंग से दर्शाए नहीं गए हैं। वास्तव में, अक्सर यह लगभग मामला है कि सारणीबद्ध मान df, के पारस्परिक में रैखिक होते हैं ।Fν†1/ν
(पुरानी तालिकाओं में आप अक्सर साथ काम करने के लिए एक सिफारिश देखेंगे - अंश पर निरंतर कोई फर्क नहीं पड़ता, लेकिन पूर्व-कैलकुलेटर दिनों में अधिक सुविधाजनक था क्योंकि 120 में बहुत सारे कारक हैं, इसलिए अक्सर एक पूर्णांक होता है, जिससे गणना थोड़ी सरल हो जाती है।)120/ν120/ν
यहाँ बताया गया है कि व्युत्क्रम प्रक्षेप 5 से 5% महत्वपूर्ण मान पर और । यही है, केवल समापन बिंदु में प्रक्षेप में भाग लेते हैं । उदाहरण के लिए, लिए महत्वपूर्ण मान की गणना करने के लिए , हम लेते हैं (और ध्यान दें कि यहाँ cdf के व्युत्क्रम का प्रतिनिधित्व करता है):F4,νν=601201/νν=80F
F4,80,.95≈F4,60,.95+1/80−1/601/120−1/60⋅(F4,120,.95−F4,60,.95)
( यहां आरेख से तुलना करें )
† ज्यादातर लेकिन हमेशा नहीं। यहां एक उदाहरण है जहां df में रैखिक प्रक्षेप बेहतर है, और तालिका से कैसे बताएं कि रेखीय प्रक्षेप सटीक होने वाला है, इसकी व्याख्या।
यहां ची-स्क्वैयर टेबल का एक टुकड़ा है
Probability less than the critical value
df 0.90 0.95 0.975 0.99 0.999
______ __________________________________________________
40 51.805 55.758 59.342 63.691 73.402
50 63.167 67.505 71.420 76.154 86.661
60 74.397 79.082 83.298 88.379 99.607
70 85.527 90.531 95.023 100.425 112.317
कल्पना कीजिए कि हम स्वतंत्रता की 57 डिग्री के लिए 5% महत्वपूर्ण मूल्य (95 वीं प्रतिशतता) प्राप्त करना चाहते हैं।
करीब से देखने पर, हम देखते हैं कि तालिका की प्रगति में 5% महत्वपूर्ण मूल्य लगभग रैखिक रूप से यहाँ हैं:
(हरी रेखा 50 और 60 df के मान से जुड़ती है; आप देख सकते हैं कि यह 40 और 70 के लिए डॉट्स को छूती है)
तो रैखिक प्रक्षेप बहुत अच्छा करेगा। लेकिन निश्चित रूप से हमारे पास ग्राफ खींचने का समय नहीं है; लीनियर इंटरपोलेशन का उपयोग कब करना है और कब और अधिक जटिल कुछ करने की कोशिश करना है?
साथ ही हम जो भी तलाश करते हैं उसका मान, अगला निकटतम मान (इस मामले में 70) लेते हैं। यदि मध्य सारणीबद्ध मान (df = 60 के लिए एक) अंत मानों (50 और 70) के बीच रैखिक के करीब है, तो रैखिक प्रक्षेप उपयुक्त होगा। इस मामले में मूल्यों equispaced कर रहे हैं तो यह विशेष रूप से आसान है: है के करीब ?x 60 , 0.95(x50,0.95+x70,0.95)/2x60,0.95
हम पाते हैं कि , जब 60 df, 79.082 के वास्तविक मूल्य की तुलना में, हम देख सकते हैं कि लगभग तीन पूर्ण आंकड़ों के लिए सटीक है, जो आमतौर पर प्रक्षेप के लिए बहुत अच्छा है, इसलिए इस मामले में, तुम रैखिक प्रक्षेप के साथ रहना होगा; मूल्य के लिए बेहतर कदम के साथ हमें जरूरत है कि हम अब प्रभावी ढंग से 3 आंकड़ा सटीकता की उम्मीद करेंगे।(67.505+90.531)/2=79.018
तो हम मिलते हैं: याx−67.50579.082−67.505≈57−5060−50
x≈67.505+(79.082−67.505)⋅57−5060−50≈75.61 ।
वास्तविक मूल्य 75.62375 है, इसलिए हमें वास्तव में सटीकता के 3 आंकड़े मिले हैं और केवल चौथे आंकड़े में 1 से बाहर थे।
अधिक सटीक प्रक्षेप अभी भी परिमित अंतर के तरीकों (विशेष रूप से, विभाजित मतभेदों के माध्यम से) का उपयोग करके हो सकता है, लेकिन यह संभवतः सबसे अधिक परिकल्पना परीक्षण समस्याओं के लिए ओवरकिल है।
यदि आपकी स्वतंत्रता की डिग्री आपकी तालिका के अंत में जाती है, तो यह प्रश्न उस समस्या पर चर्चा करता है।