वेल्च टी-टेस्ट के लिए स्वतंत्रता की रिपोर्टिंग की डिग्री


14

असमान रूपांतरों के लिए वेल्ड टी-टेस्ट (जिसे वेल्च-सैटरथवेट या वेल्च-एस्पिन के रूप में भी जाना जाता है) में आम तौर पर स्वतंत्रता की एक पूर्णांक डिग्री होती है । परीक्षण के परिणामों की रिपोर्ट करते समय स्वतंत्रता की इन डिग्री को कैसे उद्धृत किया जाना चाहिए?

"विभिन्न स्रोतों के अनुसार मानक टी टेबल्स से परामर्श करने से पहले यह निकटतम पूर्णांक तक गोल करने के लिए पारंपरिक है" - जो गोलाई की इस दिशा को रूढ़िवादी के रूप में समझ में आता है। ** कुछ पुराने सांख्यिकीय सॉफ्टवेयर भी ऐसा करेंगे (उदाहरण के लिए ग्राफपैड प्रिज्म संस्करण से पहले) 6 ) और कुछ ऑनलाइन कैलकुलेटर अभी भी करते हैं। यदि इस प्रक्रिया का उपयोग किया गया था, तो स्वतंत्रता की गोल-डाउन डिग्री की रिपोर्ट करना उचित लगता है। (हालांकि कुछ बेहतर सॉफ़्टवेयर का उपयोग करना और भी अधिक उपयुक्त हो सकता है!)

लेकिन आधुनिक पैकेजों का अधिकांश हिस्सा भिन्नात्मक भाग का उपयोग करता है इसलिए इस मामले में ऐसा लगता है कि भिन्नात्मक भाग को उद्धृत किया जाना चाहिए। मैं इसे दो से अधिक दशमलव स्थानों पर उद्धृत करने के लिए उपयुक्त नहीं देख सकता, क्योंकि आजादी की डिग्री के एक हजारवें हिस्से में केवल पी पर ही नगण्य प्रभाव पड़ेगा ।

Google विद्वान के इर्द-गिर्द घूमते हुए, मैं df को संपूर्ण संख्या के रूप में, एक दशमलव स्थान या दो दशमलव स्थानों के साथ उद्धृत करते हुए देख सकता हूँ। क्या सटीकता का उपयोग करने के लिए कोई दिशानिर्देश हैं? इसके अलावा, अगर सॉफ्टवेयर पूर्ण आंशिक हिस्सा इस्तेमाल किया, पूर्ण होना df उद्धृत चाहिए नीचे (जैसे आंकड़े की वांछित संख्या के लिए 1 डी पी करने के लिए या 7 एक पूरी संख्या के रूप में) के रूप में रूढ़िवादी गणना के साथ उचित था , या जैसा कि मेरे लिए और अधिक समझदार लगता है, पारंपरिक रूप से ( निकटतम ) गोल किया गया है ताकि 7.5845 ... 7.6 से 1 डीपी या 8 सबसे पास हो?7.5845...7.577.5845...7.68

संपादित करें: गैर-पूर्णांक डीएफ रिपोर्टिंग के सबसे सैद्धांतिक रूप से ध्वनि को जानने से अलग, यह जानना भी अच्छा होगा कि लोग व्यवहार में क्या करते हैं । संभवतः पत्रिकाओं और शैली गाइड की अपनी आवश्यकताएं हैं। मुझे उत्सुकता होगी कि APA जैसी प्रभावशाली शैली के मार्गदर्शकों की क्या आवश्यकता है। जो मैं विचार कर सकता हूं (उनका मैनुअल ऑनलाइन उपलब्ध नहीं है), एपीए की एक सामान्य प्राथमिकता है कि लगभग सभी चीज़ों को दो दशमलव स्थानों पर दिखाई देना चाहिए, केवल- पी को छोड़कर (जो दो या तीन डीपी हो सकते हैं) और प्रतिशत (राउंड के लिए) निकटतम प्रतिशत) - जिसमें प्रतिगमन ढलान, टी आँकड़े, एफ आँकड़े, χ2आँकड़े और इतने पर। यह काफी अतार्किक बात है, यह ध्यान में रखते हुए कि दूसरा दशमलव स्थान एक बहुत ही महत्वपूर्ण आंकड़ा रखता है, और 982.47 की तुलना में 2.47 में काफी अलग सटीकता का सुझाव देता है, लेकिन हो सकता है कि दो दशमलव स्थानों के साथ वेल्च डीएफ की संख्या मैंने अपने अवैज्ञानिक नमूने में देखी हो। ।

जैसे रुक्स्टन, जीडी असमान विचरण टी-टेस्ट छात्र के टी-टेस्ट और मान-व्हिटनी यू परीक्षण , व्यवहार पारिस्थितिकी (जुलाई / अगस्त 2006) 17 (4): 688-690 doi: 10.1093 / beheco / के लिए एक अप्रयुक्त विकल्प है। ark016

हालांकि वेल्च-Satterthwaite सन्निकटन ही या रूढ़िवादी नहीं हो सकता है, और एक मामले में जहां यह रूढ़िवादी नहीं है, स्वतंत्रता की डिग्री नीचे गोलाई में समग्र प्रतिकारी की कोई गारंटी नहीं है हो सकता है।


1
मैंने वास्तविक अभ्यास का अध्ययन नहीं किया है - यही कारण है कि यह एक टिप्पणी है और एक उत्तर नहीं है - लेकिन मैं उम्मीद करूंगा कि यह महत्वपूर्ण आंकड़ों की रिपोर्टिंग से संबंधित निर्णय पर आधारित होगा। अपेक्षाकृत उच्च df के लिए, अक्सर पहले दशमलव स्थान में परिवर्तन से पी-मान बिल्कुल भी नहीं बदलेगा (सटीक सूचना के स्तर पर), इसलिए पूर्णांक में गोल करना ठीक है। बहुत कम डीएफ और टी के चरम मूल्यों के लिए , व्युत्पन्न | νt0.01से अधिक हो सकता है, ऐसे मामलों में सुझाव देते हुए किνकोpसे केवल एक ही कम महत्वपूर्ण आंकड़े की सूचना दी जानी चाहिए। |νFν(t)|0.01νp
whuber

@whuber यह वास्तव में एक उपयोगी अवलोकन है, खासकर जब Glen_b के उत्तर को एक साथ लिया जाता है। लिए "बहुत कम" कितना कम है ? (मेरे पास आए पत्रों के नमूने से मेरा संदेह यह है कि "वास्तविक अभ्यास" "अच्छी प्रैक्टिस" के समान नहीं हो सकता है! मुझे दिशानिर्देशों के अनुसार रोबोट पर संदेह है क्योंकि निर्णय पर उतना ही प्रभाव पड़ता है, जो कि दिलचस्प होगा! पता है कि सामान्य रिपोर्टिंग दिशा निर्देश हैं)।ν
silverfish

जवाबों:


10

मैंने वास्तविक अभ्यास का अध्ययन नहीं किया है, इसलिए यह उत्तर प्रश्न के उस पहलू को संबोधित नहीं कर सकता है। एक सामान्य सिद्धांत के रूप में मैं अपेक्षा करता हूं कि महत्वपूर्ण आंकड़ों से संबंधित निर्णय के आधार पर स्वतंत्रता की डिग्री (df) की रिपोर्टिंग में महत्वपूर्ण अंकों के उपचार की आवश्यकता होगी।

सिद्धांत सुसंगत होना है : एक मात्रा में सटीक का उपयोग करें जो किसी अन्य में उपयोग की गई परिशुद्धता के लिए उपयुक्त है जो इससे संबंधित है। विशेष रूप से, जब मान रिपोर्ट और y = ( एक्स ) जब एक्स एक छोटे मूल्य के निकटतम गुणज को दिया जाता है (जैसे = 1xy=f(x)xhदशमलव बिंदु के बाद छह स्थानों के लिए 2 ×10-6),फ़ंक्शनद्वारा मध्यस्थता के रूपमेंyमें सापेक्ष सटीकताहैh=12×106yf

suphkh|f(x+k)f(x)|h|ddxf(x)|.

सन्निकटन लागू होता है जब लगातार अंतराल पर भिन्न होता है [ x - h , x + h ]f[xh,x+h]

वर्तमान आवेदन में, है पी -value, एक्स स्वतंत्रता की डिग्री है νypxν , और

y=f(x)=f(ν)=Fν(t)

जहां वेल्च-स्टरथवेट स्टेटिस्टिक है और एफ ν स्टूडेंट टी डिस्ट्रीब्यूशन की सीडीएफ है जिसमें स्वतंत्रता की ν डिग्री है।tFνtν

अपेक्षाकृत उच्च df के लिए , अक्सर पहले दशमलव स्थान में परिवर्तन, (परिशुद्धता के स्तर सूचना के लिए) सब पर पी-मूल्य में परिवर्तन नहीं होगा तो एक पूर्णांक के लिए गोलाई ठीक है ( = 1 / 2 लेकिन | νh=1/2बहुत छोटा है)। बहुत कम df और सांख्यिकीयटी केचरम मूल्यों के लिए, व्युत्पन्न की भयावहता| h|ddxf(x)|t0.01से अधिक हो सकता है, ऐसे मामलों में सुझाव देता है किνकोpसे केवल एक कम दशमलव स्थान की सूचना दी जानी चाहिए।|νFν(t)|0.01νp

स्वयं देखें सबसे कम (उचित) df और की सीमाओं के लिए व्युत्पन्न की भयावहता के इस लेबल समोच्च साजिश के साथ यह ब्याज का होगा (क्योंकि वे कम पी-मूल्यों को जन्म दे सकते हैं)।|t|

Figure

लेबल व्युत्पन्न का आधार -10 लघुगणक दिखाते हैं। इस प्रकार, इस बिंदु पर और - ( k + 1 ) के बीच के बिंदुओं पर, दशमलव बिंदु के बाद j th स्थान में रिपोर्ट किए गए df को बदलने से संभवतः रिपोर्ट किए गए p-value केवल ( j + k ) वें और बाद में बदल जाएंगे स्थानों। उदाहरण के लिए, मान लीजिए कि आप पी-मान को 10 - 6 (छह दशमलव स्थानों) पर गोल कर रहे हैं। आंकड़ों पर विचार करें ν = 2.5 और t = 8 । ये - 3 के पास स्थित हैंk(k+1)jth(j+k)th106ν=2.5t=83ν6+(3)=3

kν

430

Figure 2

νpν


1
यह उन सिद्धांतों को स्थापित करने के लिए एक बहुत ही उपयोगी योगदान था, जो किसी ने स्वतंत्रता की डिग्री (+50!) को गोल करने के लिए किए थे; मुझे उम्मीद है कि बाद में उत्तर देने वाला वास्तविक अभ्यास के बारे में अंतराल भर सकता है।
सिल्वर फिश

7

मानक टी तालिकाओं से परामर्श करने से पहले निकटतम पूर्णांक तक गोल करना पारंपरिक है

कारण यह था कि एक सम्मेलन था क्योंकि तालिकाओं में नॉनटेन्जर df नहीं होता है। अन्यथा ऐसा करने का कोई कारण नहीं है।

यह समझ में आता है कि यह समायोजन रूढ़िवादी है।

खैर, आँकड़ा वास्तव में एक टी-वितरण नहीं है, क्योंकि वह चुकता भाजक वास्तव में एक स्केल ची-चुकता वितरण नहीं है। यह एक ऐसा अनुमान है जो किसी विशेष उदाहरण में रूढ़िवादी हो सकता है या नहीं भी हो सकता है - जब हम किसी विशेष उदाहरण में आँकड़ा के सटीक वितरण पर विचार करते हैं तो चक्कर लगाना df नीचे निश्चित नहीं हो सकता है।

(प्रक्षेप द्वारा या वास्तव में उस df के साथ टी-वितरण के लिए संख्याओं को क्रंच करके?)

टी-डिस्ट्रीब्यूशन से c-मान (t-statistic पर cdf को लागू करना) की गणना विभिन्न सटीक अनुमानों की एक किस्म द्वारा की जा सकती है, इसलिए वे प्रक्षेपित होने के बजाय प्रभावी रूप से गणना करते हैं।

मैं इसे दो से अधिक दशमलव स्थानों के लिए उद्धृत करना उचित नहीं देख सकता

मैं सहमत हूँ।

क्या सटीकता का उपयोग करने के लिए कोई दिशानिर्देश हैं?

एक संभावना यह जांचने के लिए हो सकती है कि पी-मान के लिए वेल्च-स्टरथवेट सन्निकटन कितना सही है, विचरण अनुपात के उस सामान्य क्षेत्र में है और इससे अधिक सापेक्ष सटीकता का उद्धरण नहीं देता है जो सुझाएगा कि df में था (ध्यान में रखते हुए कि df पर हर के वर्ग में ची-चुकता केवल कुछ के लिए एक सन्निकटन दे रहे हैं जो ची-चुकता नहीं है)।


1
मुझे फिर से स्पष्ट करना चाहिए था "गोल नीचे रूढ़िवादी है"। वेल्च- Satterthwaite सन्निकटन ही रूढ़िवादी हो सकता है या नहीं। लेकिन निश्चित रूप से नीचे गोलाई की प्रक्रिया है - यदि सन्निकटन शुरू करने के लिए रूढ़िवादी नहीं था, तो गोल चक्कर के बाद यह कम से कम कम खराब होता है। इसके विपरीत, राउंडिंग अप (उदाहरण के लिए "8 के पास 7.5845 राउंड") निश्चित रूप से एक रूढ़िवादी समायोजन नहीं है। मैं इस वाक्यांश को बेहतर तरीके से खोजने के साथ कर सकता था, लेकिन मुझे आशा है कि मेरी बात स्पष्ट है!
सिल्वरफिश नोव

"एक संभावना यह जांचने के लिए हो सकती है कि पी-मान के लिए वेल्च-स्टरथवेट सन्निकटन कितना सटीक है, जो कि विचरण अनुपात के सामान्य क्षेत्र में है" - यह बहुत समझदार है और राजसी दृष्टिकोण का प्रतीत होता है। क्या यह आमतौर पर किया जाता है? कार्यान्वयन के लिए कुछ संकेत अच्छा होगा। व्यवहार में मुझे संदेह है कि पत्रिका शैली के दिशानिर्देश अक्सर मामले पर अंतिम कहते हैं! लेकिन मुझे नहीं पता कि वे क्या कहते हैं - मेरी खोज में कागजात में निश्चित रूप से एक किस्म का अभ्यास था।
सिल्वरफिश नोव

भविष्य के पाठकों को भ्रम से बचने के लिए मैंने प्रश्न निकाय में पुनः रूढ़िवादी गोलाई को स्पष्ट करने का प्रयास किया है। इसे चुनने के लिए धन्यवाद।
सिल्वरफ़िश

I don't think anything like it is commonly done, but I don't think that means it shouldn't be. How much of explaining why one rounds/truncates to a certain point gets into the paper would clearly depend on the journal/editor/referees.
Glen_b -Reinstate Monica
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.