एसडी माध्य से बड़ा, गैर-ऋणात्मक पैमाना


9

मुझे एक लेख दिया गया था जो एक अध्ययन की रिपोर्ट करता है जो मेरी प्रयोगशाला में चलने की इच्छा के समान है। लेकिन, मैंने देखा कि ब्याज के चर के लिए, अवधि, एसडी माध्य से बड़ा है ... चूंकि यह अवधि मिनटों में मापी जाती है इसलिए यह कभी भी नकारात्मक नहीं हो सकती है और यह मुझे बहुत अजीब लगता है। रिपोर्ट किए गए 2 अध्ययनों में यह हुआ, नीचे एक है।

इसके अलावा, यह एक मिश्रित-डिज़ाइन है। नियंत्रण v उपचार (समूहों के बीच), और Time1, Time2, Time3 (दोहराने के उपाय)। यहां साधन (एसडी), एन> 200 हैं

                       Time1                Time2                  Time3 
Control               15.1 (14.6)          14.4 (14.8)            13.3 (15.7)
Treatment             14.8 (13.2)          10.0 (12.2)            8.2 (9.9)

... वे एक एनोवा दौड़े और पी <.001 की सूचना दी।

मुझे हमारे अध्ययन के लिए नमूना आकार निर्धारित करने के लिए एक शक्ति विश्लेषण के लिए एक आधार के रूप में इसका उपयोग करने के लिए कहा गया था। मुझे पूरा यकीन है कि यह इंगित करता है कि डेटा गैर-सामान्य है या इसमें आउटलेयर हैं और मैं इस पर आधारित नमूना आकार का निर्धारण करने में सहज महसूस नहीं करता हूं। क्या मैं सिर्फ आधार का रास्ता हूँ?


क्या आप सुनिश्चित हैं कि वे एसडी हैं और 95% विश्वास अंतराल नहीं हैं जो 3 * एसडी की तरह अधिक हो सकते हैं। ऐसा लगता है कि एसडी उन साधनों के आकार के समान हैं। यह कहना वास्तव में कठिन है कि नमूना आकार क्या है क्योंकि हम नहीं जानते कि उन त्रुटियों में क्या प्रभाव शामिल थे या यहां तक ​​कि सांख्यिकीय क्या है। यदि यह केवल आंकड़ों की गणना कर रहे थे, अर्थात पॉसों के वितरण में, एसडी से अधिक का मतलब 1 / Sqrt (N) जैसा होना चाहिए। हालाँकि यह N = 1 (या कुछ अधिक) होगा। क्या आप हमें इन आंकड़ों के बारे में अधिक जानकारी दे सकते हैं?
डेव ३१४१५

इसके अलावा, सामान्य वितरण का एक मतलब है और SD जो एक दूसरे से पूरी तरह से स्वतंत्र हैं। मुझे लगता है कि शायद आपका मतलब पॉसों का वितरण था।
डेव ३१४१५

2
अवधि के साथ जो गैर-नकारात्मक हैं, मैं आमतौर पर एक तिरछा वितरण की उम्मीद करता हूं। माध्य से तुलनीय एसडी पूरी तरह से संभव हैं और किसी भी मायने में आश्चर्यजनक नहीं हैं। अन्य गणनाओं के लिए क्या वितरण सबसे अच्छा माना जाता है, अधिक जानकारी के बिना सलाह नहीं दी जा सकती है, लेकिन मैं अपने पहले अनुमान के रूप में पॉइसन को नहीं चुनूंगा, बल्कि गामा या लॉगऑनॉर्मल।
निक कॉक्स

@NickCox नोटों के रूप में, w / durations मुझे आश्चर्य होगा अगर SD मतलब से बड़ा नहीं था (यदि कोई भंडारण नहीं था)। आप वीबुल वितरण पर भी विचार कर सकते हैं। शक्ति विश्लेषण को संभवतः अनुकरण-आधारित होना होगा। एक अलग नोट पर, मुझे लगता है कि एक एनोवा इस तरह से अमान्य w / डेटा था।
गूँग - मोनिका

1
के एक डेटा सेट के लिए nगैर-संख्‍यात्‍मक संख्‍या, गुणांक का गुणांक - माध्य के मानक विचलन का अनुपात - मानों को बड़े रूप में ले सकता हैO(n) जब सभी संख्याएँ हों तो चरम स्थिति में अधिकतम मान होता है 0एक को छोड़कर ( विवरण के लिए यह प्रश्न देखें)। इस प्रकार, औसत से अधिक मानक विचलन को एक असाधारण मामले के रूप में नहीं समझा जाना चाहिए, जिसमें बहुत सारे स्पष्टीकरण की आवश्यकता होती है।
दिलीप सरवटे

जवाबों:


5

गैर-नकारात्मक या सख्ती से सकारात्मक डेटा के साथ मानक से अधिक विचलन के लिए यह आसानी से संभव है

मैं आपके डेटा के मामले का वर्णन करता हूं क्योंकि मानक विचलन मतलब के करीब होता है (प्रत्येक मूल्य बड़ा नहीं होता है और जो बड़े होते हैं वे आमतौर पर करीब होते हैं)। गैर-नकारात्मक डेटा के लिए, यह स्पष्ट रूप से इंगित करता है कि डेटा तिरछा है (उदाहरण के लिए, भिन्नता के गुणांक के साथ गामा वितरण = 1 घातीय वितरण होगा, इसलिए यदि डेटा गामा थे, तो वे घातीय के पास कहीं दिखेंगे

हालांकि, नमूना आकार के उस प्रकार के साथ, एनोवा विशेष रूप से इससे बुरी तरह प्रभावित नहीं हो सकता है; पूल किए गए विचरण के अनुमान में अनिश्चितता बहुत छोटी होगी, इसलिए हम इस पर विचार कर सकते हैं कि CLT (साधनों के लिए) और स्लटस्की के प्रमेय (हर के लिए विचरण अनुमान के लिए) के बीच, एक ANOVA संभवतः यथोचित रूप से अच्छी तरह से हो जाएगा, ' ll के पास एक स्पर्शोन्मुख ची-वर्ग होगा, जिसके लिए ANOVA-F अपनी बड़ी हरकतों-डिग्री-से-स्वतंत्रता के साथ एक अच्छा सन्निकटन होगा। (यानी इसमें उचित स्तर की मजबूती होनी चाहिए, और चूंकि साधन निरंतर से बहुत दूर नहीं हैं, इसलिए शक्ति को हेट्रोसेकेडसिटी से बहुत बुरी तरह प्रभावित नहीं किया जाना चाहिए)

उस ने कहा, यदि आपके अध्ययन का एक छोटा नमूना आकार होगा, तो आप एक अलग परीक्षण (शायद एक क्रमचय परीक्षण, या एक GLM पर आधारित शायद एक तिरछी डेटा के लिए अधिक उपयुक्त) का उपयोग करके देखने से बेहतर हो सकते हैं। परीक्षण में बदलाव के लिए आपको सीधे एनोवा के लिए मिलने वाले नमूने की तुलना में कुछ बड़े आकार की आवश्यकता हो सकती है।

मूल डेटा के साथ आप एक उपयुक्त मॉडल / विश्लेषण के तहत एक शक्ति विश्लेषण कर सकते हैं। यहां तक ​​कि मूल डेटा की अनुपस्थिति में, कोई भी वितरण (शायद उनमें से एक किस्म) के बारे में अधिक प्रशंसनीय धारणा बना सकता है और पूरे पावर वक्र की जांच कर सकता है (या, अधिक सरलता से, केवल टाइप I त्रुटि दर और जो भी प्रभाव आकार में शक्ति है की रुचि है)। विभिन्न मान्य मान्यताओं का उपयोग किया जा सकता है, जो कुछ विचार देता है कि प्रशंसनीय परिस्थितियों में क्या शक्ति प्राप्त की जा सकती है, और नमूना आकार कितना बड़ा होना चाहिए।


4

आप यह निष्कर्ष निकालने में सही हैं कि डेटा गैर-सामान्य है। यदि डेटा सामान्य था, तो हम लगभग 16% अवलोकनों की अपेक्षा करेंगे, जो कि मानक विचलन से कम माध्य से कम होगा। एसडी के साथ माध्य से बड़ा यह संख्या नकारात्मक है और आप कहते हैं कि नकारात्मक संख्या नहीं हो सकती है, इसलिए आप जो देख रहे हैं वह डेटा के बजाय संगत नहीं है। एसडी मान संभव है, लेकिन केवल अगर वितरण बहुत सही तिरछा है (जो अवधि में सामान्य है)।

मैं मानता हूं कि डेटा मानने के आधार पर एक नमूना आकार चुनना सामान्य होगा, यह एक अच्छा विचार नहीं है, लेकिन अगर आप प्रक्रिया के बारे में अधिक जानकारी प्राप्त कर सकते हैं और एक सही तिरछा वितरण (एक संभावना के रूप में एक गामा वितरण) का पता लगा सकते हैं, जो एक उचित धारणा है, तो आप नमूना आकार निर्धारित करने में मदद करने के लिए उपयोग कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.