सिदक या बोनफेरोनि?


13

मैं पौधों की 16 विभिन्न प्रजातियों पर कैटरपिलर (गैर-सामान्य, ट्वीडि वितरण का उपयोग करके) की औसत संख्या में अंतर को देखने के लिए एसपीएसएस में एक सामान्यीकृत रैखिक मॉडल का उपयोग कर रहा हूं।

मैं कई तुलनाएं चलाना चाहता हूं, लेकिन मुझे यकीन नहीं है कि मुझे एक सिडक या बोनफेरोनी सुधार परीक्षण का उपयोग करना चाहिए। दोनों परीक्षणों में क्या अंतर है? क्या यह दूसरे से बढ़िया है?


1
मुझे इस तथ्य से नफरत है कि मानक सुधारवादी परिकल्पना परीक्षण के साथ इस तरह के सुधारों की अक्सर आवश्यकता होती है और मैं बायेसियन तकनीकों को पसंद करता हूं। इसने कहा, मैं सिडक सुधार से नफरत करता हूं क्योंकि यह कम तदर्थ लगता है (यदि आप स्वतंत्रता की धारणा को स्वीकार करने के लिए तैयार हैं)। यह ज्यादातर व्यक्तिगत पसंद है, हालांकि मैंने इसे एक जवाब के बजाय टिप्पणी की।
माइकल मैकगोवन

1
@MichaelMcGowan: बस जिज्ञासु, लेकिन, क्या आप एक बोनफेरोनि सुधार के बारे में " तदर्थ " पर विचार करते हैं ?
कार्डिनल

@ कार्डिनल क्षमा करें, कि शायद शब्दों का सबसे अच्छा विकल्प नहीं था। मजबूत धारणाओं की आवश्यकता की कीमत पर (मैं उस लागत का तुच्छीकरण नहीं करना चाहता), सिडक सुधार अधिक गुणात्मक अर्थ के साथ एक बाध्य बनाता है। मैं वास्तव में गुणात्मक रूप से यह नहीं बता सकता कि बॉनर की असमानता के अनुसार बाध्य सबसे खराब स्थिति से एक तरह से बॉनफ्रॉनी सुधार में कौन सा बाध्य प्रतिनिधित्व करता है।
Mc में माइकल मैकगोवन

@MichaelMcGowan: आह, ठीक है। समझा। मुझे लगता है कि कुछ गुणात्मक बातें हैं जो बोन्फ्रॉनी के बारे में कह सकते हैं: (ए) यह परिवार की त्रुटि दर के खिलाफ गारंटीकृत सुरक्षा प्रदान करता है, भले ही अशक्त के तहत व्यक्तिगत परीक्षण के आँकड़ों के बीच निर्भरता की परवाह किए बिना और (ख) यह बिल्कुल सही सुधार है अलग-अलग परिकल्पना परीक्षणों के अस्वीकृति क्षेत्रों को जोड़दार बनाने के लिए जब जोड़ीदार असहमति होती है।
कार्डिनल

1
यदि एक परीक्षण के लिए एक प्रकार की त्रुटि मैं दूसरे परीक्षण के लिए संबंधित है तो दो परीक्षण स्वतंत्र नहीं हैं। उदाहरण के लिए, मान लीजिए कि आप एक नियंत्रण स्थिति और दो परीक्षण स्थितियों के साथ एक प्रयोग चलाते हैं। प्रत्येक परीक्षण स्थिति की नियंत्रण स्थिति से तुलना करने वाले दो परीक्षण स्वतंत्र नहीं हैं। आप इस पर विचार करके देख सकते हैं कि क्या होता है यदि आप संयोग से नियंत्रण की स्थिति के लिए एक चरम मूल्य प्राप्त करते हैं। इससे दोनों परीक्षणों के सांख्यिकीय रूप से महत्वपूर्ण होने की संभावना अधिक होगी।

जवाबों:


20

यदि आप अपने महत्वपूर्ण स्तर के रूप में α का उपयोग करके स्वतंत्र सांख्यिकीय परीक्षण चलाते हैं , और प्रत्येक मामले में अशक्तता प्राप्त होती है, तो आप पाएंगे कि 'महत्व' एक यादृच्छिक चर से एक ड्रॉ है। विशेष रूप से, यह p = α और n = k के साथ द्विपद वितरण से लिया जाता है । उदाहरण के लिए, यदि आप α = .05 का उपयोग करके 3 परीक्षण चलाने की योजना बनाते हैं , और (आपके लिए अनजान) वास्तव में प्रत्येक मामले में कोई अंतर नहीं है, तो प्रत्येक परीक्षण में एक महत्वपूर्ण परिणाम खोजने का 5% मौका है। इस तरह, प्रकार मैं त्रुटि दर करने के लिए आयोजित किया जाता है αkαp=αn=kα=.05αव्यक्तिगत रूप से परीक्षणों के लिए, लेकिन 3 परीक्षणों के सेट के दौरान लंबे समय तक चलने वाली I त्रुटि दर अधिक होगी। यदि आप मानते हैं कि इन 3 परीक्षणों को एक साथ समूहित करना / सोचना सार्थक है, तो आप सेट के लिए पर टाइप I त्रुटि दर को व्यक्तिगत रूप से नहीं बल्कि संपूर्ण रूप से पकड़ सकते हैं । आपको इस बारे में कैसे जाना चाहिए? दो दृष्टिकोण हैं जो मूल α (यानी, α o ) से एक नए मूल्य (यानी, α n e w ) पर स्थानांतरित करने के लिए केंद्र हैं :αααoαnew

बोन्फ्र्रोनी: 'महत्व' का आकलन करने के लिए इस्तेमाल किए जाने वाले को ऐसे समायोजित करें किα

αnew=αok

डन-सिडक: का उपयोग करके समायोजित करेंα

αnew=1(1αo)1/k

(ध्यान दें कि डन-सिडक मानता है कि सेट के भीतर सभी परीक्षण एक-दूसरे से स्वतंत्र हैं और परिवारवाद प्रकार मैं त्रुटि मुद्रास्फीति पैदा कर सकता है यदि यह धारणा नहीं रखती है।)

यह नोट करना महत्वपूर्ण है कि जब परीक्षणों के संचालन, देखते हैं त्रुटियों के दो प्रकार है कि आप से बचना चाहते हैं, मैं (यानी, कह रही है वहाँ प्रकार है एक अंतर है जब वहाँ एक नहीं है) और प्रकार द्वितीय (यानी, कह रही है वहाँ नहीं है एक अंतर जब वास्तव में है)। आमतौर पर, जब लोग इस विषय पर चर्चा करते हैं, तो वे केवल चर्चा करते हैं - और केवल मुझे पता है कि मैं किस प्रकार से संबंधित / संबंधित हूं। इसके अलावा, लोग अक्सर यह उल्लेख करने के लिए उपेक्षा करते हैं कि गणना की गई त्रुटि दर केवल तभी होगी जब सभी नल सही होंगे। यह स्पष्ट रूप से स्पष्ट है कि आप एक प्रकार की त्रुटि नहीं कर सकते हैं यदि अशक्त परिकल्पना झूठी है, लेकिन इस मुद्दे पर चर्चा करते समय उस तथ्य को स्पष्ट रूप से ध्यान में रखना महत्वपूर्ण है।

मैं इसे सामने लाता हूं क्योंकि इन तथ्यों के निहितार्थ हैं जो अक्सर प्रकट नहीं होते हैं। सबसे पहले, यदि , डन-सिडक दृष्टिकोण उच्च शक्ति की पेशकश करेगा (हालांकि अंतर छोटे k के साथ काफी कम हो सकता है ) और इसलिए हमेशा (जब लागू हो) को प्राथमिकता दी जानी चाहिए। दूसरा, एक 'स्टेप-डाउन' दृष्टिकोण का उपयोग किया जाना चाहिए। यही है, सबसे पहले प्रभाव का परीक्षण करें; यदि आप आश्वस्त हैं कि अशक्त स्थिति में प्राप्त नहीं होता है, तो I की त्रुटियों की अधिकतम संभव संख्या k - 1 है , इसलिए अगले परीक्षण को तदनुसार समायोजित किया जाना चाहिए, और इसी तरह। (यह अक्सर लोगों को असहज बनाता है और मछली पकड़ने जैसा दिखता है, लेकिन ऐसा नहीं हैk>1kk1मछली पकड़ना, जैसा कि परीक्षण स्वतंत्र हैं, और आपने कभी भी डेटा को देखने से पहले उन्हें संचालित करने का इरादा किया था। यह बेहतर तरीके से समायोजित करने का एक तरीका है ।) α

उपरोक्त कोई फर्क नहीं पड़ता कि आप II त्रुटियों के प्रकार के संबंध में आप किस प्रकार टाइप करते हैं। हालांकि, एक प्राथमिकता-प्राथमिकता यह मानने का कोई कारण नहीं है कि टाइप I त्रुटियां टाइप II से भी बदतर हैं (इस तथ्य के बावजूद कि हर कोई ऐसा लगता है)। इसके बजाय, यह एक निर्णय है जो शोधकर्ता द्वारा किया जाना चाहिए, और उस स्थिति के लिए विशिष्ट होना चाहिए। व्यक्तिगत रूप से, अगर मैं सैद्धांतिक रूप से सुझाए गए, पूर्व-प्राथमिक , ऑर्थोगोनल विरोधाभासों को चला रहा हूं, तो मैं आमतौर पर समायोजित नहीं करता हूं ।α

α


+1। क्या आप बोनफरोनी के लिए एक "स्टेप-डाउन" दृष्टिकोण कहते हैं, जो कि होल्म-बोनफेरोनी विधि के रूप में जाना जाता है, इसके बराबर है। यदि हाँ, तो क्या दून-सिदक में एक ही तर्क लागू होता है?
अमीबा का कहना है कि मोनिका

1
@amoeba, हाँ इसे कभी-कभी "होल्म की विधि" कहा जाता है, इसलिए होल्म-बोन्फेरोनी या होल्म-सिडक।
गूँग - मोनिका

αα

@amoeba, 1 अध्ययन में 3-प्राथमिकताओं, रूढ़िवादी विरोधाभासों को चलाने वाला, 3 अलग-अलग अध्ययनों में से प्रत्येक में 1-प्राथमिकताओं के विपरीत चलने से कोई भिन्न नहीं है। चूंकि कोई भी यह तर्क नहीं देता है कि आपको बाद के लिए परिवार के सुधार की आवश्यकता है, इसलिए पूर्व के लिए उनकी आवश्यकता का कोई सुसंगत कारण नहीं है। आपके अन्य उदाहरण में, यदि नियंत्रण समूह को अकेले संयोग से कम उछाल देना चाहिए, तो आपके प्रत्येक 5 विरोधाभास अच्छे दिखेंगे; लेकिन ऐसा होने की संभावना नहीं है यदि आप 5 स्वतंत्र अध्ययन चलाते हैं। आपको वास्तव में समायोजन के कुछ रूप का उपयोग करना चाहिए, या आप डननेट के परीक्षण का उपयोग कर सकते हैं ।
गंग - मोनिका

N(0,1)n=10α=0.05

6

ααnα=α/nα=1(1α)1/n

α/n<1(1α)1/n

यदि आपको एक और भी अधिक शक्तिशाली प्रक्रिया की आवश्यकता है, तो आप बोनफेरोनी-होल्म प्रक्रिया का उपयोग करना चाह सकते हैं।


बोन्फेरोनी को संभालना सरल क्यों है?
एमिली

3
αn1(1α)1/n

@Momo कंप्यूटर वास्तव में, अंकगणित में वास्तव में अच्छे हैं, इसलिए मुझे सरलता का तर्क बहुत सम्मोहक नहीं लगता। सौ साल पहले जब हाथ से गणना की जा रही थी, तो निश्चित रूप से एक बहुत अलग कहानी थी।
माइकल मैकगोवन

मेरे जवाब की तुलना में +1, यह काफी हद तक इस बिंदु तक पहुंच जाता है; ;-)
गंग - मोनिका

Haha कि मैं क्या सोचा था कि तुम मतलब है! बहुत बहुत धन्यवाद!
एमिली

5

सिडक सुधार मानता है कि व्यक्तिगत परीक्षण सांख्यिकीय रूप से स्वतंत्र हैं। बोन्फेरोनी सुधार यह नहीं मानता है।


इसका मतलब यह है कि Bonferroni बस एक अधिक रूढ़िवादी परीक्षण है?
एमिली

1
जब दोनों परीक्षण उपयुक्त हों तो बोनफेरोनी अधिक रूढ़िवादी होता है। लेकिन अगर आपके परीक्षण स्वतंत्र नहीं हैं, तो आपको सिडक का उपयोग नहीं करना चाहिए।
onestop

2
+1 यह है कि बोनफ्रोनी सुधार के लिए परीक्षणों के स्वतंत्र होने की आवश्यकता नहीं है यह एक अच्छा बिंदु है जिसे मैंने कवर नहीं किया है।
गूँग - मोनिका

@onestop: इसका क्या मतलब है कि परीक्षण स्वतंत्र हैं? क्या आप शायद एक उदाहरण दे सकते हैं?
गनहिल्ड जूल 15'13

1
सिडक सुधार में स्वतंत्रता की आवश्यकता नहीं है। यह केवल मानता है कि परीक्षण नकारात्मक रूप से निर्भर नहीं हैं। सकारात्मक निर्भरता ठीक है।
बोनफरोनी 16

4

सिडक और बोनफेरोनी इतनी समान हैं कि आप शायद एक ही परिणाम प्राप्त करेंगे चाहे आप किस प्रक्रिया का उपयोग करें। बोनाक्रोनी सिराक की तुलना में केवल थोड़ा अधिक रूढ़िवादी है। उदाहरण के लिए, 2 तुलनाओं और .05 के परिवारवार अल्फा के लिए, सिदक .0253 में प्रत्येक परीक्षण करेगा और बोन्फ्र्रोनी .0250 पर प्रत्येक परीक्षण करेगा।

इस साइट पर कई टिप्पणीकारों ने कहा है कि सिडक केवल तभी मान्य है जब आपकी तुलना के परीक्षण के आंकड़े स्वतंत्र हों। यह सच नहीं है। जब परीक्षण के आंकड़े NEGATIVELY निर्भर होते हैं, तो सिडक परिवार की त्रुटि दर की थोड़ी मुद्रास्फीति की अनुमति देता है, लेकिन यदि आप दो तरफा परीक्षण कर रहे हैं, तो नकारात्मक निर्भरता आमतौर पर चिंता का विषय नहीं है। गैर-नकारात्मक निर्भरता के तहत, सिडक वास्तव में परिवार की त्रुटि दर पर एक ऊपरी बाध्यता प्रदान करता है। उन्होंने कहा, ऐसी अन्य प्रक्रियाएं हैं जो इस तरह की बाध्यता प्रदान करती हैं और सिडक की तुलना में अधिक सांख्यिकीय शक्ति को बनाए रखने की प्रवृत्ति है। इसलिए सिडक शायद सबसे अच्छा विकल्प नहीं है।

एक चीज़ जो बोनफेरोनी प्रक्रिया प्रदान करती है (जो कि सिडक नहीं है) टाइप I त्रुटियों की अपेक्षित संख्या का सख्त नियंत्रण है - तथाकथित "प्रति परिवार त्रुटि दर," जो परिवारवार त्रुटि दर से अधिक रूढ़िवादी है। अधिक जानकारी के लिए, देखें: फ्रेंक, एवी (2015) "क्या प्रति परिवार प्रकार I त्रुटि दर सामाजिक और व्यवहार विज्ञान में प्रासंगिक है?" जर्नल ऑफ मॉडर्न एप्लाइड स्टैटिस्टिकल मेथड्स 14 (1), 12-23।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.