स्थानीय मोरन I सांख्यिकी (एलआईएसए) के लिए पी-मूल्य समायोजन


10

मैं कुछ खोजपूर्ण स्थानिक विश्लेषण के साथ काम कर रहा हूं R में spdep पैकेज का उपयोग कर रहा हूं।

मुझे फंक्शन का उपयोग करके गणना किए गए स्थानिक संघ (LISA) के स्थानीय संकेतकों के पी- अंतराल को समायोजित करने के लिए एक विकल्प मिला localmoran। डॉक्स के अनुसार इसका उद्देश्य है:

... कई परीक्षणों के लिए प्रायिकता मान समायोजन।

आगे के डॉक्स में p.adjustSPमैंने पढ़ा कि उपलब्ध विकल्प निम्न हैं:

समायोजन के तरीकों में बोन्फेरोनी सुधार ('' '' बोनफेरोनी '') शामिल है, जिसमें तुलनाओं की संख्या से पी-मानों को गुणा किया जाता है। होल्म (1979) ("" होल्म "'), होचबर्ग (1988) (" "हॉकबर्ग"'), हॉमेल (1988) ("" हॉमेल "') और बेनजामिनी और होचबर्ग (1995) में चार कम रूढ़िवादी सुधार भी शामिल हैं। ('' '' fdr ''), क्रमशः। पास-थ्रू विकल्प ('' '' कोई नहीं '') भी शामिल है।

पहले चार तरीकों को परिवार-वार त्रुटि दर का मजबूत नियंत्रण देने के लिए डिज़ाइन किया गया है। अनमॉडिफाइड बोनफेर्रोनी सुधार का उपयोग करने का कोई कारण नहीं लगता है क्योंकि यह होल्म की विधि द्वारा हावी है, जो मनमानी मान्यताओं के तहत भी मान्य है।

होचबर्ग के और हॉमेल के तरीके मान्य हैं जब परिकल्पना परीक्षण स्वतंत्र होते हैं या जब वे गैर-नकारात्मक रूप से जुड़े होते हैं (सरकार, 1998; सरकार और चांग, ​​1997)। होमबर्ग की विधि होचबर्ग की तुलना में अधिक शक्तिशाली है, लेकिन अंतर आमतौर पर छोटा है और होचबर्ग के पी-मानों की गणना तेजी से होती है।

बेनजामिनी, होचबर्ग, और येकुतेली की "बीएच" (उर्फ "एफडीआर") और "बीवाई" विधि झूठी खोज दर को नियंत्रित करती है, अस्वीकार किए गए परिकल्पनाओं के बीच झूठी खोजों का अपेक्षित अनुपात। झूठी खोज दर परिवार-वार त्रुटि दर की तुलना में कम कठोर स्थिति है, इसलिए ये विधियां दूसरों की तुलना में अधिक शक्तिशाली हैं।

सामने आए सवालों के जोड़े:

  1. सीधे शब्दों में - इस समायोजन का उद्देश्य क्या है?
  2. क्या इस तरह के सुधार का उपयोग करना आवश्यक है?
  3. यदि हाँ - उपलब्ध विकल्पों में से कैसे चुनें?

1
मैंने इस सवाल को माइग्रेट किया क्योंकि बहुत से इसे सीवी पर यहां संबोधित किया गया है। उदाहरण के लिए, आप खोज से क्या सीख सकते हैं, देखें ।
whuber

@ शुभ विचार। मैंने CV के बारे में नहीं सोचा था, लेकिन यह वास्तव में इसके लिए एक बेहतर घर है। धन्यवाद।
राडेक

जवाबों:


1

संक्षेप में, आप जिस समस्या का सामना कर रहे हैं उसे एकाधिक परिकल्पना परीक्षण कहा जाता है । यह उठता है जब आप परीक्षण कर रहे हैं, जैसा कि नाम से संकेत मिलता है, एक ही समय में कई परिकल्पना।

मान लीजिए कि आपके पास एक परीक्षण के लिए गलत परिकल्पना (गलत सकारात्मक) को गलत तरीके से अस्वीकार करने की दी गई संभावना है, 5% कहें। जैसे ही आप अपने द्वारा परीक्षण किए जा रहे डेटासेट की संख्या बढ़ाते हैं (इस मामले में, प्रत्येक सेट जहां आप स्थानीय मोरन स्टेटिस्टिक लागू करते हैं), किसी भी डेटासेट में झूठी सकारात्मक को देखने की संभावना बढ़ जाएगी, इस तथ्य से स्वतंत्र रूप से कि अवलोकन की संभावना। एक सिंगल डेटासेट के लिए गलत पॉज़िटिव समान है।

इस समस्या को ठीक करने के लिए कई संभावित "सुधार" हैं, जो आपको मिले हैं; अगर आपको वास्तव में स्थानीय सांख्यिकी की आवश्यकता है, तो आप इसे चकमा नहीं दे सकते। अन्यथा, आप एक ही परिकल्पना के रूप में वैश्विक सांख्यिकी का उपयोग कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.