FPR (झूठी सकारात्मक दर) बनाम FDR (झूठी खोज दर)


20

निम्नलिखित उद्धरण स्टोरी और टिबशिरानी (2003) द्वारा जीनोम विस्तृत अध्ययन के लिए प्रसिद्ध शोध पत्र सांख्यिकीय महत्व से आता है :

उदाहरण के लिए, 5% की एक झूठी सकारात्मक दर का मतलब है कि अध्ययन में वास्तव में शून्य सुविधाओं के औसतन 5% को महत्वपूर्ण कहा जाएगा। 5% की FDR (झूठी डिस्कवरी दर) का अर्थ है कि महत्वपूर्ण कहे जाने वाले सभी सुविधाओं में, इनमें से 5% वास्तव में औसत रूप से अशक्त हैं।

क्या कोई समझा सकता है कि साधारण संख्यात्मक या दृश्य उदाहरण का उपयोग करने का क्या मतलब है? मुझे यह समझने में कठिन समय हो रहा है कि इसका क्या मतलब है। मैंने अकेले एफडीआर या एफपीआर पर विभिन्न पोस्ट पाए हैं, लेकिन कोई भी ऐसा नहीं पाया है जहां एक विशिष्ट तुलना की गई थी।

यह विशेष रूप से अच्छा होगा यदि इस क्षेत्र में कोई विशेषज्ञ उन स्थितियों को चित्रित कर सकता है जहां एक दूसरे से बेहतर है, या दोनों अच्छे या बुरे हैं।


3
मैंने देखा है कि आपने @ mkt के जवाब को एक इनाम, नसीर से सम्मानित किया है। यदि उस उत्तर ने आपके लिए आपके प्रश्न को हल कर दिया है, तो आप बाउंटी इंडिकेटर के नीचे बाईं ओर चेक मार्क पर क्लिक करके भी इसे स्वीकार कर सकते हैं।
गूँग - मोनिका

जवाबों:


29

मैं इन्हें कुछ अलग तरीकों से समझाने जा रहा हूं क्योंकि इससे मुझे इसे समझने में मदद मिली।

चलो एक विशिष्ट उदाहरण लेते हैं। आप लोगों के समूह पर एक बीमारी के लिए एक परीक्षण कर रहे हैं। अब कुछ शब्दों को परिभाषित करते हैं। निम्नलिखित में से प्रत्येक के लिए, मैं एक ऐसे व्यक्ति की बात कर रहा हूँ जिसका परीक्षण किया गया है:

ट्रू पॉजिटिव (टीपी) : बीमारी है, जिसे बीमारी के रूप में पहचाना जाता है

झूठी सकारात्मक (एफपी) : बीमारी नहीं है, बीमारी होने के रूप में पहचाना जाता है

ट्रू नेगेटिव (TN) : बीमारी नहीं होती है, इस बीमारी की पहचान नहीं होती है

झूठी नकारात्मक (FN) : बीमारी है, जिसे बीमारी नहीं होने के रूप में पहचाना जाता है

आमतौर पर, यह आमतौर पर भ्रम मैट्रिक्स का उपयोग करके दिखाया जाता है :

यहां छवि विवरण दर्ज करें

झूठी सकारात्मक दर (fpr) लोग हैं, जो बीमारी नहीं है, लेकिन रोग (सभी fps), होने के रूप में पहचाने जाते हैं की संख्या है , जो रोग नहीं है लोगों की कुल संख्या से विभाजित (शामिल सभी एफपीएस और टीएनएस) ।

एफपीआर=एफपीएफपी+टीएन

झूठी खोज दर (एफडीआर) लोग हैं, जो बीमारी नहीं है, लेकिन रोग (सभी fps) होने के रूप में पहचाने जाते हैं की संख्या है, लोग हैं, जो रोग होने के रूप में पहचाने जाते हैं की कुल संख्या से विभाजित (सभी एफपीएस और टी पी एस शामिल )।

एफडीआर=एफपीएफपी+टीपी


तो, अंतर भाजक में है यानी आप झूठी सकारात्मक की संख्या की तुलना कर रहे हैं?

FPR आप सभी लोग हैं, जो बीमारी है जो रोग होने के रूप में पहचान की जाएगी की जरूरत नहीं है के अनुपात में बोल रहा है।

एफडीआर आप सभी लोग इस बीमारी जो रोग नहीं है होने के रूप में पहचान के अनुपात में बोल रहा है।

दोनों इसलिए उपयोगी हैं, विफलता के विशिष्ट उपाय। स्थिति और टीपी, एफपी, टीएन और एफएन के अनुपात के आधार पर, आप एक के बारे में अधिक ध्यान रख सकते हैं कि दूसरा।


आइये अब इसके लिए कुछ नंबर डालते हैं। आपने बीमारी के लिए 100 लोगों को मापा है और आपको निम्नलिखित मिलते हैं:

सच सकारात्मक (टीपी) : 12

झूठी सकारात्मक (एफपी) : 4

सच नकारात्मक (TNs) : 76

झूठी नकारात्मक (FNs) : 8

भ्रम मैट्रिक्स का उपयोग करके यह दिखाने के लिए:

यहां छवि विवरण दर्ज करें

फिर,

एफपीआर=एफपीएफपी+टीएन=44+76=480=0.05=5%

एफडीआर=एफपीएफपी+टीपी=44+12=416=0.25=25%

दूसरे शब्दों में,

एफपीआर आपको बताता है कि जिन लोगों को बीमारी नहीं थी, उनमें से 5% लोगों की पहचान बीमारी होने के रूप में हुई थी। एफडीआर आपको बताता है कि 25% लोग जिनकी पहचान इस बीमारी के रूप में की गई थी, वास्तव में यह बीमारी नहीं थी।


EDIT @ अमीबा की टिप्पणी के आधार पर (ऊपर उदाहरण में संख्याएँ भी):

भेद इतना महत्वपूर्ण क्यों है? आपके द्वारा लिंक किए गए पेपर में, स्टोरी और टिब्शिरानी इशारा कर रहे हैं कि जीनोमाइड अध्ययनों में एफपीआर (या टाइप I त्रुटि दर) पर एक मजबूत ध्यान केंद्रित किया गया था, और यह त्रुटिपूर्ण निष्कर्ष बनाने के लिए अग्रणी था। ऐसा इसलिए है क्योंकि एक बार जब आप एफपीआर को ठीक करके महत्वपूर्ण परिणाम प्राप्त करते हैं , तो आपको वास्तव में विचार करना होगा कि आपके कितने महत्वपूर्ण परिणाम गलत हैं। उपरोक्त उदाहरण में, 25% 'महत्वपूर्ण परिणाम' गलत रहे होंगे!n

[साइड नोट: विकिपीडिया बताता है कि यद्यपि FPR गणितीय रूप से I त्रुटि दर के बराबर है, यह वैचारिक रूप से अलग माना जाता है क्योंकि एक आमतौर पर एक प्राथमिकता निर्धारित करता है जबकि दूसरा आमतौर पर एक परीक्षण के प्रदर्शन को मापने के लिए उपयोग किया जाता है। यह महत्वपूर्ण है लेकिन मैं यहां चर्चा नहीं करूंगा]।


और थोड़ा और पूर्णता के लिए:

जाहिर है, एफपीआर और एफडीआर एकमात्र प्रासंगिक मैट्रिक्स नहीं हैं जिन्हें आप भ्रम मैट्रिक्स में चार मात्राओं के साथ गणना कर सकते हैं। कई संभावित मीट्रिक जो विभिन्न संदर्भों में उपयोगी हो सकती हैं , उनमें से दो अपेक्षाकृत आम हैं जिनका सामना करने की संभावना है:

ट्रू पॉजिटिव रेट (टीपीआर) , जिसे संवेदनशीलता के रूप में भी जाना जाता है , उन लोगों का अनुपात है जिनके पास बीमारी है जिन्हें बीमारी के रूप में पहचाना जाता है।

टीपीआर=टीपीटीपी+एफएन

ट्रू नेगेटिव रेट (TNR) , जिसे विशिष्टता के रूप में भी जाना जाता है , उन लोगों का अनुपात है जिनके पास बीमारी नहीं है, जिनकी पहचान बीमारी नहीं है।

टीएनआर=टीएनटीएन+एफपी


3
+1। यह संख्यात्मक उदाहरण को समायोजित करने के लिए समझ में आ सकता है ताकि एफपीआर = 5% हो, क्योंकि यदि आप पी <0.05 का उपयोग मानदंड के रूप में करते हैं तो आपके पास क्या होगा (परीक्षण का सही आकार है)। या 1% अगर p <0.01, जो भी हो। इस संबंध को इंगित करना कुछ पाठकों के लिए मददगार हो सकता है।
अमीबा का कहना है कि मोनिका

1
@amoeba धन्यवाद, यह एक अच्छा विचार है। मैं बाद में ऐसा करने की कोशिश करूंगा।
mkt -

2

आपको https://en.wikipedia.org/wiki/Confusion_matrix में तालिका की जांच करनी चाहिए । कृपया ध्यान दें कि एफडीआर लंबवत है, जबकि एफडीआर क्षैतिज है।

  • एफपी होता है अगर आपकी अशक्त परिकल्पना सच है लेकिन आप इसे अस्वीकार करते हैं
  • अगर आप कुछ महत्वपूर्ण का अनुमान लगाते हैं तो एफडी होता है लेकिन आपको नहीं करना चाहिए

मुझे पता है कि लेकिन मैं विशेष रूप से तुलना करने में दिलचस्पी रखता हूं जैसे कि यदि आप कुछ संख्याओं के साथ उस अवधारणा को समझाने में मदद कर सकते हैं और अपने संख्याओं का समर्थन करने के लिए विज़ुअलाइज़ेशन कर सकते हैं जो बहुत दिलचस्प होगा।
李 李
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.