क्या सिग्नल डिटेक्शन सिद्धांत से प्राप्त मैट्रिक्स को नियोजित किए बिना सिग्नल डिटेक्शन डेटा का विश्लेषण करना मान्य है?


14

एक सिग्नल डिटेक्शन प्रयोग आमतौर पर एक संकेत या एक गैर-संकेत के साथ पर्यवेक्षक (या नैदानिक ​​प्रणाली) प्रस्तुत करता है, और पर्यवेक्षक को रिपोर्ट करने के लिए कहा जाता है कि क्या उन्हें लगता है कि प्रस्तुत आइटम एक संकेत या गैर-संकेत है। ऐसे प्रयोगों से डेटा मिलता है जो 2x2 मैट्रिक्स को भरता है: वैकल्पिक शब्द

सिग्नल का पता लगाने का सिद्धांत ऐसे डेटा का प्रतिनिधित्व करता है, जो ऐसे परिदृश्य का प्रतिनिधित्व करता है, जहां "सिग्नल / नॉन-सिग्नल" निर्णय सिग्नल-नेस की एक निरंतरता पर आधारित होता है, जिस पर सिग्नल ट्रायल में गैर-सिग्नल परीक्षणों की तुलना में अधिक मूल्य होता है, और पर्यवेक्षक बस ऊपर एक मानदंड चुनता है जिसके बारे में वे "सिग्नल" रिपोर्ट करेंगे:

वैकल्पिक शब्द

ऊपर दिए गए आरेख में, हरे और लाल वितरण क्रमशः "सिग्नल" और "गैर-सिग्नल" वितरण का प्रतिनिधित्व करते हैं, और ग्रे लाइन एक दिए गए पर्यवेक्षक के चुने हुए मानदंड का प्रतिनिधित्व करता है। ग्रे लाइन के दाईं ओर, हरे रंग की वक्र के नीचे का क्षेत्र हिट का प्रतिनिधित्व करता है और लाल वक्र के नीचे का क्षेत्र झूठी अलार्म का प्रतिनिधित्व करता है; ग्रे लाइन के बाईं ओर, हरे रंग की वक्र के तहत क्षेत्र की याद आती है और लाल वक्र के नीचे का क्षेत्र सही अस्वीकार का प्रतिनिधित्व करता है।

जैसा कि कल्पना की जा सकती है, इस मॉडल के अनुसार, उपरोक्त 2x2 तालिका के प्रत्येक सेल में आने वाली प्रतिक्रियाओं का अनुपात निम्न द्वारा निर्धारित किया जाता है:

  1. हरे और लाल वितरण (आधार दर) से लिए गए परीक्षणों के सापेक्ष अनुपात
  2. पर्यवेक्षक द्वारा चुना गया मानदंड
  3. वितरणों के बीच अलगाव
  4. प्रत्येक वितरण का विचरण
  5. वितरण के बीच विचरण की समानता से कोई भी प्रस्थान (विचरण की समानता ऊपर दर्शाया गया है)
  6. प्रत्येक वितरण का आकार (ऊपर दोनों गाऊसी हैं)

अक्सर # 5 और # 6 के प्रभाव का आकलन केवल पर्यवेक्षक द्वारा विभिन्न मानदंडों के कई स्तरों पर निर्णय लेने के लिए किया जा सकता है, इसलिए हम अभी के लिए इसे अनदेखा कर देंगे। इसके अतिरिक्त, # 3 और # 4 केवल एक दूसरे के सापेक्ष समझ में आता है (जैसे कि वितरण की परिवर्तनशीलता के सापेक्ष कितना बड़ा है?), "भेदभाव" (जिसे d 'के रूप में भी जाना जाता है) के एक उपाय से संक्षेप में। इस प्रकार, सिग्नल डिटेक्शन सिद्धांत सिग्नल डिटेक्शन डेटा से दो गुणों के अनुमान को प्रमाणित करता है: मानदंड और भेदभाव।

हालांकि, मैंने अक्सर देखा है कि अनुसंधान रिपोर्ट (विशेष रूप से चिकित्सा क्षेत्र से) सिग्नल डिटेक्शन फ्रेमवर्क को लागू करने में विफल रहती है और इसके बजाय "सकारात्मक भविष्य कहनेवाला मूल्य", "नकारात्मक भविष्य कहनेवाला मूल्य", "संवेदनशीलता", और "विशिष्टता" जैसी मात्रा का विश्लेषण करने का प्रयास करती है। ", जो सभी ऊपर 2x2 तालिका से अलग-अलग सीमांत मूल्यों का प्रतिनिधित्व करते हैं ( विस्तार के लिए यहां देखें )।

ये सीमांत गुण क्या उपयोगिता प्रदान करते हैं? मेरा झुकाव उन्हें पूरी तरह से अवहेलना करना है क्योंकि वे कसौटी और भेदभाव के सैद्धांतिक रूप से स्वतंत्र प्रभावों को स्वीकार करते हैं, लेकिन संभवतः मुझे उनके लाभों पर विचार करने के लिए केवल कल्पना की कमी है।


आप कसौटी का अनुमान कैसे लगा सकते हैं ? उदाहरण के लिए क्रोनिक थकान सिंड्रोम के निदान के लिए एक चिकित्सक के मापदंड दूसरे से भिन्न हो सकते हैं, लेकिन मैं यह नहीं देख सकता कि आप किस तरह की चीज का अनुमान लगा सकते हैं ।
OneStop

सवाल के साथ कुछ नहीं करना है, बस पाठ पर कुछ भोले सवाल :): आप "वितरण के बीच अलगाव" को कैसे परिभाषित करेंगे और वितरण के प्रसरण का अतिरिक्त मूल्य क्या है? क्या होगा अगर वितरण गाऊसी नहीं हैं? क्या आपने कुल भिन्नता दूरी के बारे में सुना है?
रोबिन जिरार्ड

जवाबों:


3

सकारात्मक भविष्यवाणी प्रभाव (पीपीवी) एक अच्छा उपाय नहीं है, न केवल इसलिए कि यह दोनों तंत्र (भेदभाव और प्रतिक्रिया पूर्वाग्रह) को भ्रमित करता है, बल्कि आइटम आधार-दरों के कारण भी। पी (सिग्नल | "हाँ") जैसी पश्च संभावनाओं का उपयोग करना बेहतर होता है, जो आइटम बेस-रेट्स के लिए खाता है:

पी(रोंमैंजीnएल|yरों)=पी(रोंमैंजीnएल)पी(एचमैंटी)पी(रोंमैंजीnएल)पी(एचमैंटी)+पी(nमैंरों)पी(एफएलरोंएलआर)

लेकिन ... यह किसके लिए अच्छा है ?? खैर, किसी विशिष्ट परिणाम की संभावना को अधिकतम / कम करने के लिए प्रतिक्रिया मानदंड को समायोजित करने के लिए यह उपयोगी है। तो, यह संवेदनशीलता और प्रतिक्रिया पूर्वाग्रह के इस अर्थ में पूरक है कि यह प्रतिक्रिया की प्रतिक्रिया में परिवर्तन के परिणामों को संक्षेप में मदद करता है।

सलाह का एक शब्द: यदि आप 2x2 परिणाम मैट्रिक्स के साथ चिपके हुए हैं जो मूल रूप से केवल आपको डी की तरह एक संवेदनशीलता उपाय प्राप्त करने की अनुमति देता है, तो भी एसडीटी से परेशान न हों और बस हिट्स-फाल्स अलार्म का उपयोग करें। दोनों उपायों (डी 'और (एचएफ) का एक सहसंबंध है .96 (कोई फर्क नहीं पड़ता कि बीएस पता लगाने वाले सिद्धांतकारों के साथ आ सकते हैं)

आशा है कि यह चीयर्स में मदद करता है


आपके मन में (2x2 परिणाम मैट्रिक्स के बजाय) किस प्रकार के विस्तारित परिणाम माप थे? और क्या आप डी 'और हिट रेट-फाल्स अलार्म रेट के बीच कॉरेलटन के बारे में अंतिम दावे के लिए एक स्रोत प्रदान कर सकते हैं?
Speldosa

2

आप तुलना कर रहे हैं "क्या संभावना है कि एक सकारात्मक परीक्षा परिणाम सही है एक ज्ञात व्यापकता और परीक्षण मानदंड दिया गया है?" "इस प्रकार के विभिन्न संकेतों के लिए एक अज्ञात प्रणाली की संवेदनशीलता और पूर्वाग्रह क्या है?"

यह मुझे लगता है कि दोनों कुछ समान सिद्धांत का उपयोग करते हैं लेकिन उनके पास वास्तव में बहुत अलग उद्देश्य हैं। चिकित्सा परीक्षण मानदंड के साथ अप्रासंगिक है। इसे कई मामलों में ज्ञात मूल्य पर सेट किया जा सकता है। इसलिए, परीक्षण की कसौटी निर्धारित करना बाद में व्यर्थ है। सिग्नल डिटेक्शन सिद्धांत उन प्रणालियों के लिए सबसे अच्छा है जहां मानदंड अज्ञात है। इसके अलावा, व्यापकता, या संकेत, एक निश्चित (और अक्सर बहुत छोटा) मान होता है। SDT के साथ, आप अक्सर कुछ सरल डिस्क्रिप्टर के रूप में एक बहुत ही जटिल स्थिति के लिए मॉडलिंग के संकेतों के माध्यम से एक औसत d 'पर काम करते हैं। जब मानदंड और संकेत दोनों ज्ञात मात्राएं हैं तो क्या SDT आपको कुछ रोचक बता सकता है? यह मौलिक रूप से सरल समस्या से निपटने के लिए बहुत सारे गणितीय परिष्कार की तरह लगता है।


2

यह एक अति-सरलीकरण हो सकता है, लेकिन विशिष्टता और संवेदनशीलता प्रदर्शन के उपाय हैं, और इसका उपयोग तब किया जाता है जब संकेत की प्रकृति का कोई उद्देश्य ज्ञान नहीं होता है। मेरा मतलब है कि आपका घनत्व बनाम सिग्नलनेस प्लॉट सिग्नल को निर्धारित करने वाले एक चर को मानता है। बहुत उच्च आयामी, या अनंत-आयामी डेटा के लिए, और सिग्नल की पीढ़ी के तंत्र के एक कठोर, सिद्ध सिद्धांत के बिना, चर का चयन गैर-तुच्छ है। सवाल तब उठता है, ऐसा क्यों है, इस तरह के एक चर का चयन करने के बाद, इसके सांख्यिकीय गुण हैं, जैसे संकेत और गैर-संकेत के लिए विचरण और मात्रा निर्धारित नहीं है। कई मामलों में, चर सिर्फ सामान्य नहीं हो सकता है, Poisson, या घातीय रूप से वितरित। यह गैर-पैरामीट्रिक भी हो सकता है, जिस स्थिति में विचलन को अलग-अलग माना जाता है, जैसे कि विचरण आदि पर अंतर। बहुत मतलब नहीं है। इसके अलावा, बायोमेडिकल क्षेत्र में बहुत सारे साहित्य अनुप्रयोगों पर केंद्रित है, और आरओसी, विशिष्टता-संवेदनशीलता आदि का उपयोग समस्या की सीमित प्रकृति के संदर्भ में दृष्टिकोण की तुलना के लिए उद्देश्य मानदंड के रूप में किया जा सकता है, और मूल रूप से यह सब है। आवश्यक है। कभी-कभी लोगों को वर्णन करने में रुचि नहीं हो सकती है, कहें कि रोगग्रस्त बनाम नियंत्रण विषयों में जीन 1 बनाम जीन 2 ट्रांसक्रिपट बहुतायत के अनुपात के वास्तविक असतत संस्करण लॉग-गामा वितरण, बल्कि महत्व की एकमात्र बात यह है कि क्या यह ऊंचा है और इसका कितना संयोजन है फेनोटाइप या बीमारी की संभावना यह बताती है। समस्या की सीमित प्रकृति के संदर्भ में दृष्टिकोण की तुलना करने के लिए उद्देश्य मानदंड के रूप में इस्तेमाल किया जा सकता है, और मूल रूप से यह सब आवश्यक है। कभी-कभी लोगों को वर्णन करने में रुचि नहीं हो सकती है, कहें कि रोगग्रस्त बनाम नियंत्रण विषयों में जीन 1 बनाम जीन 2 ट्रांसक्रिपट बहुतायत के अनुपात के वास्तविक असतत संस्करण लॉग-गामा वितरण, बल्कि महत्व की एकमात्र बात यह है कि क्या यह ऊंचा है और इसका कितना संयोजन है फेनोटाइप या बीमारी की संभावना यह बताती है। समस्या की सीमित प्रकृति के संदर्भ में दृष्टिकोण की तुलना करने के लिए उद्देश्य मानदंड के रूप में इस्तेमाल किया जा सकता है, और मूल रूप से यह सब आवश्यक है। कभी-कभी लोगों को वर्णन करने में रुचि नहीं हो सकती है, कहें कि रोगग्रस्त बनाम नियंत्रण विषयों में जीन 1 बनाम जीन 2 ट्रांसक्रिपट बहुतायत के अनुपात के वास्तविक असतत संस्करण लॉग-गामा वितरण, बल्कि महत्व की एकमात्र बात यह है कि क्या यह ऊंचा है और इसका कितना संयोजन है फेनोटाइप या बीमारी की संभावना यह बताती है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.