आरओसी वक्र विश्लेषण में सहसंयोजकों के लिए समायोजन


20

यह प्रश्न एक बहु-आयामी स्क्रीनिंग प्रश्नावली पर कट-ऑफ स्कोर का अनुमान लगाने के बारे में है, जो कि सहसंबद्ध तराजू की उपस्थिति में एक बाइनरी एंडपॉइंट की भविष्यवाणी करता है।

मुझे संबद्ध उपकेंद्रों के लिए नियंत्रण के हित के बारे में पूछा गया था जब एक माप पैमाने (व्यक्तित्व लक्षण) के प्रत्येक आयाम पर कट-ऑफ स्कोर तैयार किया गया था जो कि शराब की जांच के लिए इस्तेमाल किया जा सकता है। यही है, इस विशेष मामले में, व्यक्ति बाहरी सहसंयोजकों (भविष्यवक्ताओं) को समायोजित करने में रुचि नहीं रखता था - जो कि (आंशिक) कोवियारेट-समायोजित आरओसी वक्र के तहत होता है, जैसे (1-2) - लेकिन अनिवार्य रूप से अन्य स्कोर पर एक ही प्रश्नावली से, क्योंकि वे एक-दूसरे से सहसंबंध रखते हैं (उदाहरण के लिए "सनसनी की तलाश" के साथ "आवेग")। यह एक GLM का निर्माण करता है जिसमें बाईं ओर ब्याज का स्कोर शामिल होता है (जिसके लिए हम कट-ऑफ चाहते हैं) और उसी प्रश्नावली से गणना की गई एक और स्कोर, जबकि दाईं ओर परिणाम पीने की स्थिति हो सकती है।

स्पष्ट करने के लिए (प्रति @robin अनुरोध), मान लीजिए कि हमारे पास स्कोर हैं, x j (जैसे, चिंता, आवेग, विक्षिप्तता, सनसनी की मांग), और हम एक कट-ऑफ वैल्यू t j (यानी पॉज़िटिव केस ) खोजना चाहते हैं। "अगर x j > t j ," नेगेटिव केस "अन्यथा) उनमें से प्रत्येक के लिए। हम आमतौर पर इस तरह के कट-ऑफ (आरओसी वक्र विश्लेषण का उपयोग करते हुए) लिंग या आयु जैसे अन्य जोखिम कारकों के लिए समायोजित करते हैं। अब, लिंग, उम्र, और सनसनी की मांग (एसएस) पर आसक्ति को समायोजित करने के बारे में क्या है क्योंकि एसएस को आईएम के साथ सहसंबंधित करने के लिए जाना जाता है? दूसरे शब्दों में, हमारे पास ईपी के लिए एक कट-ऑफ मूल्य होगा जहां उम्र, लिंग और चिंता का स्तर हटा दिया जाता है।j=4xjtjxj>tजे

यह कहने के अलावा कि कट-ऑफ यथासंभव सरल रहना चाहिए, मेरी प्रतिक्रिया थी

सहसंयोजकों के बारे में, मैं AUC के साथ और समायोजन के बिना अनुमान लगाने की सलाह दूंगा, यह देखने के लिए कि क्या भविष्यवाणिय प्रदर्शन में वृद्धि हुई है। यहाँ, आपके सहसंयोजक केवल एक ही माप उपकरण से परिभाषित अन्य उप-वर्ग हैं और मैंने कभी भी ऐसी स्थिति का सामना नहीं किया है (आमतौर पर, मैं आयु या लिंग जैसे ज्ञात जोखिम कारकों पर समायोजित करता हूं)। [...] इसके अलावा, जब से आप रोगनिरोधी मुद्दों (यानी प्रश्नावली की स्क्रीनिंग प्रभावकारिता) में रुचि रखते हैं, तो आप सकारात्मक अनुमानात्मक मूल्य (पीपीवी) का अनुमान लगाने में भी दिलचस्पी ले सकते हैं, सकारात्मक परीक्षण परिणामों वाले रोगियों की संभावना जो सही ढंग से वर्गीकृत किए गए हैं। आप अपनी प्रश्नावली के आधार पर विषयों को "सकारात्मक" या "नकारात्मक" के रूप में वर्गीकृत कर सकते हैं। हालाँकि, नोट

क्या आपके पास इस विशेष स्थिति की अधिक गहन समझ है, जब संभव हो तो प्रासंगिक कागजात के लिंक के साथ?

संदर्भ

  1. जेनेस, एच और पेपे, एमएस (2008)। डायग्नोस्टिक, स्क्रीनिंग या प्रोग्नॉस्टिक मार्कर के अध्ययन में कोवरिएट्स के लिए समायोजन: एक नई सेटिंग में एक पुरानी अवधारणाअमेरिकन जर्नल ऑफ एपिडेमियोलॉजी , 168 (1): 89-97।
  2. जेनेस, एच और पेपे, एमएस (2008)। आरओसी विश्लेषण में सहसंयोजकों का निर्माणयूडब्ल्यू बायोस्टैटिस्टिक्स वर्किंग पेपर सीरीज , पेपर 322।

मैं एक विशेषज्ञ नहीं हूं, लेकिन मुझे "माप के पैमाने के प्रत्येक आयाम पर कट-ऑफ स्कोर तैयार करते समय" संबंधित उपकेंद्रों को नियंत्रित करने वाला वाक्य थोड़ा गूढ़ लगता है। क्या आप मुझे स्पष्टीकरण की एक और पंक्ति दे सकते हैं (अन्यथा मुझे प्रश्न को समझना मुश्किल था)?
रॉबिन जिरार्ड

j=4tjxj>tj

यदि अंतिम लक्ष्य एक द्विआधारी मूल्य की भविष्यवाणी करना है, तो दिए गए [सहसंबद्ध] सर्वेक्षण के सवालों के जवाब देते हैं, यह मानक बाइनरी वर्गीकरण समस्या की तरह लगता है। क्या इस तरह से सोचना उचित होगा? या "कटऑफ वैल्यू" के साथ आना बहुत महत्वपूर्ण है (जिसके बारे में मुझे कुछ नहीं पता)?
डेविड 15

@ दाविद खैर, यह विचार कट-ऑफ वैल्यू का निर्णय करना है (पढ़ें, "एक निश्चित मूल्य से अधिक जोखिम पर विषय"), जो एक सांख्यिकीय परिप्रेक्ष्य से बहुत सारे कैविट्स के साथ आता है, लेकिन अधिकांश चिकित्सक काम करने या पसंद करने के लिए उपयोग किए जाते हैं इस तरफ। (पहले आपकी टिप्पणी पर ध्यान न देने के बारे में खेद!)
chl

जवाबों:


7

जिस तरह से आपने विश्लेषण की कल्पना की है वह वास्तव में ऐसा तरीका नहीं है जो मैं आपको सुझाव दूंगा कि आप इसके बारे में सोचना शुरू कर दें। सबसे पहले यह दिखाना आसान है कि यदि कटऑफ का उपयोग किया जाना चाहिए, तो कटऑफ व्यक्तिगत विशेषताओं पर नहीं बल्कि समग्र पूर्वानुमानित संभावना पर लागू किया जाता है। एक एकल कोवरिएट के लिए इष्टतम कटऑफ अन्य कोवरिएट्स के सभी स्तरों पर निर्भर करता है; यह स्थिर नहीं हो सकता। दूसरे, आरओसी घटता एक व्यक्ति विषय के लिए इष्टतम निर्णय लेने के लक्ष्य को पूरा करने में कोई भूमिका नहीं निभाता है ।

सहसंबद्ध तराजू को संभालने के लिए कई डेटा कटौती तकनीकें हैं जो मदद कर सकती हैं। उनमें से एक औपचारिक अतिरेक विश्लेषण है जहां प्रत्येक भविष्यवक्ता को अन्य सभी भविष्यवक्ताओं से ग़ैर-अनुमानी भविष्यवाणी की जाती है, बदले में। यह redunआर Hmiscपैकेज में फ़ंक्शन में लागू किया गया है । परिवर्तनीय क्लस्टरिंग, प्रमुख घटक विश्लेषण, और कारक विश्लेषण अन्य संभावनाएं हैं। लेकिन मेरे विचार में, विश्लेषण का मुख्य हिस्सा एक अच्छी संभावना मॉडल (जैसे, बाइनरी लॉजिस्टिक मॉडल) का निर्माण होना चाहिए।


1
व्यक्तिगत बनाम समूह निर्णय के बारे में महत्वपूर्ण अंतर के लिए +1। मुझे आपकी प्रतिक्रिया का अनुमान लगाना चाहिए था, यहाँ अपना जवाब या मेडस्टैट्स मेलिंग-लिस्ट पर आपकी एक और प्रतिक्रिया । मैंने डायग्नोस्टिक रिस्क मॉडल के आधार पर डायग्नोस्टिक यूटिलिटी के प्रत्यक्ष उपायों पर भी अपनी बात रखी, विशेष रूप से इस संबंध में ज्ञानवर्धक।
chl

नैदानिक जोखिम मॉडल पर नैदानिक उपयोगिता के आधार के प्रत्यक्ष उपायों पर टॉक अब यहां पाया जा सकता kc.vanderbilt.edu/quant/Seminar/HarrellPresentMay12.pdf
Epifunky

3

जेनेस का बिंदु, कोवरिएट समायोजित आरओसी घटता पर पेपे लेख अनुमानित आरएआर वक्र मानों की अधिक लचीली व्याख्या की अनुमति देता है। यह ब्याज की आबादी में विशिष्ट समूहों के बीच आरओसी घटता स्तरीकरण की एक विधि है। अनुमानित वास्तविक धनात्मक अंश (TPF; eq। संवेदनशीलता) और सच्चा ऋणात्मक अंश (TNF; eq। विशिष्टता) की व्याख्या "सही स्क्रीनिंग परिणाम की संभावना के रूप में की गई है जो रोग की स्थिति Y / N के समान या समायोजित चर के व्यक्तियों के बीच है। सूची]"। एक नज़र में, ऐसा लगता है कि आप जो करने की कोशिश कर रहे हैं वह आपके पैनल में अधिक मार्करों को शामिल करके आपके नैदानिक ​​परीक्षण में सुधार कर रहा है।

इन पद्धतियों को समझने के लिए एक अच्छी पृष्ठभूमि कॉक्स आनुपातिक खतरों के मॉडल के बारे में पढ़ना और पेपे की पुस्तक "वर्गीकरण के लिए चिकित्सा परीक्षण का सांख्यिकीय मूल्यांकन" और ... पर देखना होगा। आप स्क्रीनिंग विश्वसनीयता उपायों को एक जीवित अवस्था के रूप में फिट किए गए स्कोर के बारे में सोचते हुए, एक जीवित अवस्था के साथ कई समान गुण साझा करते हैं। जिस तरह कॉक्स मॉडल जीवित रहने की अवस्था के स्तरीकरण की अनुमति देता है, वे स्तरीकृत विश्वसनीयता के उपाय देने का प्रस्ताव करते हैं।

हमारे लिए यह कारण एक द्विआधारी मिश्रित प्रभाव मॉडल के संदर्भ में उचित हो सकता है: मान लीजिए कि आप मेथ एडिक्ट बनने के जोखिम की भविष्यवाणी करने में रुचि रखते हैं। इस पर एसईएस का इतना स्पष्ट प्रभाव है कि यह एक नैदानिक ​​परीक्षण का मूल्यांकन करने के लिए मूर्खतापूर्ण लगता है, जो व्यक्तिगत व्यवहार पर आधारित हो सकता है, बिना किसी स्तरीकरण के। ऐसा इसलिए है क्योंकि [इस के साथ बस रोल करें], भले ही एक अमीर व्यक्ति ने उन्मत्त और अवसादग्रस्तता लक्षण दिखाए हों, वे शायद कभी भी कोशिश नहीं करेंगे। हालांकि, एक गरीब व्यक्ति इस तरह के मनोवैज्ञानिक लक्षण (और उच्च जोखिम स्कोर) होने वाले जोखिम को अधिक बढ़ाता है। जोखिम का क्रूड विश्लेषण आपके पूर्वानुमान मॉडल का बहुत खराब प्रदर्शन दिखाएगा क्योंकि दो समूहों में समान अंतर विश्वसनीय नहीं थे। हालाँकि, यदि आप स्तरीकृत (अमीर बनाम गरीब) हैं,

कोवेरेट समायोजन का बिंदु विभिन्न समूहों पर विचार करने के लिए समरूपता के बीच जोखिम मॉडल में कम प्रसार और बातचीत के कारण सजातीय है।


(+1) यह एक दिलचस्प प्रतिक्रिया है, बहुत-बहुत धन्यवाद। इस लेखन के समय मेरी मुख्य चिंता यह थी कि कटऑफ मान कुछ हद तक "अन्योन्याश्रित" होगा। लेकिन मैं पेपे की पुस्तक (कुछ हाथ पाया की जांच करेंगे यहाँ इस बीच में)।
CHL

चिकित्सा परीक्षण को विकसित करने और मूल्यांकन करने के लिए समान डेटा का उपयोग करने के साथ समस्याएं हैं लेकिन फिक्स आसान है। आपको किसी प्रकार के क्रॉस-सत्यापन पर विचार करना चाहिए, या डेटा को "प्रशिक्षण" और "सत्यापन" सबसेट में विभाजित करना चाहिए। यह आमतौर पर एक नैदानिक ​​/ रोगनिरोधी / जोखिम-भविष्यवाणी मॉडल विकसित करने के लिए एक मान्य दृष्टिकोण है।
एडम डे
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.