दो वितरणों के अनुदैर्ध्य तुलना


10

मेरे पास छह महीने के अंतराल पर चार बार 2500 लोगों को दिए गए रक्त परीक्षण के परीक्षा परिणाम हैं। परिणाम मुख्य रूप से प्रतिरक्षा प्रतिक्रिया के दो उपायों से मिलकर बनता है - एक निश्चित तपेदिक एंटीजन की उपस्थिति में, एक अनुपस्थिति में। वर्तमान में, प्रत्येक परीक्षण एंटीजन प्रतिक्रिया और शून्य प्रतिक्रिया के बीच के अंतर के आधार पर या तो सकारात्मक या नकारात्मक का मूल्यांकन करता है (इस विचार के साथ कि यदि आपकी प्रतिरक्षा प्रणाली टीबी एंटीजन का जवाब देती है, तो आपको कुछ बिंदु पर ही जीवाणु के संपर्क में आने की संभावना है। )। संक्षेप में, परीक्षण मानता है कि एक गैर-उजागर व्यक्ति के शून्य और टीबी प्रतिक्रियाओं का वितरण मूल रूप से समान होना चाहिए, जबकि टीबी जोखिम वाले व्यक्ति के पास एक अलग वितरण (उच्च मूल्यों के) से तैयार टीबी प्रतिक्रियाएं होंगी। चेतावनी: प्रतिक्रियाएं बहुत ही सामान्य हैं, और प्राकृतिक मंजिल और साधन-छंटनी वाली छत दोनों पर मूल्य टकराते हैं।

हालांकि, इस अनुदैर्ध्य सेटिंग में यह बहुत स्पष्ट लगता है कि हमें "झूठी सकारात्मक" (अव्यक्त तपेदिक के लिए कोई वास्तविक सोने का मानक नहीं है, मुझे डर है) जो प्रतिजन और शून्य प्रतिक्रियाओं में (आमतौर पर छोटे) उतार-चढ़ाव के कारण होते हैं। हालांकि कुछ स्थितियों में इससे बचना कठिन हो सकता है (आपको किसी को परीक्षण करने का केवल एक ही मौका मिल सकता है), ऐसी कई परिस्थितियां हैं, जिनमें लोगों को हर साल या तो टीबी के लिए नियमित रूप से परीक्षण किया जाता है - अमेरिका में, यह स्वास्थ्य कार्यकर्ताओं के लिए आम है, सैन्य, बेघर लोगों को आश्रय, और इसी तरह। यह पूर्व परीक्षा परिणामों को नजरअंदाज करने के लिए शर्म की बात है क्योंकि मौजूदा मानदंड पार-अनुभागीय होने के लिए होते हैं।

मुझे लगता है कि मैं जो करना चाहूंगा, वह है कि मैं अनुदैर्ध्य मिश्रण विश्लेषण के बारे में सोचता हूं। क्रॉस-सेक्शनल मानदंड की तरह, मैं इस संभावना का अनुमान लगाने में सक्षम होना चाहता हूं कि किसी व्यक्ति की टीबी और शून्य प्रतिक्रियाएं समान वितरण से खींची जाती हैं - लेकिन क्या यह अनुमान पूर्व परीक्षण परिणामों को शामिल करता है, साथ ही नमूने से जानकारी भी। एक संपूर्ण (उदाहरण के लिए, क्या मैं किसी विशिष्ट व्यक्ति के निल या टीबी के वितरण के मेरे अनुमानों को बेहतर बनाने के लिए भीतर-भीतर भिन्नताओं के नमूना-व्यापक वितरण का उपयोग कर सकता हूं?)। अनुमानित संभावना को नए संक्रमण की संभावना को ध्यान में रखते हुए, समय के साथ बदलने में सक्षम होना चाहिए।

मैंने अपने आप को असामान्य तरीकों से इस बारे में सोचने की कोशिश करते हुए पूरी तरह से घुमा दिया है, लेकिन मुझे ऐसा लगता है कि यह वैचारिककरण उतना ही अच्छा है जितना कि मैं आने वाला हूं। अगर कुछ समझ में नहीं आता है, तो कृपया स्पष्टीकरण के लिए स्वतंत्र महसूस करें। यदि स्थिति के बारे में मेरी समझ गलत है, तो कृपया मुझे बताने के लिए स्वतंत्र महसूस करें। आपकी मदद के लिए बहुत बहुत धन्यवाद।

श्रीकांत के जवाब में: यह दो निरंतर (लेकिन गैर-सामान्य और काट-छाँट) परीक्षण परिणामों का उपयोग करके अव्यक्त वर्गीकरण (टीबी-संक्रमित या नहीं) का मामला है। अभी, वह वर्गीकरण कटऑफ (अपने सरलीकृत रूप में, टीबी - नील> .35 -> सकारात्मक) का उपयोग करके किया जाता है। (Nil, TB, परिणाम) के रूप में प्रस्तुत किए गए परीक्षण के परिणामों के साथ, मूल कट्टरपंथी * हैं:

संभावित नकारात्मक: (0.06, 0.15, -) (0.24, 0.23, -) (0.09, 0.11, -) (0.16, 0.15, -)
संभावित सकारात्मक: (0.05, 3.75, +) (0.05, 1.56, +) (0.06) , 5.02, +) (0.08, 4.43, +)
वॉबलर: (0.05, 0.29, -) (0.09, 0.68, +) (0.08, 0.31, -) (0.07, 0.28, -)

Wobbler के लिए दूसरे टेस्ट पर सकारात्मक स्पष्ट रूप से एक विपथन है, लेकिन आप इसे कैसे मॉडल करेंगे? हालांकि मेरी सोच की एक पंक्ति हर बार बिंदु-मापी बहुस्तरीय मॉडल का उपयोग करते हुए टीबी और शून्य के बीच "वास्तविक अंतर" का अनुमान लगाना है, यह मेरे लिए हुआ कि मैं वास्तव में जानना चाहता हूं कि क्या व्यक्ति की शून्य प्रतिक्रिया और टीबी प्रतिक्रिया है समान वितरण से तैयार किए जाते हैं, या यदि उनकी प्रतिरक्षा प्रणाली टीबी एंटीजन को पहचानती है और सक्रिय हो जाती है, तो बढ़ी हुई प्रतिक्रिया पैदा होती है।

संक्रमण के अलावा एक सकारात्मक परीक्षण का क्या कारण हो सकता है: मुझे यकीन नहीं है। मुझे संदेह है कि यह आमतौर पर परिणामों में केवल व्यक्ति-भिन्नता है, लेकिन निश्चित रूप से अन्य कारकों की संभावना है। हमारे पास प्रत्येक समय बिंदु से प्रश्नावली हैं, लेकिन मैंने अभी तक उन पर ध्यान नहीं दिया है।

* फैब्रिकेटेड लेकिन इलस्ट्रेटिव डेटा


ओह, और नि: संकोच महसूस करें - मेरा ब्राउज़र ऑटो-सुझाव के साथ काम नहीं कर रहा है, इसलिए मुझे यह देखने में कठिन समय हो रहा है कि क्या है।
मैट पार्कर

क्या आपका आश्रित चर निरंतर या असतत है? या, शायद, अंतर्निहित परीक्षा परिणाम निरंतर है और इसे कुछ कट-ऑफ के आधार पर असतत उत्तर (यानी, 'सकारात्मक', 'नकारात्मक') में बदल दिया जाता है? क्या आप यह भी स्पष्ट कर सकते हैं कि कोई व्यक्ति टीबी के संपर्क में न आने के बावजूद नकारात्मक से सकारात्मक की ओर क्यों फेरेगा? इस तरह के फ्लिप का एक विशिष्ट उदाहरण (कुछ संख्याओं के साथ फेंक दिया गया) मदद कर सकता है।

1
डेटा की कल्पना करने के लिए उदाहरण वास्तव में सहायक हैं। आपके कैविएट के बारे में एक और सवाल: "मूल्य फर्श और छत पर टकराते हैं और यह कि डेटा सामान्य नहीं हैं।" क्या आप मुझे बता सकते हैं कि (ए) स्केल के निचले सिरे का डेटा सामान्य दिखता है और (बी) स्केल के ऊपरी सिरे का डेटा सामान्य दिखता है?

नोट: मैं स्पष्ट रूप से इनाम देने की समय सीमा से चूक गया था, इसलिए मैं एक और स्थापित कर रहा हूं ताकि मैं श्रीकांत को उनकी मदद के लिए उचित रूप से पुरस्कृत कर सकूं। अधिक जवाब हमेशा स्वागत है, लेकिन इनाम उसके लिए है।
मैट पार्कर

जवाबों:


2

यह एक पूर्ण उत्तर नहीं है, लेकिन मुझे आशा है कि यह आपको कुछ विचार देता है कि कैसे स्थिति को सुसंगत तरीके से मॉडल किया जाए।

मान्यताओं

  1. पैमाने के निचले सिरे पर स्थित मान नीचे से काटे गए सामान्य वितरण का अनुसरण करते हैं।

  2. पैमाने के ऊपरी छोर पर मान ऊपर से काटे गए एक सामान्य वितरण का पालन करते हैं।

    (नोट: मुझे पता है कि आपने कहा था कि डेटा सामान्य नहीं है, लेकिन मैं यह मान रहा हूं कि आप सभी मूल्यों के वितरण की बात कर रहे हैं, जबकि उपरोक्त धारणाएँ पैमाने के निचले और ऊपरी सिरे पर मूल्यों से संबंधित हैं।)

  3. एक व्यक्ति की अंतर्निहित स्थिति (चाहे उन्हें टीबी है या नहीं) पहले क्रम के मार्कोव श्रृंखला का अनुसरण करता है।

नमूना

करते हैं:

  1. Di(t) यदि समय में 1 हो व्यक्ति अन्यथा टीबी और 0 है,tith

  2. RTBi(t) समय में टीबी परीक्षण करने के लिए परीक्षण प्रतिक्रिया हो के , व्यक्तिtith

  3. RNi(t) समय में Nill परीक्षण करने के लिए परीक्षण प्रतिक्रिया हो के , व्यक्तिtith

  4. f(RNi(t)|Di(t)=0)N(μl,σl2)I(RNi(t)>Rl)

  5. f(RNi(t)|Di(t)=1)N(μl,σl2)I(RNi(t)>Rl)

    अंक 4 और 5 इस विचार को पकड़ते हैं कि एनआईईएल परीक्षण के लिए किसी व्यक्ति की प्रतिक्रिया रोग की स्थिति पर निर्भर नहीं है।

  6. f(RTBi(t)|Di(t)=0)N(μl,σl2)I(RTBi(t)>Rl)

  7. f(RTBi(t)|Di(t)=1)N(μu,σu2)I(RTBi(t)<Ru)

  8. μu>μl

    अंक 6, 7 और 8 इस विचार को पकड़ते हैं कि किसी व्यक्ति की टीबी परीक्षण पर प्रतिक्रिया रोग की स्थिति पर निर्भर है

  9. p(t) संभावना है कि किसी व्यक्ति को टीबी के 6 महीनों के दौरान समय से पहले कैच हो जाता है, यह देखते हुए कि वे पिछले परीक्षण अवधि के दौरान रोग मुक्त थे। इस प्रकार, राज्य संक्रमण मैट्रिक्स नीचे एक को पसंद करेगा:t

    [1p(t)p(t)01]

    दूसरे शब्दों में,

    Prob(Di(t)=1|Di(t1)=0)=p(t)

    Prob(Di(t)=0|Di(t1)=0)=1p(t)

    Prob(Di(t)=1|Di(t1)=1)=1

    Prob(Di(t)=0|Di(t1)=1)=0

आपके परीक्षण मानदंड में कहा गया है कि:

D^i(t)={1,RTBi(t)RNi(t)0.350,otherwise

हालाँकि, जैसा कि आप मॉडल की संरचना से देखते हैं कि आप वास्तव में कट-ऑफ को माप सकते हैं और पूरी समस्या को बदल सकते हैं कि रोगियों का सही निदान करने के लिए आपका कट-ऑफ क्या होना चाहिए। इस प्रकार, वॉबलर समस्या किसी अन्य चीज़ के बजाय कट-ऑफ की अपनी पसंद के साथ अधिक समस्या है।

'सही' कट-ऑफ चुनने के लिए, आप निश्चित रूप से टीबी के रूप में पहचाने जाने वाले रोगियों के बारे में ऐतिहासिक डेटा ले सकते हैं और उपरोक्त सेटअप के परिणामी मापदंडों का अनुमान लगा सकते हैं। आप कुछ मानदंडों का उपयोग कर सकते हैं जैसे कि टीबी के रूप में वर्गीकृत रोगियों की संख्या या 'सर्वश्रेष्ठ' मॉडल की पहचान करने के लिए मीट्रिक के रूप में नहीं। सादगी के लिए, आप मान सकते हैं कि एक समय अपरिवर्तनीय पैरामीटर है जो महामारी की अनुपस्थिति में उचित लगता है आदि।p(t)

आशा है कि उपयोगी है।


धन्यवाद, श्रीकांत! क्षमा करें, मैंने किसी तरह आपकी टिप्पणी को पहले याद किया। ऊपरी क्लस्टर वास्तव में छत पर सिर्फ एक स्पाइक है - एकरूपता के लंबे खंड को छोड़कर कोई परिवर्तनशीलता नहीं है जो इसे निचले वितरण से जोड़ता है, जो मूल रूप से आपके द्वारा वर्णित है। मुझे आपके उत्तर को पार्स करने के लिए कुछ समय लगेगा (विशेषकर जब से मैं IE में फंस गया हूं और अभी एलटीटीएक्स को ठीक से नहीं देख सकता हूं), लेकिन मैं वास्तव में इस अजीब छोटे प्रश्न के लिए आपके समर्पण की सराहना करता हूं।
मैट पार्कर

3

मुश्किल मैट, के रूप में कई वास्तविक दुनिया आँकड़े समस्याएं हैं!

मैं आपके अध्ययन के उद्देश्य / उद्देश्यों को परिभाषित करना शुरू करूँगा।

विषयों की सही स्थिति को जाने बिना टीबी + और टीबी- परीक्षण के लिए संभाव्यता वितरण को परिभाषित करना कठिन होगा। क्या आपके पास पिछले टीबी संक्रमण (या बेहतर, चिकित्सा इतिहास) के बारे में प्रश्नावली हैं। इसके अलावा, मैं अभी भी बचपन में एक टीकाकरण के कारण टीबी + का परीक्षण करता हूं - कई दशकों पहले - इसलिए पिछले टीकाकरण पर विचार करने की आवश्यकता है।

यह मुझे लगता है कि आपका आंतरिक प्रश्न है: क्या बार-बार टीबी परीक्षण परीक्षण के परिणाम को प्रभावित करता है?

यह पीटर डिग्ले के अनुदैर्ध्य डेटा के विश्लेषण की एक प्रति प्राप्त करने के लायक होगा ।

कुछ खोजपूर्ण डेटा विश्लेषण करें, विशेष रूप से एक-दूसरे के विरुद्ध प्रत्येक समय शून्य-परीक्षण परिणामों के प्लॉट मैट्रिसेस, और टीबी परीक्षण के परिणाम प्रत्येक समय बनाम एक-दूसरे पर; और टीबी बनाम नील तितर बितर भूखंड (प्रत्येक समय)। अंतर (टीबी टेस्ट - निल टेस्ट) भी लें और स्कैटर प्लॉट मैट्रेस करें। डेटा का रूपांतरण करने की कोशिश करें और इन्हें फिर से करें - मैं कल्पना करता हूं लॉग (टीबी) - लॉग (निल) मदद कर सकता है यदि निल के सापेक्ष टीबी के परिणाम बहुत बड़े हैं। सहसंबंध संरचना में रैखिक संबंधों की तलाश करें।

एक अन्य दृष्टिकोण परिभाषित परीक्षा परिणाम (सकारात्मक / नकारात्मक) लेने के लिए होगा और एक गैर-रेखीय मिश्रित प्रभाव मॉडल (लॉगिट लिंक) का उपयोग करके इस लॉजिट्यूडिबली को मॉडल करना होगा। क्या कुछ व्यक्ति टीबी + से टीबी के परीक्षण के बीच फ़्लिप करते हैं- और क्या यह उनके नील परीक्षण, टीबी परीक्षण, टीबी - नील या परीक्षण परिणामों के कुछ परिवर्तन से संबंधित है?


आपके उत्तर के लिए धन्यवाद। सही स्थिति न जानने के बारे में: हमारे पास व्यापक प्रश्नावली हैं और त्वचा परीक्षण के साथ बीसीजी वैक्सीन मुद्दे से अच्छी तरह वाकिफ हैं - वास्तव में, ये रक्त परीक्षण उस मुद्दे को हल करने वाले हैं क्योंकि वे पीपीडी से अलग प्रतिजनों के एक अलग सेट का उपयोग करते हैं। की आदत है। हालांकि, यह लगभग एक अलग सवाल है, और एक हम थोड़ा बाद में काम करने जा रहे हैं - अभी, मेरी दिलचस्पी इस परीक्षण को 'लंबे समय तक जानने के लिए' बनाने में है।
मैट पार्कर

... विशेष रूप से क्योंकि कुछ व्यक्ति नकारात्मक से सकारात्मक में फ्लिप करते हैं, और यह अक्सर उनके ठेठ नील और टीबी के परिणाम होते हैं जो छोटे उतार-चढ़ाव करते हैं - थोड़ा नीचे टीबी, थोड़ा ऊपर टीबी, और अचानक वे सकारात्मक होते हैं। अगला परीक्षण, वे नकारात्मक होने के लिए वापस चले गए हैं। मैं देख सकता हूं कि जैसा कि मैंने व्यक्तिगत परिणामों की समीक्षा की है, लेकिन मुझे यकीन नहीं है कि कैसे एक मॉडल में अपने अंतर्ज्ञान को उचित रूप से शामिल किया जाए।
मैट पार्कर

अंत में, जबकि मैंने लॉग परिणाम लेने की कोशिश की है, जो उन्हें सामान्यता के करीब लाने के लिए पर्याप्त नहीं लगता है। वे बहुत, बहुत तिरछी हैं, और उच्च अंत में छंटनी छत पर घनत्व के ध्यान देने योग्य बूँद को जोड़कर इसे और जटिल बनाती है। दिलचस्प बात यह है कि, हालांकि, सैंपल-वाइड नील और टीबी परिणाम वितरण काफी समान हैं, एकमात्र अंतर यह है कि छत पर बूँदें टीबी परिणामों के लिए बहुत बड़ी हैं।
मैट पार्कर

एक प्रश्न के इस जानवर को पढ़ने और उत्तर देने के लिए समय निकालने के लिए धन्यवाद!
मैट पार्कर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.