उत्तरजीविता विश्लेषण में सेंसरिंग के बारे में आम आदमी की व्याख्या


13

मैंने इस बारे में पढ़ा है कि सेंसरिंग क्या है और इसे उत्तरजीविता के विश्लेषण में कैसे शामिल किया जाना चाहिए, लेकिन मैं इसके बारे में कम गणितीय परिभाषा और अधिक सहज परिभाषा (चित्र बहुत अच्छा होगा!) सुनना चाहूंगा। क्या कोई मुझे 1) सेंसरिंग और 2 के स्पष्टीकरण के साथ प्रदान कर सकता है) यह कपलान-मेयर कर्व्स और कॉक्स डिप्रेशन जैसी चीजों को कैसे प्रभावित करता है?


मेरा सुझाव है कि उत्तरजीविता विश्लेषण पर रैखिक पाचन पॉडकास्ट को सुनना और बाएं और दाएं सेंसरिंग की सरल परिभाषा और कॉक्स मॉडल के लिए प्रेरणा सुनना।
उरी गोरेन

जवाबों:


16

ट्रंकेशन की तुलना में सेंसरिंग का वर्णन अक्सर किया जाता है । जेलमैन एट अल (2005, पृष्ठ 235) द्वारा दो प्रक्रियाओं का अच्छा विवरण दिया गया है:

काटे गए डेटा सेंसर डेटा से भिन्न होते हैं कि ट्रंकेशन बिंदु से परे टिप्पणियों की कोई गिनती उपलब्ध नहीं है। रद्दीकरण बिंदु से परे टिप्पणियों के मूल्यों को सेंसर करने के साथ खो जाते हैं, लेकिन उनकी संख्या देखी जाती है।

सेंसरिंग या ट्रंकेशन कुछ स्तर (राइट-सेंसरिंग) से ऊपर के मूल्यों के लिए हो सकता है, कुछ स्तर से नीचे (बाएं-सेंसरिंग) या दोनों।

2.02.0

यहाँ छवि विवरण दर्ज करें

सेंसर करने का सहज उदाहरण यह है कि आप अपने उत्तरदाताओं से उनकी उम्र के बारे में पूछते हैं, लेकिन इसे केवल कुछ मूल्य तक दर्ज करें और इस मूल्य से ऊपर की सभी आयु, 60 वर्ष कहते हैं, "60+" के रूप में दर्ज हैं। इससे गैर-सेंसर किए गए मूल्यों के बारे में सटीक जानकारी मिलती है और सेंसर किए गए मूल्यों के बारे में कोई जानकारी नहीं मिलती है।

इतना विशिष्ट नहीं है, पोलिश मथुरा परीक्षा के अंकों में सेंसरिंग का वास्तविक जीवन उदाहरण देखा गया, जिसने इंटरनेट पर बहुत अधिक ध्यान आकर्षित किया । परीक्षा हाई स्कूल के अंत में ली जाती है और छात्रों को उच्च शिक्षा के लिए आवेदन करने में सक्षम होने के लिए इसे पास करना चाहिए। क्या आप नीचे दिए गए कथानक से अनुमान लगा सकते हैं कि छात्रों को परीक्षा में उत्तीर्ण होने के लिए न्यूनतम अंक की क्या आवश्यकता है? आश्चर्य की बात नहीं है, अन्यथा "सामान्य" वितरण "अंतर" आसानी से "भरा" हो सकता है यदि आप सेंसर बाउंड्री के ठीक ऊपर ओवर-प्रतिनिधित्व स्कोर का एक उचित अंश लेते हैं।

यहाँ छवि विवरण दर्ज करें

उत्तरजीविता विश्लेषण के मामले में

सेंसरिंग तब होती है जब हमारे पास व्यक्तिगत अस्तित्व के समय के बारे में कुछ जानकारी होती है, लेकिन हम अस्तित्व के समय को ठीक से नहीं जानते हैं

(क्लेनबाम और क्लेन, 2005, पी। 5)। उदाहरण के लिए, आप कुछ दवा के साथ रोगियों का इलाज करते हैं और अपने अध्ययन को समाप्त होने तक उनका निरीक्षण करते हैं, लेकिन आपको कोई ज्ञान नहीं है कि अध्ययन समाप्त होने के बाद उनके साथ क्या होता है (क्या कोई रिलेप्स या साइड इफेक्ट्स थे?), केवल एक चीज जिसे आप जानते हैं कि वे " बच गया " कम से कम अध्ययन के अंत तक।

नीचे आप कपलान-मीयर अनुमानक का उपयोग करके तैयार किए गए वीबुल वितरण से उत्पन्न डेटा का उदाहरण पा सकते हैं । पूर्ण वक्रता पर अनुमानित ब्लू वक्र अंक मॉडल, मध्य भूखंड में आप सेंसर किए गए नमूने और मॉडल को सेंसर डेटा (लाल वक्र) पर अनुमानित देख सकते हैं, दाईं ओर आप ऐसे नमूने (लाल वक्र) पर अनुमानित नमूना और मॉडल को देख सकते हैं। जैसा कि आप देख सकते हैं, लापता डेटा (ट्रंकेशन) का अनुमानों पर महत्वपूर्ण प्रभाव पड़ता है, लेकिन मानक उत्तरजीविता मॉडल का उपयोग करके सेंसरिंग को आसानी से प्रबंधित किया जा सकता है।

यहाँ छवि विवरण दर्ज करें

इसका मतलब यह नहीं है कि आप काटे गए नमूनों का विश्लेषण नहीं कर सकते हैं, लेकिन ऐसे मामलों में आपको लापता डेटा के लिए मॉडल का उपयोग करना होगा जो अज्ञात जानकारी को "अनुमान" करने की कोशिश करते हैं।


क्लेनबाम, डीजी और क्लेन, एम। (2005)। उत्तरजीविता विश्लेषण: एक सेल्फ लर्निंग पाठ। स्प्रिंगर।

जेलमैन, ए।, कारलिन, जेबी, स्टर्न, एचएस, और रुबिन, डीबी (2005)। बायेसियन डेटा विश्लेषण। चैपमैन एंड हॉल / सीआरसी।


क्या आप जानते हैं कि यह मथुरा भूखंड कहाँ से आता है? मैंने गुगली करने की कोशिश की और रेडिट लिंक प्राप्त करता रहा, लेकिन इसमें कोई संदर्भ नहीं है। यह सिर्फ imgur.com को बिना किसी अटेंशन के ले जाता है। अद्यतन: यह मिला। cke.edu.pl//images/files/matura/informacje_o_wynikach/2013// पेज 18.
अमीबा का कहना है मोनिका

1
@amoeba यदि आप अधिक जानकारी में रुचि रखते थे तो मुझसे संपर्क करने में संकोच न करें। इस विषय पर अधिकांश सामग्री मुझे पता है कि दुर्भाग्य से पोलिश में हैं। तस्वीर एक बात है लेकिन मेरे एक दोस्त ने इस डेटा का अधिक विस्तृत विश्लेषण किया (btw, यह अनुरोध पर उपलब्ध है)।
टिम

2

सेंसरिंग उत्तरजीविता विश्लेषण के लिए केंद्रीय है।

मूल विचार यह है कि जानकारी सेंसर की गई है, यह आपके लिए अदृश्य है। बस समझाया गया है, यदि आप नमूना में सभी के मरने से पहले जीवन के समय को रिकॉर्ड करते हैं, तो जीवन काल का एक सेंसर वितरण प्राप्त किया जाता है। यदि आप एक्स-अक्ष पर "सही" बढ़ने के समय के बारे में सोचते हैं, तो इसे राइट-सेंसरिंग कहा जा सकता है।

अन्य प्रकार भी हैं: बाएं-सेंसरिंग और विंडो-सेंसरिंग। उदाहरण के विश्लेषण के लिए घटना इतिहास विश्लेषण पर उदाहरण एलीसन के 1984 के पाठ को देखें, एक शिक्षाप्रद परिचय के लिए सेज द्वारा प्रकाशित।

उदाहरण: यदि आप जनसंख्या में तलाक की दर की गणना कर रहे हैं, तो आप केवल उन व्यक्तियों को शामिल करना चाहते हैं, जिन्हें तलाक देने का जोखिम है (यानी वे शादीशुदा हैं)। अगर लोग तलाक (शोक, उलाहना) के अलावा अन्य कारणों से अपनी शादी खत्म करते हैं तो आप उन्हें सेंसर करना चाहते हैं। उन्हें अब तलाक का खतरा नहीं है। आपके कपलान-मीयर अनुमान (और भूखंडों) को सेंसर किए जाने वाले समय बिंदु के बाद सेंसर किए गए टिप्पणियों को शामिल नहीं करना चाहिए, लेकिन उस समय बिंदु तक उन्हें शामिल करना चाहिए।


ग्राफिक्स या भूखंड?
RustyStatistician
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.