ट्रंकेशन की तुलना में सेंसरिंग का वर्णन अक्सर किया जाता है । जेलमैन एट अल (2005, पृष्ठ 235) द्वारा दो प्रक्रियाओं का अच्छा विवरण दिया गया है:
काटे गए डेटा सेंसर डेटा से भिन्न होते हैं कि ट्रंकेशन बिंदु से परे टिप्पणियों की कोई गिनती उपलब्ध नहीं है। रद्दीकरण बिंदु से परे टिप्पणियों के मूल्यों को सेंसर करने के साथ
खो जाते हैं, लेकिन उनकी संख्या देखी जाती है।
सेंसरिंग या ट्रंकेशन कुछ स्तर (राइट-सेंसरिंग) से ऊपर के मूल्यों के लिए हो सकता है, कुछ स्तर से नीचे (बाएं-सेंसरिंग) या दोनों।
2.02.0
सेंसर करने का सहज उदाहरण यह है कि आप अपने उत्तरदाताओं से उनकी उम्र के बारे में पूछते हैं, लेकिन इसे केवल कुछ मूल्य तक दर्ज करें और इस मूल्य से ऊपर की सभी आयु, 60 वर्ष कहते हैं, "60+" के रूप में दर्ज हैं। इससे गैर-सेंसर किए गए मूल्यों के बारे में सटीक जानकारी मिलती है और सेंसर किए गए मूल्यों के बारे में कोई जानकारी नहीं मिलती है।
इतना विशिष्ट नहीं है, पोलिश मथुरा परीक्षा के अंकों में सेंसरिंग का वास्तविक जीवन उदाहरण देखा गया, जिसने इंटरनेट पर बहुत अधिक ध्यान आकर्षित किया । परीक्षा हाई स्कूल के अंत में ली जाती है और छात्रों को उच्च शिक्षा के लिए आवेदन करने में सक्षम होने के लिए इसे पास करना चाहिए। क्या आप नीचे दिए गए कथानक से अनुमान लगा सकते हैं कि छात्रों को परीक्षा में उत्तीर्ण होने के लिए न्यूनतम अंक की क्या आवश्यकता है? आश्चर्य की बात नहीं है, अन्यथा "सामान्य" वितरण "अंतर" आसानी से "भरा" हो सकता है यदि आप सेंसर बाउंड्री के ठीक ऊपर ओवर-प्रतिनिधित्व स्कोर का एक उचित अंश लेते हैं।
उत्तरजीविता विश्लेषण के मामले में
सेंसरिंग तब होती है जब हमारे पास व्यक्तिगत अस्तित्व के समय के बारे में कुछ जानकारी होती है, लेकिन हम अस्तित्व के समय को ठीक से नहीं जानते हैं
(क्लेनबाम और क्लेन, 2005, पी। 5)। उदाहरण के लिए, आप कुछ दवा के साथ रोगियों का इलाज करते हैं और अपने अध्ययन को समाप्त होने तक उनका निरीक्षण करते हैं, लेकिन आपको कोई ज्ञान नहीं है कि अध्ययन समाप्त होने के बाद उनके साथ क्या होता है (क्या कोई रिलेप्स या साइड इफेक्ट्स थे?), केवल एक चीज जिसे आप जानते हैं कि वे " बच गया " कम से कम अध्ययन के अंत तक।
नीचे आप कपलान-मीयर अनुमानक का उपयोग करके तैयार किए गए वीबुल वितरण से उत्पन्न डेटा का उदाहरण पा सकते हैं । पूर्ण वक्रता पर अनुमानित ब्लू वक्र अंक मॉडल, मध्य भूखंड में आप सेंसर किए गए नमूने और मॉडल को सेंसर डेटा (लाल वक्र) पर अनुमानित देख सकते हैं, दाईं ओर आप ऐसे नमूने (लाल वक्र) पर अनुमानित नमूना और मॉडल को देख सकते हैं। जैसा कि आप देख सकते हैं, लापता डेटा (ट्रंकेशन) का अनुमानों पर महत्वपूर्ण प्रभाव पड़ता है, लेकिन मानक उत्तरजीविता मॉडल का उपयोग करके सेंसरिंग को आसानी से प्रबंधित किया जा सकता है।
इसका मतलब यह नहीं है कि आप काटे गए नमूनों का विश्लेषण नहीं कर सकते हैं, लेकिन ऐसे मामलों में आपको लापता डेटा के लिए मॉडल का उपयोग करना होगा जो अज्ञात जानकारी को "अनुमान" करने की कोशिश करते हैं।
क्लेनबाम, डीजी और क्लेन, एम। (2005)। उत्तरजीविता विश्लेषण: एक सेल्फ लर्निंग पाठ। स्प्रिंगर।
जेलमैन, ए।, कारलिन, जेबी, स्टर्न, एचएस, और रुबिन, डीबी (2005)। बायेसियन डेटा विश्लेषण। चैपमैन एंड हॉल / सीआरसी।