घनत्व के आकलन के आवेदन के लिए एक विशिष्ट मामला नवीनता का पता लगाने, उर्फ बाहरी पता लगाना है, जहां यह विचार है कि आपके पास केवल (या अधिकतर) एक प्रकार का डेटा है, लेकिन आप बहुत दुर्लभ, गुणात्मक अलग-अलग डेटा में रुचि रखते हैं, जो इससे काफी भटकता है उन सामान्य मामलों।
उदाहरण धोखाधड़ी का पता लगाना, सिस्टम में विफलताओं का पता लगाना, आदि हैं। ये ऐसी स्थितियां हैं, जिनमें आपकी रुचि के प्रकार को इकट्ठा करना बहुत कठिन और / या महंगा है। ये दुर्लभ मामले, यानी कम संभावना वाले मामले होते हैं।
ज्यादातर बार आप सटीक वितरण का सही आकलन करने में रुचि नहीं रखते हैं, लेकिन सापेक्ष बाधाओं पर (वास्तविक रूप से बनाम एक नहीं होने के लिए किसी दिए गए नमूने की संभावना कितनी है)।
विषय पर दर्जनों ट्यूटोरियल और समीक्षाएं हैं। यह एक अच्छी शुरुआत हो सकती है।
EDIT: कुछ लोगों के लिए बाहर का पता लगाने के लिए घनत्व आकलन का उपयोग करना अजीब लगता है। आइए हम पहले एक बात पर सहमत हों: जब कोई अपने डेटा के लिए एक मिश्रण मॉडल फिट बैठता है , तो वह वास्तव में घनत्व का आकलन कर रहा होता है। एक मिश्रण मॉडल संभावना के वितरण का प्रतिनिधित्व करता है।
केएनएन और जीएमएम वास्तव में संबंधित हैं: वे संभावना के ऐसे घनत्व का आकलन करने के दो तरीके हैं। नवीनता का पता लगाने में कई दृष्टिकोणों के लिए यह अंतर्निहित विचार है। उदाहरण के लिए, यह kNN पर आधारित एक है , यह अन्य परजेन विंडो पर आधारित है (जो कि पेपर की शुरुआत में इस विचार पर जोर देता है), और कई अन्य ।
यह मुझे लगता है (लेकिन यह सिर्फ मेरी व्यक्तिगत धारणा है) कि सबसे ज्यादा अगर इस विचार पर काम नहीं किया जाए। आप किसी अन्य / दुर्लभ घटना के विचार को कैसे व्यक्त करेंगे?