मेरे पास कुछ डेटा हैं जिनकी मुझे कल्पना करने की ज़रूरत है और मुझे यकीन नहीं है कि ऐसा करना सबसे अच्छा कैसे होगा। मैं आधार आइटम के कुछ सेट है संबंधित आवृत्तियों के साथ एफ = { च 1 , ⋯ , च n } और परिणामों हे ∈ { 0 , 1 } n। अब मुझे प्लॉट करने की आवश्यकता है कि मेरी विधि "पाता" (यानी, 1-परिणाम) कम आवृत्ति वाली चीजें कितनी अच्छी है। मुझे शुरू में बस बिंदु-भूखंडों के साथ आवृत्ति का एक्स-अक्ष और 0-1 का अक्ष था, लेकिन यह भयानक लग रहा था (विशेषकर दो तरीकों से डेटा की तुलना करते समय)। यही है, प्रत्येक आइटम का एक परिणाम (0/1) है और इसकी आवृत्ति द्वारा आदेश दिया गया है।
यहां एकल विधि के परिणामों के साथ एक उदाहरण दिया गया है:

मेरा अगला विचार अंतराल में डेटा को विभाजित करना और अंतराल पर एक स्थानीय संवेदनशीलता की गणना करना था, लेकिन उस विचार के साथ समस्या यह है कि आवृत्ति वितरण जरूरी नहीं है कि समान है। तो मुझे अंतरालों को कैसे चुनना चाहिए?
क्या किसी को दुर्लभ (यानी, बहुत कम-आवृत्ति) वस्तुओं को खोजने की प्रभावशीलता को चित्रित करने के लिए इन प्रकार के डेटा की कल्पना करने का एक बेहतर / अधिक उपयोगी तरीका पता है?



