मुसीबत
मैंने अपराध डेटा के एक लेबल डेटा सेट पर Naive बेयस का उपयोग करने की कोशिश की है लेकिन वास्तव में खराब परिणाम (7% सटीकता) मिला है। Naive Bayes मेरे द्वारा उपयोग किए जा रहे अन्य एलोगोरिथम्स की तुलना में बहुत तेज़ी से चलता है इसलिए मैं यह जानने की कोशिश करना चाहता था कि स्कोर इतना कम क्यों था।
अनुसंधान
पढ़ने के बाद मैंने पाया कि Naive bayes का इस्तेमाल संतुलित डेटासेट के साथ किया जाना चाहिए क्योंकि इसमें उच्च आवृत्ति वाली कक्षाओं के लिए पूर्वाग्रह है। चूँकि मेरा डेटा असंतुलित है, मैं पूरक Naive Bayes का उपयोग करने की कोशिश करना चाहता था क्योंकि यह विशेष रूप से डेटा स्काइज़ से निपटने के लिए बनाया गया है। प्रक्रिया का वर्णन करने वाले कागज में, आवेदन पाठ वर्गीकरण के लिए है, लेकिन मैं यह नहीं देखता कि तकनीक अन्य स्थितियों में काम क्यों नहीं करेगी। आप पा सकते हैं कागज मैं यहाँ की बात कर रहा हूँ । संक्षेप में यह विचार उन घटनाओं के आधार पर वज़न का उपयोग करने के लिए है जहां एक वर्ग दिखाई नहीं देता है।
कुछ शोध करने के बाद मैं जावा में एक कार्यान्वयन खोजने में सक्षम था, लेकिन दुर्भाग्य से मैं किसी भी जावा को नहीं जानता और मैं अभी खुद को लागू करने के लिए एल्गोरिथ्म को अच्छी तरह से नहीं समझता।
सवाल
जहां मैं अजगर में एक कार्यान्वयन पा सकते हैं? यदि यह मौजूद नहीं है, तो मुझे इसे स्वयं लागू करने के बारे में कैसे जाना चाहिए?