मैंने एक न्यूरल नेटवर्क मॉडल का निर्माण करते हुए कुछ डच इमारतों की ऊर्जा गैस की खपत में आउटलेर्स का पता लगाने की कोशिश की। मेरे पास बहुत बुरे परिणाम हैं, लेकिन मुझे इसका कारण नहीं मिल रहा है।
मैं एक विशेषज्ञ नहीं हूं इसलिए मैं आपसे पूछना चाहता हूं कि मैं क्या सुधार कर सकता हूं और मैं क्या गलत कर रहा हूं। यह पूरा विवरण है: https://github.com/denadai2/Gas-consumption-outliers ।
तंत्रिका नेटवर्क एक फीडफॉवर्ड नेटवर्क है जिसमें बैक प्रोपोगेशन है। जैसा कि यहाँ बताया गया है कि मैंने 41'000 पंक्तियों, 9 विशेषताओं के "छोटे" डेटासेट में डेटासेट को अलग किया और मैंने और अधिक सुविधाएँ जोड़ने की कोशिश की।
मैंने नेटवर्कों को प्रशिक्षित किया, लेकिन परिणामों में 14.14 आरएमएसई है, इसलिए यह गैस की खपत की इतनी अच्छी तरह से भविष्यवाणी नहीं कर सकता है, लगातार मैं एक अच्छा आउटलाइडर डिटेक्शन तंत्र नहीं चला सकता। मैं देखता हूं कि कुछ कागजों में कि भले ही वे बिजली में दैनिक या प्रति घंटा खपत की भविष्यवाणी करते हैं, उनके पास एमएसई = 0.01 जैसी त्रुटियां हैं।
मैं क्या सुधार कर सकता हूं? मैं क्या गलत कर रहा हूं? क्या आप मेरे विवरण का अवलोकन कर सकते हैं?