अपने खाली समय में, मैं एक छोटी वेब आधारित प्रणाली पर काम कर रहा हूं, जो डेल्फी विंडोज अनुप्रयोगों से भेजे गए क्रैश रिपोर्ट (लेकिन अन्य नहीं, गैर-क्रैश बग रिपोर्ट) एकत्र करता है।
समस्या निवारण के लिए, उपयोगकर्ताओं को हार्डवेयर या ऑपरेटिंग सिस्टम संस्करणों और विशिष्ट बग और / या क्रैश के बीच संबंध खोजने के लिए डेटा-माइनिंग सुविधा प्राप्त करना पसंद होगा।
एक उदाहरण के रूप में यह कैसे काम करना चाहिए:
- हर दुर्घटना के लिए डेटाबेस में एक रिपोर्ट होती है, जिसमें डुप्लिकेट की पहचान करने के लिए दुर्घटना के समय स्टैक ट्रेस (कॉल स्टैक) का एक फिंगरप्रिंट / हैश कोड होता है
- एल्गोरिथ्म जाँचता है कि क्या बग रिपोर्ट के सभी डुप्लिकेट में कुछ अन्य सामान्य विशेषताएं भी हैं, उदाहरण के लिए ऑपरेटिंग सिस्टम का एक लापता सर्विस पैक
- विश्लेषण परिणाम उन सभी गुणों को सूचीबद्ध करता है जो बग रिपोर्ट आम है
मान लेते हैं कि इन स्वचालित बग रिपोर्ट में सभी महत्वपूर्ण जानकारी होती है जैसे सभी प्रक्रियाओं के नाम जो वर्तमान में चल रही हैं, फ़ाइल नाम, लोड की गई DLL की जानकारी आदि।
मैं बार-बार क्रैश और पर्यावरण के बीच सहसंबंध कैसे पा सकता हूं? क्या विशिष्ट एल्गोरिदम या सांख्यिकीय तरीके हैं जो मदद करेंगे?