समय श्रृंखला में विसंगति का पता लगाने के लिए अच्छे पैकेज की तलाश है


17

क्या एक व्यापक ओपन सोर्स पैकेज (अधिमानतः अजगर या आर में) है जो समय श्रृंखला में विसंगति का पता लगाने के लिए इस्तेमाल किया जा सकता है?

Scikit-learn में एक वर्ग SVM पैकेज है, लेकिन यह समय श्रृंखला डेटा के लिए नहीं है। मैं और अधिक परिष्कृत पैकेजों की तलाश कर रहा हूं, उदाहरण के लिए, विसंगति का पता लगाने के लिए बायेसियन नेटवर्क का उपयोग करें।


हमें एक लिखने की जरूरत है, भाई !! : पी
अर्पित सिसोदिया

जवाबों:


19

मुझे पता है कि मैं यहाँ थोड़ी देर से आ रहा हूँ, लेकिन हाँ बाहरी संयोजन-रूपरेखा के साथ-साथ विसंगति का पता लगाने के लिए एक पैकेज है।

यह अभी भी जीथब पर विकास के अपने प्रारंभिक चरण में है और जल्द ही जेएमएलआर में प्रकाशित किया जाएगा।

पैकेज अजगर भाषा में है और पैकेज का नाम pyod ( https://github.com/yzhao062/Pyod ) है।

व्यक्तिगत दृष्टिकोणों का पालन करने के लिए इसमें कई एल्गोरिदम हैं:

  1. आउटलाइन डिटेक्शन के लिए रैखिक मॉडल ( PCA, vMCD, vOne-Class, और SVM )
  2. निकटता-आधारित आउटलाइर डिटेक्शन मॉडल ( एलओएफ, सीबीएलओएफ, एचबीओएस, केएनएन, एवरकेएनएन, और मेडियनकेएनएन )
  3. बाहरी पहचान के लिए संभाव्य मॉडल ( ABOD और FastABOD )
  4. बाहरी टुकड़ियों और युग्म फ़्रेमवर्क ( IsolationForest और FeatureBagging )
  5. न्यूरल नेटवर्क और डीप लर्निंग मॉडल ( पूरी तरह से जुड़े न्यूरल नेटवर्क के साथ ऑटो-एनकोडर )

अंत में, यदि आप विशेष रूप से प्रति-टाइम-सीरीज़ के लिए देख रहे हैं, तो यह जीथब लिंक उपयोगी होगा।

यह समयबद्ध पता लगाने के लिए निम्नलिखित सूची संकुल है:

datastream.io

क्षितिज

banpei

असंगति का पता लगाये


संदर्भ आधारित असामान्यताओं पर काम करने का कोई तरीका?
अर्पित सिसोदिया

क्या आप विसंगति या बाहरी पहचान का पता लगाने की बात कर रहे हैं? इसमे अंतर है।
अर्पित सिसोदिया

6

समय श्रृंखला असामान्यताओं को संभालने के कई तरीके हैं-

1) यदि असामान्यताएं ज्ञात हैं , तो एक वर्गीकरण मॉडल बनाएं। समय श्रृंखला डेटा के लिए एक ही प्रकार की असामान्यताओं का पता लगाने के लिए इस मॉडल का उपयोग करें।

2) यदि असामान्यताएं अज्ञात हैं , तो हमने अपने संगठन में क्या किया है- क्लस्टरिंग और वर्गीकरण का एक संयोजन है-

आउटलेर्स की पहचान करने के लिए पहले LOF / K-means / Cook की दूरी का उपयोग करें। संपूर्ण डेटा को वर्गीकरण समस्या में परिवर्तित करें क्योंकि हमें अब 2 कक्षाएं मिल गई हैं- आउटलेर और मानदंड। अब रन टाइम (समय श्रृंखला डेटा) में असामान्यता की पहचान करने के लिए एक वर्गीकरण मॉडल बनाएं और नियम (वर्गीकरण मॉडल) प्राप्त करें।

3) यदि असामान्यताएं अज्ञात हैं , तो मेरे शोध के दौरान, असामान्यताओं की पहचान करने का सबसे आम तरीका एक सामान्य मॉडल बनाना है और सामान्य मॉडल (त्रुटि) से कोई भी विचलन असामान्य है, इसलिए उर मामले में आप अगले घंटे के लिए अपनी समय श्रृंखला का पूर्वानुमान लगाते हैं और फिर तुलना करते हैं वास्तविक मूल्यों के साथ। यदि त्रुटि अपेक्षा से अधिक है, तो कुछ असामान्य हो रहा है।

मैं ऐसा करने के लिए अजगर या आर में कोई प्रत्यक्ष पैकेज नहीं पा रहा था, क्योंकि किसी को भी पता नहीं है कि वास्तव में असामान्य क्या है: पी, सभी मामलों में यह बाह्य विकृति से संबंधित है।

कुछ उपयोगी लिंक-

https://machinelearningstories.blogspot.com/2018/12/easiest-way-of-detection-abnormality.html

https://machinelearningstories.blogspot.com/2018/07/anomaly-detection-anomaly-detection-by.html


2

पैगंबर पुस्तकालय की कोशिश करो

पैगंबर एक एडिटिव मॉडल के आधार पर टाइम सीरीज़ डेटा का पूर्वानुमान लगाने की एक प्रक्रिया है जहां गैर-रेखीय रुझान वार्षिक, साप्ताहिक और दैनिक मौसम, प्लस अवकाश प्रभाव के साथ फिट होते हैं। यह समय श्रृंखला के साथ सबसे अच्छा काम करता है जिसमें मजबूत मौसमी प्रभाव और ऐतिहासिक डेटा के कई मौसम होते हैं। पैगंबर लापता डेटा और प्रवृत्ति में बदलाव के लिए मजबूत है, और आमतौर पर आउटलेर्स को अच्छी तरह से संभालता है।

अधिक पर: पैगंबर पुस्तकालय के साथ समय श्रृंखला में विसंगति का पता लगाना

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.