outliers पर टैग किए गए जवाब

एक बाहरी रूप एक अवलोकन है जो किसी डेटासेट के साधारण लक्षण वर्णन के सापेक्ष असामान्य या अच्छी तरह से वर्णित नहीं है। अस्वीकरण की संभावना यह है कि ये डेटा अध्ययन किए जाने के उद्देश्य से एक अलग आबादी से आते हैं।

1
पूर्वानुमान में छुट्टियों के प्रभाव के लिए कैसे खाते हैं
साप्ताहिक सीज़न के साथ मेरे पास काफी पूर्वानुमानित दैनिक समय श्रृंखला है। जब कोई छुट्टियां न हों तो मैं उन भविष्यवाणियों के साथ आने में सक्षम हूं जो बहुत सटीक (क्रॉस-वैरिफिकेशन द्वारा पुष्टि) प्रतीत होती हैं। हालाँकि, जब छुट्टियां होती हैं, तो मेरे पास निम्नलिखित मुद्दे होते हैं: मुझे अपने …

3
बूस्टिंग विधि आउटलेर्स के लिए संवेदनशील क्यों है
मुझे कई लेख मिले जो बताते हैं कि बढ़ावा देने के तरीके बाहरी लोगों के लिए संवेदनशील हैं, लेकिन कोई भी लेख क्यों नहीं समझा रहा है। मेरे अनुभव में किसी भी मशीन लर्निंग एल्गोरिदम के लिए आउटलेयर खराब हैं, लेकिन विशेष रूप से संवेदनशील के रूप में एकल को …

4
आउटलायर्स को हटाने के लिए अच्छा फॉर्म?
मैं सॉफ्टवेयर बिल्ड के लिए आंकड़ों पर काम कर रहा हूं। मेरे पास पास / असफल और बीते हुए समय पर प्रत्येक निर्माण के लिए डेटा है और हम इन / सप्ताह के ~ 200 उत्पन्न करते हैं। सफलता की दर कुल मिलाकर आसान है, मैं कह सकता हूं कि …

3
विसंगति का पता लगाने के लिए लापता मूल्यों के साथ समय श्रृंखला पर एसटीएल
मैं कुछ लापता टिप्पणियों के साथ जलवायु डेटा की समय श्रृंखला में विषम मूल्यों का पता लगाने की कोशिश कर रहा हूं। वेब पर खोज करने पर मुझे कई उपलब्ध दृष्टिकोण मिले। उनमें से, स्टाल अपघटन प्रवृत्ति और मौसमी घटकों को हटाने और शेष का अध्ययन करने के अर्थ में …

1
PROC मिश्रित और l / lmer के बीच अंतर R- स्वतंत्रता की डिग्री में
नोट: यह प्रश्न एक रिपॉजिट है, क्योंकि मेरे पिछले प्रश्न को कानूनी कारणों से हटाना पड़ा था। आर में पैकेज lmeसे फ़ंक्शन के साथ एसएएस से PROC MIXED की तुलना करते समय nlme, मैंने कुछ अंतर भ्रामक मतभेदों पर ठोकर खाई। विशेष रूप से, विभिन्न परीक्षणों में स्वतंत्रता की डिग्री …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

3
बहुत छोटे सेट में बाहरी पहचान
मुझे मुख्य रूप से स्थिर प्रकाश स्रोत की चमक के लिए यथासंभव सटीक मूल्य प्राप्त करने की आवश्यकता है जो कि बारह नमूना प्रकाशमान मूल्यों को दिया गया है। सेंसर अपूर्ण है, और प्रकाश कभी-कभी "झिलमिलाहट" उज्जवल या गहरा हो सकता है, जिसे नजरअंदाज किया जा सकता है, इसलिए मेरी …

4
आउट-टाइम डिटेक्शन इन टाइम-सीरीज़: झूठी सकारात्मकता को कैसे कम करें?
मैं समय-श्रृंखला में बाहरी पहचान का पता लगाने की कोशिश कर रहा हूं और मैंने यहां रोब हंडमैन द्वारा प्रस्तावित समाधान के एक संशोधन का उपयोग किया है । कहते हैं, मैं विभिन्न देशों की वेबसाइट पर दैनिक यात्राओं को मापता हूं। कुछ देशों के लिए जहां दैनिक दौरे कुछ …

1
कर्टोसिस का मजबूत अनुमान?
मैं कुकुदता के लिए हमेशा की तरह आकलनकर्ता उपयोग कर रहा , लेकिन मैं यह है कि यहां तक कि छोटे मेरी अनुभवजन्य वितरण में 'बाहरी कारकों के कारण', यानी छोटे चोटियों केंद्र से दूर नोटिस यह काफी प्रभावित करते हैं। क्या एक कर्टोसिस अनुमानक है जो अधिक मजबूत है?क^= …

2
सामान्यीकृत रैखिक मिश्रित मॉडल: डायग्नोस्टिक्स
मेरे पास एक यादृच्छिक अवरोधन लॉजिस्टिक रिग्रेशन (बार-बार माप के कारण) है और मैं कुछ डायग्नोस्टिक्स करना चाहूंगा, विशेषकर आउटलेर्स और प्रभावशाली टिप्पणियों से संबंधित। मैंने अवशिष्टों को देखने के लिए देखा कि क्या ऐसे अवलोकन हैं जो बाहर खड़े हैं। लेकिन मैं कुक की दूरी या DFFITS जैसी चीज़ों …

2
आउटलेर्स का पता लगाने के लिए IQR कितना सही है
मैं एक स्क्रिप्ट लिख रहा हूं जो प्रक्रियाओं के समय का विश्लेषण करती है। मुझे उनके वितरण पर यकीन नहीं है, लेकिन मैं जानना चाहता हूं कि क्या कोई प्रक्रिया "बहुत लंबी" चलती है। अब तक मैं पिछले रन समय (n> 30) के 3 मानक विचलन का उपयोग कर रहा …

1
विसंगति का पता लगाने के लिए स्वचालित सुविधा चयन
विसंगति का पता लगाने के लिए स्वचालित रूप से सुविधाओं का चयन करने का सबसे अच्छा तरीका क्या है? मैं आमतौर पर एनोमली डिटेक्शन को एक एल्गोरिथ्म के रूप में मानता हूं, जहां मानव विशेषज्ञों द्वारा सुविधाओं का चयन किया जाता है: आउटपुट रेंज क्या मायने रखती है (जैसा कि …

3
औसत जीपीएस बिंदु ढूँढना
मुझे अंकों की आबादी से औसत जीपीएस बिंदु खोजने के लिए एक कार्यक्रम लिखने की आवश्यकता है। व्यवहार में निम्नलिखित होता है: हर महीने एक व्यक्ति एक ही स्थिर संपत्ति का एक जीपीएस बिंदु रिकॉर्ड करता है। जीपीएस की प्रकृति के कारण, ये बिंदु हर महीने थोड़ा भिन्न होते हैं। …
11 outliers  spatial 

2
प्रतिगमन का उपयोग करके बाह्य पता लगाना
क्या प्रतिगमन का उपयोग बाहर की पहचान के लिए किया जा सकता है। मैं समझता हूं कि आउटलेर्स को हटाकर एक प्रतिगमन मॉडल को बेहतर बनाने के तरीके हैं। लेकिन यहां प्राथमिक उद्देश्य प्रतिगमन मॉडल को फिट करना नहीं है, बल्कि प्रतिगमन का उपयोग करके पता लगाना है

2
प्रभावशाली अवशिष्ट बनाम बाहरी
पहले, मुझे यह बताना चाहिए कि मैंने उत्तर के लिए इस साइट पर खोज की है। मुझे या तो ऐसा प्रश्न नहीं मिला जिसने मेरे प्रश्न का उत्तर दिया हो या मेरे ज्ञान का स्तर इतना कम हो कि मुझे एहसास ही नहीं हुआ कि मैंने पहले ही उत्तर पढ़ …

6
गैर रेखीय प्रतिगमन के लिए बाहरी लोगों की पहचान करना
मैं घुन की कार्यात्मक प्रतिक्रिया के क्षेत्र पर अनुसंधान कर रहा हूं। मैं रोजर्स टाइप II फ़ंक्शन के मापदंडों (हमले की दर और हैंडलिंग समय) का अनुमान लगाने के लिए एक प्रतिगमन करना चाहता हूं। मेरे पास माप का डेटासेट है। मैं आउटलेर्स को सबसे अच्छा कैसे निर्धारित कर सकता …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.