outliers पर टैग किए गए जवाब

एक बाहरी रूप एक अवलोकन है जो किसी डेटासेट के साधारण लक्षण वर्णन के सापेक्ष असामान्य या अच्छी तरह से वर्णित नहीं है। अस्वीकरण की संभावना यह है कि ये डेटा अध्ययन किए जाने के उद्देश्य से एक अलग आबादी से आते हैं।

4
मानक विचलन का उपयोग करते हुए बाहरी लोगों का पता लगाना
यहाँ मेरे प्रश्न के बाद , मैं सोच रहा हूँ कि क्या आउटलेर्स का पता लगाने के लिए मानक विचलन के उपयोग के खिलाफ या इसके बारे में मजबूत विचार हैं (उदाहरण के लिए कोई भी डेटापॉइंट जो 2 से अधिक मानक विचलन है, एक स्पष्ट है)। मुझे पता है …
27 outliers 

1
PCA आउटलेर्स के प्रति संवेदनशील क्यों है?
इस एसई पर कई पोस्ट हैं जो प्रमुख घटक विश्लेषण (पीसीए) के लिए मजबूत दृष्टिकोणों पर चर्चा करते हैं, लेकिन मैं इस बात का एक भी अच्छा विवरण नहीं पा सकता हूं कि पीसीए पहली जगह में आउटलेर्स के लिए संवेदनशील क्यों है।

4
RANSAC को सबसे अधिक व्यापक रूप से आंकड़ों में उपयोग क्यों नहीं किया जाता है?
कंप्यूटर विज़न के क्षेत्र से आने वाले, मैंने अक्सर मॉडल के फिटिंग के लिए RANSAC (रैंडम सैंपल कंसैन्स ) विधि का इस्तेमाल किया है जिसमें बहुत सारे आउटलेयर के साथ डेटा हो। हालाँकि, मैंने कभी इसे सांख्यिकीविदों द्वारा उपयोग नहीं किया है, और मैं हमेशा इस धारणा के तहत रहा …

3
समय-श्रृंखला-आधारित विसंगति का पता लगाने वाले एल्गोरिदम के लिए तरंगिकाओं का अनुप्रयोग
मैं एंड्रयू मूर द्वारा सांख्यिकीय डेटा माइनिंग ट्यूटोरियल के माध्यम से अपना काम करना शुरू कर रहा हूं (इस क्षेत्र में पहले किसी और के लिए अनुशंसित)। मैंने इस बेहद दिलचस्प पीडीएफ को "टाइम-सीरीज़-आधारित-विसंगति का पता लगाने वाले एल्गोरिदम का परिचयात्मक अवलोकन" पढ़कर शुरू किया , जिसमें बीमारी के प्रकोप …

3
तिरछा वितरण पर आउटलाइंग डिटेक्शन
डेटा प्वाइंट के रूप में ऊपरी या निचले चतुर्थक से 1.5 * IQR से बाहर की एक शास्त्रीय परिभाषा के तहत, गैर-तिरछी वितरण की धारणा है। तिरछे वितरण (एक्सपोनेंशियल, पॉइसन, जियोमेट्रिक, आदि) के लिए मूल फ़ंक्शन के परिवर्तन का विश्लेषण करके एक बाहरी का पता लगाने का सबसे अच्छा तरीका …

2
आपको किस क्रम में लीनियर रिग्रेशन डायग्नोस्टिक्स करना चाहिए?
रैखिक प्रतिगमन विश्लेषण में, हम आउटलेर्स का विश्लेषण करते हैं, बहुकोशिकीयता की जांच करते हैं, हेटेरोसेडेसटी का परीक्षण करते हैं। सवाल यह है कि क्या इन्हें लागू करने का कोई आदेश है? मेरा मतलब है, क्या हमें पहले आउटलेर्स का विश्लेषण करना है, और फिर मल्टीकोलिनरिटी की जांच करनी है? …

2
एक अवलोकन स्तरीय महालनोबिस दूरी का वितरण
यदि मेरे पास एक बहुभिन्नरूपी सामान्य iid नमूना , और (जो एक महालनोबिस दूरी एक नमूना बिंदु से वेक्टर के लिए [चुकता] की तरह है मैट्रिक्स का उपयोग करते हुए भार के लिए), के वितरण क्या है के लिए (महालनोबिस दूरी नमूना covariance मैट्रिक्स ) का उपयोग कर नमूना ?घ …

4
कई प्रतिगमन करते समय सांख्यिकीय सॉफ़्टवेयर द्वारा आउटलेर के रूप में चिह्नित किए गए मामलों को हटाना है या नहीं?
मैं कई प्रतिगमन विश्लेषण कर रहा हूं और मुझे यकीन नहीं है कि मेरे डेटा में आउटलेयर को हटा दिया जाना चाहिए या नहीं। मैं जिस डेटा के बारे में चिंतित हूं वह SPSS बॉक्सप्लेट पर "मंडलियों" के रूप में दिखाई देता है, हालांकि कोई तारांकन नहीं हैं (जो मुझे …

1
गणना डेटा में आउटलेर का पता लगाना
मेरे पास वही है जो मैंने भली-भांति समझा था कि यह एक सीधे आगे की समस्या है जिसमें गणना डेटा के कई अलग-अलग सेटों के लिए एकमुश्त पता लगाना शामिल है। विशेष रूप से, मैं यह निर्धारित करना चाहता हूं कि क्या गणना डेटा की एक श्रृंखला में एक या …

3
एक बॉक्सप्लॉट से तिरछापन का आकलन कैसे करें?
इस डेटा से निर्मित बॉक्सप्लॉट को देखकर तिरछाता कैसे तय करें: 340, 300, 520, 340, 320, 290, 260, 330 एक पुस्तक में कहा गया है, "यदि निचली चतुर्थक ऊपरी चतुर्थक की तुलना में माध्यिका से बहुत दूर है, तो वितरण नकारात्मक रूप से तिरछा होता है।" कई अन्य स्रोतों ने …

2
बूटस्ट्रैपिंग - क्या मुझे पहले आउटलेर्स को हटाने की आवश्यकता है?
हमने एक नई उत्पाद सुविधा का विभाजन परीक्षण चलाया है और यह मापना चाहते हैं कि राजस्व का उत्थान महत्वपूर्ण है या नहीं। हमारी टिप्पणियों को निश्चित रूप से वितरित नहीं किया जाता है (हमारे अधिकांश उपयोगकर्ता खर्च नहीं करते हैं, और जो ऐसा करते हैं, उनके भीतर यह बहुत …

2
डमी सुविधाओं के साथ विसंगति का पता लगाने (और अन्य असतत / श्रेणीबद्ध विशेषताएं)
tl; डॉ discreteविसंगति का पता लगाने के दौरान डेटा से निपटने के लिए अनुशंसित तरीका क्या है ? categoricalविसंगति का पता लगाने के दौरान डेटा से निपटने के लिए अनुशंसित तरीका क्या है ? यह उत्तर केवल परिणामों को फ़िल्टर करने के लिए असतत डेटा का उपयोग करने का सुझाव …

4
बॉक्स और व्हिस्कर प्लॉट की रूपरेखा क्या है?
एक बॉक्स और व्हिस्कर प्लॉट के लिए एक की मानक परिभाषा की सीमा के बाहर के बिंदु हैं , जहां और पहला चतुर्थक और डेटा की तीसरी चतुर्थांश है।{Q1−1.5IQR,Q3+1.5IQR}{Q1−1.5IQR,Q3+1.5IQR}\left\{Q1-1.5IQR,Q3+1.5IQR\right\}IQR=Q3−Q1IQR=Q3−Q1IQR= Q3-Q1Q1Q1Q1Q3Q3Q3 इस परिभाषा का आधार क्या है? बड़ी संख्या में अंकों के साथ, यहां तक ​​कि एक पूरी तरह से सामान्य …

1
क्या हम आउटलेर्स को प्रकट करने के लिए एक बाहर का मतलब और मानक विचलन का उपयोग कर सकते हैं?
मान लीजिए कि मैंने सामान्य रूप से डेटा वितरित किया है। डेटा के प्रत्येक तत्व के लिए मैं यह जांचना चाहता हूं कि यह कितने एसडी से मतलब से दूर है। डेटा में एक बहिर्वाह हो सकता है (केवल एक ही हो सकता है, लेकिन यह भी दो या तीन …

3
चरम बहिर्वाह के साथ बॉक्स प्लॉट कैसे प्रस्तुत करें?
मैं कुछ डेटा प्रस्तुत करने के बारे में कुछ मार्गदर्शन का उपयोग कर सकता हूं। यह पहला कथानक साइटोकाइन IL-10 के लिए केस-कंट्रोल तुलना है। मैंने डेटा का 99% शामिल करने के लिए मैन्युअल रूप से y अक्ष निर्धारित किया है। मैंने इसे मैन्युअल रूप से सेट करने का कारण …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.